Dasar-Dasar Structural Equation Modeling (SEM)

Multigroup Structural Equation Modeling: Bagian 5️⃣

2026-04-09

Outline

  • Dasar-Dasar SEM: Model struktural & pengukuran
  • Tahapan modeling dengan menggunakan SEM
  • Degree of freedom
  • Underidentified, just-identified, dan overidentified model
  • Jenis-jenis kriteria untuk menilai ketepatan model (model fit)
  • Menguji hipotesis (statistical power, ukuran sampel)
  • Membandingkan pendekatan dua-langkah vs empat-langkah
  • Menuliskan hasil analisis SEM dalam laporan penelitian

Pengantar SEM

  • SEM adalah full model menggabungkan model pengukuran dengan model jalur/struktural

  • Ada beberapa pendekatan dalam SEM

    • Strictly confirmatory untuk menguji apakah variance-covariance matrix yang dihipotesiskan (implied) sama dengan/didukung oleh data (observed variance-covariance matrix)

    • Alternative model membuat model alternatif dari dataset yang sama, sehingga kemungkinan struktur datanya berjenjang (nested) multigroup CFA/SEM

    • Model generating dilakukan ketika peneliti sudah punya hipotesis model, namun melakukan modifikasi untuk meningkatkan fit statistics specification search

Langkah-langkah melakukan analisis SEM

  • Spesifikasi model

  • Identifikasi model

  • Estimasi model

  • Menguji model

  • Memodifikasi model

Spesifikasi model

  • Peneliti menyusun model pengukuran dan model jalur dengan menggambar diagram jalur path diagram

  • Dalam SEM, justifikasi teori adalah suatu yang tidak bisa ditawar-tawar karena tanpa basis teori yang kuat, model testing akan selalu memberikan hasil yang mengecewakan (poor fit)

  • Sebelum melakukan SEM, peneliti sangat disarankan melakukan preliminary study, atau setidaknya systematic review yang dapat membantu peneliti menyusun hipotesis model yang baik

Identifikasi model

  • Model dapat diidentifikasi apabila degree of freedom (df) ≥ 0

  • Apabila df = 0, maka model tsb adalah saturated model atau just-identified model

    • Jumlah ‘informasi yang diketahui’ dan ‘tidak diketahui’ sama persis
    • Tidak bisa difalsifikasi, hampir ‘selalu tepat’, tetapi ‘selalu salah’
  • Apabila df bernilai negatif, maka model tsb under-identified karena jumlah parameter jalur yang harus diestimasi lebih banyak daripada jumlah parameter di variance-covariance matrix

    • Lebih banyak ‘informasi yang tidak diketahui’ daripada yang ‘diketahui’
    • Model ‘misterius’ 😄
  • Model yang dapat diidentifikasi adalah over-identified model dimana jumlah parameter variance-covariance matrix lebih banyak daripada jumlah parameter jalur yang diestimasi (sehingga df ≥ 1)

    • Lebih banyak ‘informasi yang diketahui’ daripada yang ‘tidak diketahui’
  • Degree of freedom dihitung dengan mengurangi jumlah nilai unik (non-redundant information) dalam variance-covariance matrix dengan jumlah parameter jalur yang hendak diestimasi

Over-identified model

  • Pada model ini jumlah nilai unik (non-redundant information) dalam variance-covariance matrix = 5(5+1)/2 = 15

  • Sedangkan jumlah parameter jalur yang akan diestimasi adalah 11 (5 factor loading, 6 error variance), sehingga

  • df = 15-11 = 4 🥇

  • Model dapat diidentifikasi karena memenuhi syarat (over-identified)

Under-identified model

  • Pada model ini jumlah nilai unik (non-redundant information) dalam variance-covariance matrix = 3(3+1)/2 = 6

  • Sedangkan jumlah parameter jalur yang akan diestimasi adalah 7 (3 factor loading, 4 error variance), sehingga

  • df = 6-7 = -1 😢

  • Model tidak dapat diidentifikasi karena tidak memenuhi syarat (under-identified)

Just-identified model

  • Pada model ini jumlah nilai unik (non-redundant information) dalam variance-covariance matrix = 2(2+1)/2 = 3

  • Sedangkan jumlah parameter jalur yang akan diestimasi adalah 3 (3 factor loading, 3 error variance), sehingga

  • df = 6-6 = 0 😢

  • Model tidak dapat diidentifikasi karena tidak ada ruang tersisa untuk melakukan estimasi (just-identified/saturated model)

Kesimpulan 🏫

  • Untuk satu faktor/variabel laten, kita perlu sedikitnya 4 variabel indikator karena apabila ≤3, maka model akan just-identified atau under-identified

  • Tapi meskipun kita punya 4 variabel indikator untuk 1 variabel laten, kita masih mungkin memiliki model yang just-identified, ketika errornya berkorelasi

  • Apakah bisa 1 variabel laten diukur oleh 1 observed variable?

Variabel laten dengan 1 indikator

  • Masih bisa diestimasi dengan asumsi

    • Item diasumsikan memiliki reliabilitas sempurna, sehingga varians error diconstraint = 0
    • Reliabilitas diukur dengan test-retest, kemudian varians error diconstraint dengan mempertimbangkan reliabilitas dan standar deviasi

Mengestimasi & Menguji model

  • Pilih metode estimasi yang paling cocok dengan karakteristik data (ML, ULS, GLS, WLS, DWLS atau robust DWLS)

  • Metode estimasi ini yang akan menghitung standard error, apabila metode estimasi yang dipilih tidak tepat dan tidak sesuai dengan kompatibilitas datanya, maka estimasi standard error menjadi bias model memberikan informasi yang menyesatkan

Menguji ketepatan model

  • Umumnya peneliti ingin mendapatkan 3 informasi
    • Chi-square sebagai global fit measure. Chi-square menguji perbedaan antara model-implied dengan sample covariance matrix. Apabila p-value dari Chi-square ≥ α (dengan α=0.05), maka tidak ada perbedaan antara keduanya data mendukung model

    • p-value dari factor loading untuk setiap variabel dalam model.

    • Besar dan arah factor loading. Besar factor loading memberikan informasi mengenai magnitude dan kontribusi variabel tersebut dalam menjelaskan variabel lainnya. Sedangkan arah factor loading (positif/negatif) memberikan informasi mengenai arah hubungan

Menguji ketepatan model: Chi-square (X2)

  • Dihitung dengan cara membandingkan saturated model dengan model tanpa jalur sama sekali (baseline, null, atau independent model)

  • Selain X2, kita bisa menggunakan alternative fit indices yang terdiri dari

    • Incremental index
    • Parsimony index
    • Absolute (standalone) index

Incremental (comparative/relative) index

  • Didapatkan dengan membandingkan implied model dengan baseline model, meliputi
    • Comparative Fit Index mendekati 1 = closer fit

    • Normed Fit Index mendekati 1 = better fit

    • Parsimonious Normed Fit Index NFI yang mempertimbangkan parsimony model, mendekati 1 = better fit

    • Incremental Fit Index/Bollen’s Nonnormed Fit Index mendekati 1 = better fit

    • Tucker Lewis Index/Bentler-Bonnet Non-Normed Fit Index mendekati 1 = better fit

Parsimony index

  • Indeks ini secara khusus memberikan pinalti pada kompleksitas model

  • Indeks-indeksnya meliputi

    • Expected Cross Validation Index digunakan untuk membandingkan dua model atau lebih. Nilai yang lebih kecil menunjukkan model yang lebih baik
    • Information-Theoretic Criterion meliputi AIC, BIC, dan SABIC. Nilai yang kecil menunjukkan model yang lebih baik
    • Noncentrality Parameter-based Index mendekati 1 = better fit
    • McDonald’s Noncentrality Index mendekati 1 = better fit
  • Yang paling sering digunakan adalah

  • Root Mean Square Error of Approximation (RMSEA) Model close fit ketika nilainya 0.05 - 0.08

    • P-value dapat digunakan untuk menolak H0: RMSEA = 0.05
    • Oleh karena itu, menolak H0 menunjukkan bahwa model “close-fitting

Absolute index

  • Indeks ini dihitung tanpa melakukan perbandingan dengan baseline

  • Meliputi

    • Chi-square (X2)/df ratio
    • Goodness of Fit Index mendekati 1 = better fit
    • Adjusted Goodness of Fit Index merupakan parsimony adjustment dari GFI, mendekati 1 = better fit
    • Parsimony Goodness of Fit Index mendekati 1 = better fit
    • Hoelter’s Critical n nilainya sebaiknya > 200
    • Standardized Root Mean Square Residual (SRMR/RMR) nilai < 0.05 menunjukkan good fit

Parameter fit

  • Parameter jalur bisa ditolak meskipun hasil omnibus test memuaskan, sehingga menginterpretasi koefisien jalur adalah proses yang juga harus dilakukan.

  • Berikut ini adalah beberapa prosedur yang direkomendasikan:

    • Lihat tanda factor loading, apakah arahnya sudah benar (negatif/positif)

    • Lihat standardised parameter estimates untuk tahu apakah ada factor loading yang nilainya diatas kewajaran

    • Lihat p-value untuk mempertimbangkan menolak H0

    • Lakukan pengujian measurement invariance dengan mengasumsikan beberapa factor loading sama di berbagai kelompok yang berbeda

    • Apabila error variance mendekati nol, hal tsb lebih mungkin disebabkan oleh adanya outlier, kurangnya jumlah sampel, atau kurangnya jumlah indikator

Statistical power

  • Statistical power dalam pengujian hipotesis dalam SEM peluang mempertahankan H0 apabila H0 benar
    • Peluang peneliti secara tepat menyimpulkan bahwa tidak ada perbedaan antara implied model dengan observed model ketika memang benar-benar tidak ada perbedaan diantara keduanya
  • Statistical power ditentukan oleh
    • true population model (yang kita tidak mungkin tahu)
    • probabilitas melakukan kesalahan tipe 1 (α)
    • degree of freedom model
    • jumlah sampel

Mengestimasi jumlah sampel dengan semTools

semTools::findRMSEAsamplesize(
  rmsea0 = 0.05,
  rmseaA = 0.08,
  df = 4,
  power = 0.90,
  alpha = 0.05
)

Dua vs empat langkah

  • Dua langkah menyusun model (Anderson & Gerbing, 1988)
    • Measurement model
    • Structural model
  • Empat langkah menyusun model (Mulaik & Millsap, 2000)
    • Menspesifikasikan model pengukuran yang unrestricted dengan melakukan EFA untuk mengidentifikasi jumlah faktor
    • Spesifikasikan model CFA yang menguji model pengukuran sebuah konstruk laten pada kelompok sampel yang berbeda
    • Spesifikasikan hubungan antar-variabel laten di dalam model (model struktural)
    • Tentukan parameter acceptable fit untuk model struktural, misalnya CFI > .95 dan RMSEA < 0.05

JARS APA: Apa saja yang harus dilaporkan?

  • Abstrak
    • Laporkan setidaknya 2 global fit statistics (X2 [df, p-value], RMSEA/GFI/AGFI/TLI, BIC, AIC, dll)
  • Metode
    • Deskripsikan variabel endogen dan eksogennya
    • Berikan penjelasan, untuk setiap instrumen/variabel, apakah indikator atau total skor diperoleh dari item yang homogen (item parceling)
    • Berikan penjelasan bagaimana skala/instrumen disusun, laporkan properti psikometriknya, serta penjelasan mengenai level pengukuran
    • Laporkan bagaimana cara peneliti menentukan jumlah sampel (misalnya, dengan rule of thumb, a priori power analysis atau simulasi Monte Carlo)

JARS APA

  • Hasil penelitian

    • Data diagnostics % data missing, distribusi data missing di semua variabel

    • Missingness apabila ada data missing, maka peneliti harus menganalisis apakah data missingnya MCAR, MAR atau MNAR, kemudian bagaimana cara peneliti menangani data missing

    • Distribusi data data normal/non-normal? Laporkan multivariate normality (Mardia’s coefficient)

    • Data summary summary statistics yang bisa digunakan orang lain untuk melakukan replikasi, bisa variance-covariance atau correlation matrix

JARS APA

  • Spesifikasi model

    • Jelaskan apakah model strictly confirmatory, comparison, atau model generation

    • Buat diagram jalur. Bedakan antara variabel constrained, fixed/free, observed dan latent variables

    • Kalau model yang diuji adalah bagian dari model yang lebih besar, jelaskan rasionalisasinya

    • Kalau ada residual correlation pada error, interaction effect atau nonindependence, jelaskan rasionalisasinya

    • Kalau membandingkan model, jelaskan parameter yang akan digunakan untuk membandingkan

JARS APA

  • Estimasi
    • Jelaskan software dan versi yang digunakan, dan jelaskan metode estimasi yang digunakan

    • Jelaskan default criteria di software yang digunakan

  • Model fit
    • Laporkan omnibus (global) fit statisticsnya dan diinterpretasikan artinya.

    • Laporkan local fit dan indicator estimates (factor loading)

    • Kalau membandingkan antara dua model, jelaskan parameter yang digunakan

  • Respesifikasi
    • Jelaskan prosedur modifikasi model
    • Jelaskan rasionalisasi teorinya ketika peneliti melakukan modifikasi dan bandingkan dengan model yang sebelumnya

Demonstrasi SEM

Latihan mandiri 5️⃣: Membuat dan melaporkan SEM

  • Unduh Dataset Latihan SEM

  • Unduh Kamus Data disini

  • Silahkan buat hipotesisnya, lalu spesifikasi model SEM dari variabel yang tersedia di dataset. Satu model sedikitnya mengandung 2 variabel laten.

Ada pertanyaan❓

Note