Multigroup Structural Equation Modeling: Bagian 5️⃣
2026-05-09
SEM adalah full model menggabungkan model pengukuran dengan model jalur/struktural
Ada beberapa pendekatan dalam SEM (Jöreskog, 1993)
Strictly confirmatory menguji apakah variance-covariance matrix yang dihipotesiskan (implied) sama dengan/didukung oleh data (observed variance-covariance matrix)
Alternative model menguji beberapa model yang saling bersaing (competing models) pada dataset yang sama, kemudian memilih yang paling baik menggambarkan data — model-model tersebut bisa berjenjang (nested) maupun tidak (non-nested)
Model generating dimulai dari model yang dihipotesiskan, kemudian dimodifikasi secara iteratif berdasarkan indikasi data (specification search) hingga fit statistics membaik
Model generating harus dilakukan dengan sangat hati-hati
Setiap modifikasi harus dijustifikasi secara teori, bukan semata-mata didorong oleh data. Pendekatan ini rentan terhadap capitalization on chance. Model yang tampak fit di satu sampel sering kali gagal direplikasi di sampel lain (MacCallum, Roznowski & Necowitz, 1992). Apabila modifikasi dilakukan, validasi hasilnya pada sampel yang berbeda.
Spesifikasi model
Identifikasi model
Estimasi model
Menguji model
Memodifikasi model

Peneliti menyusun model pengukuran dan model jalur dengan menggambar diagram jalur path diagram
Dalam SEM, justifikasi teori adalah suatu yang tidak bisa ditawar-tawar karena tanpa basis teori yang kuat, model testing akan selalu memberikan hasil yang mengecewakan (poor fit)
Sebelum melakukan SEM, peneliti sangat disarankan melakukan pilot study, atau setidaknya meta studies (e.g., systematic review, scoping review, meta analysis, studi replikasi, dsb.) yang dapat membantu peneliti menyusun hipotesis model yang baik
Model dapat diidentifikasi apabila degree of freedom (df) ≥ 0
Apabila df = 0, maka model tsb adalah saturated model atau just-identified model
Apabila df bernilai negatif, maka model tsb under-identified karena jumlah parameter jalur yang harus diestimasi lebih banyak daripada jumlah nilai unik (non-redundant information) di variance-covariance matrix

Pada model ini jumlah nilai unik (non-redundant information) dalam variance-covariance matrix = 5(5+1)/2 = 15
Sedangkan jumlah parameter jalur yang akan diestimasi adalah 11 (5 factor loading, 6 error variance), sehingga
df = 15-11 = 4 🥇
Model dapat diidentifikasi karena memenuhi syarat (over-identified)

Pada model ini jumlah nilai unik (non-redundant information) dalam variance-covariance matrix = 3(3+1)/2 = 6
Sedangkan jumlah parameter jalur yang akan diestimasi adalah 7 (3 factor loading, 4 error variance), sehingga
df = 6-7 = -1 😢
Model tidak dapat diidentifikasi karena tidak memenuhi syarat (under-identified)

Pada model ini jumlah nilai unik (non-redundant information) dalam variance-covariance matrix = 3(3+1)/2 = 6
Sedangkan jumlah parameter jalur yang akan diestimasi adalah 6 (3 factor loading, 3 error variance), sehingga
df = 6-6 = 0 😢
Model tidak dapat diidentifikasi karena tidak ada ruang tersisa untuk melakukan estimasi (just-identified/saturated model)
Untuk satu faktor/variabel laten, kita perlu sedikitnya 4 variabel indikator karena apabila ≤3, maka model akan just-identified atau under-identified
Tapi meskipun kita punya 4 variabel indikator untuk 1 variabel laten, kita masih mungkin memiliki model yang just-identified, ketika errornya berkorelasi
Apakah bisa 1 variabel laten diukur oleh 1 observed variable?
Masih bisa diestimasi dengan asumsi

Pilih metode estimasi yang paling cocok dengan karakteristik data (ML, ULS, GLS, WLS, DWLS atau robust DWLS)
Metode estimasi ini yang akan menghitung standard error yang tepat sesuai dengan karakteristik model
Apabila metode estimasi yang dipilih tidak tepat dan tidak sesuai dengan kompatibilitas datanya, maka estimasi standard error menjadi bias sehingga model parameter memberikan informasi yang menyesatkan
Lihat Beaujean (2014), appendix A untuk perbandingan berbagai macam estimator yang opsinya tersedia di lavaan dan SEMLj
lavaanχ² sebagai global fit measure. χ² menguji perbedaan antara model-implied dengan variance-covariance matrix dari data.
Apabila p-value dari χ² ≥ α (dengan α = 0.05), maka tidak ada perbedaan antara keduanya interpretasinya, data mendukung model
p-value dari factor loading untuk setiap variabel dalam model
Besar dan arah factor loading, yang memberikan informasi mengenai magnitude dan kontribusi variabel tersebut dalam menjelaskan variabel lainnya. Sedangkan arah factor loading (positif/negatif) memberikan informasi mengenai arah hubungan.
Dihitung dengan cara membandingkan model yang dihipotesiskan (implied model) dengan saturated model (model dengan fit sempurna, df = 0, yang mana semua parameter dibebaskan tanpa constraint)
Umumnya, model dengan jumlah sampel yang besar akan memberikan hasil uji χ² yang signifikan, tetapi uji χ² yang signifikan ini tidak boleh diabaikan begitu saja❗
Selain χ², kita bisa mengevaluasi model dengan melihat alternative fit indices: Incremental index, Parsimony index, dan Absolute (standalone) index.

Didapatkan dengan membandingkan implied model dengan baseline model, yang meliputi:
Comparative Fit Index mendekati 1 = closer fit
Normed Fit Index mendekati 1 = better fit
Incremental Fit Index/Bollen’s Nonnormed Fit Index mendekati 1 = better fit
Tucker Lewis Index/Bentler-Bonnet Non-Normed Fit Index mendekati 1 = better fit
Indeks ini secara khusus memberikan pinalti pada kompleksitas model, yang meliputi:
Indeks ini dihitung tanpa melakukan perbandingan dengan baseline, yang meliputi:
RMSEA) merupakan estimasi seberapa besar approximation error per degree of freedom yang diperkirakan terjadi di populasi — close fit ketika nilainya < 0.05, acceptable fit ketika 0.05 – 0.08, poor fit ketika > 0.10
RMSEA ≤ 0.05 (close fit)RMSEA sangat dipengaruhi oleh kompleksitas model dan sample size, dan dapat menunjukkan misfiting bahkan untuk kesalahan spesifikasi yang kecil ketika sampelnya besarSRMR) akar kuadrat dari rata-rata kuadrat selisih antara observed dan model-implied correlation matrix, nilai < 0.08 menunjukkan acceptable fit
SRMR (vs. RMSEA) relatif kurang dipengaruhi oleh sample size dan secara langsung mencerminkan selisih rata-rata antara observed dan model-implied correlation matrixχ²/df ratio
Goodness of Fit Index mendekati 1 = better fit
Adjusted Goodness of Fit Index merupakan parsimony adjustment dari GFI, mendekati 1 = better fit
Hoelter’s Critical n nilainya sebaiknya > 200
Parameter jalur bisa ditolak meskipun hasil omnibus test/global fit memuaskan, sehingga menginterpretasi koefisien jalur adalah proses yang juga harus dilakukan.
Berikut ini adalah beberapa prosedur yang direkomendasikan:
Lihat tanda factor loading, apakah arahnya sudah benar (negatif/positif) dan p-valuenya
Lihat standardized parameter estimates untuk tahu apakah ada factor loading yang nilainya diatas kewajaran
Lakukan pengujian measurement invariance dengan mengasumsikan beberapa factor loading sama di berbagai kelompok yang berbeda akan kita lakukan di Bagian 6
Cek error variance. Apabila error variance mendekati nol, hal tsb lebih mungkin disebabkan oleh adanya outlier, kurangnya jumlah sampel, atau kurangnya jumlah indikator
jamovi bisa menyimpan residual correlation sebagai output yang bisa disimpan - klik Output options covariances and correlations centang ResidualsemTools )
Peringatan
Pendekatan findRMSEAsamplesize dengan semTools di atas menguji kecocokan model secara global, yaitu apakah model kita secara keseluruhan cukup baik merepresentasikan data, dengan membandingkan dua nilai RMSEA (misalnya, 0.05 vs 0.08), tanpa memperhatikan parameter spesifik dalam model.
Demonstrasi power analysis dengan PAMLj
A priori power analysis dengan mempertimbangkan parameter spesifik dalam model dapat dilakukan dengan module PAMLj, yang asalnya menggunakan semPower di . Unduh demonstrasinya di sini.
Seharusnya, tidak.
Pendekatan 4️⃣ langkah idealnya dieksekusi dengan 3️⃣ dataset yang berbeda untuk menghindari capitalization on chance, karena setiap tahap yang melibatkan respesifikasi atau modifikasi akan “menghabiskan” dataset tersebut (MacCallum, Roznowski & Necowitz, 1992).
Langkah 1️⃣ (EFA) dataset pertama: mengeksplorasi struktur faktor secara bebas. Langkah ini penting utamanya ketika model melibatkan konstruk yang belum established bukti empiriknya
Langkah 2️⃣ (CFA) dataset kedua: mengkonfirmasi dan merespesifikasi model pengukuran, memastikan construct validity — hasilnya (df, struktur faktor, indeks fit) menjadi dasar a priori power analysis sebelum pengujian model lengkap
Langkah 3️⃣–4️⃣ (model struktural) dataset ketiga: karena dataset kedua sudah “terpakai” untuk respesifikasi pengukuran, pengujian model struktural (unrestricted lalu restricted) dilakukan pada data yang benar-benar independen
Dalam praktiknya, apabila hanya tersedia satu dataset, peneliti dapat membaginya secara acak menjadi tiga bagian (tiga holdout sample) — meskipun tentu saja ada risiko mengurangi statistical power di setiap tahapannya
Hasil penelitian
Data diagnostics % data missing, distribusi data missing di semua variabel
Missingness apabila ada data missing, maka peneliti harus menganalisis apakah data missingnya MCAR, MAR atau MNAR, kemudian bagaimana cara peneliti menangani data missing
Distribusi data data normal/non-normal? Laporkan multivariate normality (Mardia’s coefficient)
Data summary summary statistics yang bisa digunakan orang lain untuk melakukan replikasi, bisa variance-covariance atau correlation matrix
Spesifikasi model
Jelaskan apakah model strictly confirmatory, comparison, atau model generation
Buat diagram jalur. Bedakan antara variabel constrained, fixed/free, observed dan latent variables
Kalau model yang diuji adalah bagian dari model yang lebih besar, jelaskan rasionalisasinya
Kalau ada residual correlation pada error, interaction effect atau nonindependence, jelaskan rasionalisasinya
Kalau membandingkan model, jelaskan parameter yang akan digunakan untuk membandingkan
Jelaskan software dan versi yang digunakan, dan jelaskan metode estimasi yang digunakan
Jelaskan default criteria di software yang digunakan
Laporkan omnibus (global) fit statisticsnya dan diinterpretasikan artinya.
Laporkan local fit dan indicator estimates (factor loading)
Kalau membandingkan antara dua model, jelaskan parameter yang digunakan
Mari kita lihat contoh penggunaan SEM
Unduh Dataset Latihan SEM
Unduh Kamus Data disini
Silahkan buat hipotesisnya, lalu spesifikasi model SEM dari variabel yang tersedia di dataset. Satu model sedikitnya mengandung 2 variabel laten.
Note