Korelasi
Multigroup Structural Equation Modeling: Bagian 2️⃣
2026-04-09
Outline
- Jenis-jenis koefisien korelasi
- Faktor-faktor yang membuat koefisien korelasi bervariasi
- Koreksi atenuasi dan measurement error
- Variance-covariance dan correlation matrix
- WARNING! Covariance/correlation matrix is not positive definite
- Heywood dan ultra-Heywood case
- Bivariat, part, dan partial correlation
- Metrik variabel (standardized vs unstandardized)
Mengapa memulai dari korelasi?
Mengapa memulai dari korelasi?
- SEM merupakan teknik yang digunakan untuk mengestimasi korelasi antar-variabel
- Untuk melakukan SEM, peneliti tidak harus menginput data kasar (raw data), tetapi ada pilihan untuk menginput correlation atau matriks variance-covariance.
- Kalaupun yang tersedia adalah raw data, maka software akan membuat matriks variance-covariance sebelum mengestimasi parameter model.
Jenis-jenis korelasi
| Pearson’s product moment |
Kedua variabel setidaknya interval |
| Spearman’s rank dan Kendall’s tau |
Kedua variabel ordinal |
| Phi, contingency table |
Kedua variabel nominal |
| Point biserial |
Variabel interval dengan nominal |
| Gamma, rank biserial |
Variabel ordinal dengan nominal |
| Biserial |
Variabel interval dengan dummy |
| Polyserial |
Variabel interval dengan variabel underlying continuity |
| Tetrachoric |
Kedua variabel dummy (dikotomis) |
| Polychoric |
Kedua variabel ordinal (dengan kontinuitas implisit) |
Faktor-faktor yang mempengaruhi arah dan magnitude korelasi 1️⃣
- Level pengukuran (apakah variabel tersebut nominal, ordinal, interval, atau rasio)
- Sehingga berdampak pada variabilitas (restriction range) dan normalitas data
- Linearitas
- Semua teknik korelasi mengasumsikan korelasi antar-variabel linier, sehingga korelasi yang tidak linier akan memberikan informasi tidak adanya korelasi (padahal tidak selalu).
- Adanya data outlier
- Koreksi atenuasi
Faktor-faktor yang mempengaruhi arah dan magnitude korelasi 2️⃣
- Jumlah sampel
- Jumlah sampel yang terlalu sedikit akan memberikan estimasi yang kurang akurat (karena standard errornya besar)
- Sampling variance
- Yang kemudian berefek pada confidence interval, effect size, dan statistical power
- Missing data
- Kalau data tidak lengkap, estimasi koefisien korelasi akan langsung terdampak.
- Ada beberapa pilihan: listwise deletion, pairwise deletion, dan data imputation.
- Listwise deletion tidak disarankan karena membuat jumlah sampel turun drastis mengurangi statistical power.
Variance-covariance dan correlation matrix 1️⃣
- Untuk melakukan SEM, maka perangkat lunak membutuhkan variance-covariance matrix untuk mengestimasi parameter model
- Pada bagian diagonal variance-covariance matrix menunjukkan varians, sedangkan sisanya adalah covariance
![]()
- Jumlah nilai unik (non-redundant information) dalam variance-covariance matrix adalah p(p+1)/2
- dimana p adalah jumlah observed variable
- Sehingga dengan contoh di atas maka jumlah nilai unik adalah 3(3+1)/2=6, yaitu 3 varians (diagonal) dan 3 covariance (sisanya)
Variance-covariance dan correlation matrix 2️⃣
Sebagian besar perangkat lunak SEM menggunakan variance-covariance matrix bukan correlation matrix
- Ingat❗ korelasi pada dasarnya adalah standardized covariance.
Menggunakan correlation matrix biasanya lebih sering menghasilkan parameter yang statistically significant tapi standard error yang tidak akurat.
Oleh karena itu, meskipun user menginput correlation matrix, maka perangkat lunak akan mengubahnya dulu menjadi variance-covariance matrix, baru parameter model dapat diestimasi.
Koreksi Atenuasi
Asumsi dasar dalam Psikometri adalah skor kasar (observed score) mengandung skor murni (true score) dan measurement error, sehingga dalam mengestimasi korelasi, measurement error perlu dibuang agar estimasi lebih akurat.
Dengan teknik koreksi atenuasi, kita dapat ‘membuang’ measurement error, sehingga kita dapat mengestimasi korelasi antar-variabel menggunakan true score-nya.
Tetapi apabila reliabilitas skala kita kurang baik, maka setelah dikoreksi koefisien korelasi bisa lebih dari 1 ❗
Misalnya diketahui bahwa korelasi observed scores antar dua variabel (rab) adalah 0.9 dan reliabilitas skala a (Cronbach’s α) adalah 0.6 dan skala b adalah 0.7, maka:
WARNING! Covariance/correlation matrix is not positive definite
- Apa yang terjadi?
- Perangkat lunak akan menghentikan proses estimasi dan memberikan pesan non-positive definite
Matrik korelasi dengan non-positive definite
- Koefisien korelasi yang nilainya ≥1 menyebabkan matriks korelasi menjadi non-positive definite
- Artinya, parameter model tidak mungkin diestimasi
- Mengapa terjadi?
- Data didapatkan dari observasi yang tidak independen (linear dependency)
- Terjadi multikolinearitas
- Jumlah sampel lebih sedikit dari jumlah variabel yang diuji dalam model
- Sepasang variabel berbagi varians negatif atau tidak sama sekali (0) Heywood case
- Varians, kovarians, dan korelasi nilainya diluar batas kewajaran
- Kesalahan mengatur pembatasan (constraint) pada parameter tertentu
Heywood dan ultra-Heywood case
- Terjadi ketika communalities = 1 (Heywood) atau ≥1 (ultra-Heywood), atau terjadi ketika varians measurement error bernilai negatif
- Communalities adalah kuadrat dari koefisien korelasi (R2)
- Apabila terjadi, maka ada yang salah dengan spesifikasi model (hipotesis)
- Terjadi karena
- Common factor terlalu banyak/terlalu sedikit
- Ukuran sampel tidak memadai
- Model SEM bukan model yang cocok untuk menguji hipotesis (alternatifnya Principal Component Analysis)
- Yang bisa dilakukan
- Tinjau kembali hipotesis modelnya
- Kurangi jumlah faktor laten dengan ‘membuang’ jalur/korelasi yang bermasalah
- Identifikasi variabel yang terlibat multikolinearitas
Korelasi Bivariat: Part dan partial correlation
Metrik variabel (standardized vs unstandardized)
- Unstandardized solution/estimates
- Dapat dibandingkan antar kelompok sampel
- Merupakan parameter yang digunakan oleh perangkat lunak untuk menghitung standard error dan taraf signifikansi (p-value)
- Membandingkan unstandardised factor loading harus melihat standard errornya juga
- Standardized solution/estimates
- Hanya interpretable untuk kelompok sampel yang diuji — tidak bisa dibandingkan dengan kelompok sampel yang lain.
- Berguna untuk membandingkan factor loading antar-variabel di dalam model
- Apabila variabel dalam model memiliki unit pengukuran yang berbeda, maka standardized estimates akan sangat membantu
- Ada banyak perbedaan pendapat mengenai metrik mana yang harus dilaporkan, tetapi…
- Selalu laporkan unstandardized solution/estimates dan standard errornya
TUGAS 1: Membuat correlation matrix dan melakukan koreksi atenuasi
Demonstrasi
Menggunakan Dataset Contoh Korelasi
[Dataset] [Matriks di Excel]
Latihan mandiri 1️⃣: Koreksi Atenuasi
- Apabila diketahui reliabilitas skala masing-masing dimensi Big 5 (neu=0.78, con=0.76, agr=0.34, ext=0.45, op=0.67), buatkan matriks korelasi antar-dimensi
- Lakukan koreksi atenuasi
- Apakah matriksnya non-positive definite? Variabel apa saja yang terlibat?
- Apa kira-kira yang menyebabkan kedua variabel tsb korelasinya non-positive definite?
[Unduh Dataset]
Ada pertanyaan❓