Korelasi

Multigroup Structural Equation Modeling: Bagian 2️⃣

Rizqy Amelia Zein

2026-06-25

Outline

SEM merupakan teknik yang digunakan untuk mengestimasi korelasi antar-variabel
Untuk melakukan SEM, peneliti tidak harus menginput data kasar (raw data), tetapi ada pilihan untuk menginput correlation atau matriks variance-covariance.
Kalaupun yang tersedia adalah raw data, maka software akan membuat matriks variance-covariance sebelum mengestimasi parameter model.

Koefisien Korelasi	Level Pengukuran
Pearson’s product moment	Kedua variabel setidaknya interval
Spearman’s rank dan Kendall’s tau	Kedua variabel ordinal
Phi, contingency table	Kedua variabel nominal
Point biserial	Variabel interval dengan nominal
Gamma, rank biserial	Variabel ordinal dengan nominal
Biserial	Variabel interval dengan dummy

Koefisien Korelasi	Level Pengukuran
Polyserial	Variabel interval dengan variabel underlying continuity
Tetrachoric	Kedua variabel dummy (dikotomis)
Polychoric	Kedua variabel ordinal (dengan kontinuitas implisit)

Level pengukuran (apakah variabel tersebut nominal, ordinal, interval, atau rasio)
- Sehingga berdampak pada variabilitas (restriction range) dan normalitas data
Linearitas
- Semua teknik korelasi mengasumsikan korelasi antar-variabel linier, sehingga korelasi yang tidak linier akan memberikan informasi tidak adanya korelasi (padahal tidak selalu).
Adanya data outlier adanya data yang outlier membuat estimasi korelasi menjadi inflated.
Koreksi atenuasi akan dibahas di bagian selanjutnya.

Jumlah sampel
- Jumlah sampel yang terlalu sedikit akan memberikan estimasi yang kurang akurat (karena standard errornya besar)
Sampling variance
- Yang kemudian berefek pada confidence interval, effect size, dan statistical power
Missing data
- Kalau data tidak lengkap, estimasi koefisien korelasi akan langsung terdampak.
- Ada beberapa pilihan: listwise deletion, pairwise deletion, dan data imputation.
- Listwise deletion tidak disarankan karena membuat jumlah sampel turun drastis mengurangi statistical power.

Silahkan unduh dan buka Dataset Contoh Korelasi, untuk melihat contoh.

Untuk melakukan SEM, maka perangkat lunak membutuhkan variance-covariance matrix untuk mengestimasi parameter model
Pada bagian diagonal variance-covariance matrix menunjukkan varians, sedangkan sisanya adalah covariance

Jumlah nilai unik (non-redundant information) dalam variance-covariance matrix adalah p(p+1)/2
- dimana p adalah jumlah observed variable
- Sehingga dengan contoh di atas maka jumlah nilai unik adalah 3(3+1)/2=6, yaitu 3 varians (diagonal) dan 3 covariance (sisanya)

Sebagian besar perangkat lunak SEM menggunakan variance-covariance matrix bukan correlation matrix
- Ingat❗ korelasi pada dasarnya adalah standardized covariance.
TETAPI, menggunakan correlation matrix sebagai input SEM biasanya lebih sering menghasilkan parameter yang statistically significant tapi standard error-nya tidak akurat.
Oleh karena itu, meskipun user menginput correlation matrix, maka perangkat lunak akan mengubahnya dulu menjadi variance-covariance matrix, baru parameter model dapat diestimasi.

Asumsi dasar dalam Psikometri adalah skor kasar (observed score) mengandung skor murni (true score) dan measurement error, sehingga dalam mengestimasi korelasi, measurement error perlu “dikontrol secara statistik” agar estimasi korelasi lebih akurat.
Dengan teknik koreksi atenuasi, kita dapat ‘mengontrol’ measurement error, sehingga kita dapat mengestimasi korelasi antar-variabel menggunakan true score-nya.
Tetapi apabila reliabilitas skala kita kurang baik, maka setelah dikoreksi koefisien korelasi bisa lebih dari 1 ❗
Misalnya diketahui bahwa korelasi observed scores antar dua variabel (r_ab) adalah 0.9 dan reliabilitas skala a (Cronbach’s α) adalah 0.6 dan skala b adalah 0.7, maka:

Apa yang terjadi?
Perangkat lunak akan menghentikan proses estimasi dan memberikan pesan non-positive definite

Koefisien korelasi yang nilainya ≥1 menyebabkan matriks korelasi menjadi non-positive definite
- Artinya, parameter model tidak mungkin diestimasi
Mengapa terjadi?
- Data didapatkan dari observasi yang tidak independen (linear dependency)
- Terjadi multikolinearitas
- Jumlah sampel lebih sedikit dari jumlah variabel yang diuji dalam model
- Sepasang variabel berbagi varians negatif atau tidak sama sekali (0) Heywood case
- Varians, kovarians, dan korelasi nilainya diluar batas kewajaran
- Kesalahan mengatur pembatasan (constraint) pada parameter tertentu

Terjadi ketika communalities = 1 (Heywood) atau ≥1 (ultra-Heywood), atau terjadi ketika varians measurement error bernilai negatif
- Communalities adalah kuadrat dari koefisien korelasi (R²)
- Apabila terjadi, maka ada yang salah dengan spesifikasi model (hipotesis)
Terjadi karena
- Common factor terlalu banyak/terlalu sedikit
- Ukuran sampel tidak memadai
- Model SEM bukan model yang cocok untuk menguji hipotesis (alternatifnya Principal Component Analysis)
Yang bisa dilakukan
- Tinjau kembali hipotesis modelnya
- Kurangi jumlah faktor laten dengan ‘membuang’ jalur/korelasi yang bermasalah
- Identifikasi variabel yang terlibat multikolinearitas

Unstandardized solution/estimates
- Dapat dibandingkan antar kelompok sampel
- Merupakan parameter yang digunakan oleh perangkat lunak untuk menghitung standard error dan taraf signifikansi (p-value)
- Membandingkan unstandardized factor loading harus melihat standard errornya juga
Standardized solution/estimates
- Hanya interpretable untuk kelompok sampel yang diuji — tidak bisa dibandingkan dengan kelompok sampel yang lain.
- Berguna untuk membandingkan factor loading antar-variabel di dalam model
- Apabila variabel dalam model memiliki unit pengukuran yang berbeda, maka standardized estimates akan sangat membantu
Ada banyak perbedaan pendapat mengenai parameter mana yang harus dilaporkan, tetapi…
- Selalu laporkan unstandardized solution/estimates dan standard errornya

Apabila diketahui reliabilitas skala masing-masing dimensi Big 5 (neu=0.78, con=0.76, agr=0.34, ext=0.45, op=0.67), buatkan matriks korelasi antar-dimensi
Lakukan koreksi atenuasi
Apakah matriksnya non-positive definite? Variabel apa saja yang terlibat?
Apa kira-kira yang menyebabkan kedua variabel tsb korelasinya non-positive definite?

Note

Paparan disusun dengan menggunakan dan Quarto dengan template dari UNAIR Theme.
Kontak saya via amelia.zein@psikologi.unair.ac.id