Statistik dalam Penelitian Psikologi
2026-05-11

Kecemasan — tidak bisa diobservasi langsung, tetapi bisa diinferensi (i.e., disimpulkan) dari detak jantung cepat, telapak tangan berkeringat, sulit konsentrasi, dan laporan subjektif individu.
Kepribadian (Big 5, five factor model) — Openness, Conscientiousness, Extraversion, Agreeableness, Neuroticism merupakan konstruk laten yang diukur melalui respon terhadap item-item pernyataan dalam skala Likert.
Prestasi belajar — tidak sepenuhnya tercermin dari nilai ujian saja; ada faktor measurement error dalam setiap tes.
Semua konstruk ini disebut variabel laten (latent variable): variabel yang tidak dapat diamati secara langsung, tetapi dapat diinferensi dari variabel lain yang bisa diukur langsung (observed variables).

\[X = T + E\]
Implikasi penting
CTT mengasumsikan bahwa rata-rata error adalah nol (E(e) = 0) dan error tidak berkorelasi dengan skor murni (Cov(T, E) = 0). Artinya, error bersifat stochastic (acak), bukan sistematis.
\[\sigma^2_X = \sigma^2_T + \sigma^2_E\]
\[\rho_{XX'} = \frac{\sigma^2_T}{\sigma^2_X} = \frac{\sigma^2_T}{\sigma^2_T + \sigma^2_E}\]
Berikut ini adalah rule of thumb dalam menginterpretasi koefisien reliabilitas.
| Reliabilitas (α atau ω) | Interpretasi |
|---|---|
| ≥ 0.90 | Sangat tinggi — excellent |
| 0.80 – 0.89 | Tinggi — good |
| 0.70 – 0.79 | Cukup — acceptable |
| 0.60 – 0.69 | Sedang — perlu perbaikan |
| < 0.60 | Rendah — poor |
Persoalannya, kita tidak bisa mengukur T secara langsung, yang kita ukur selalu X (yang sudah “tercemari” oleh error).
Konsekuensinya, ketika kita mengestimasi korelasi antar-variabel, korelasi yang kita hitung sebenarnya adalah korelasi antar observed scores (rₓᵧ), bukan korelasi antar true scores (rᴛₓᴛᵧ).
Ini menyebabkan bias atenuasi: korelasi yang kita estimasi selalu lebih kecil dari korelasi yang sebenarnya:
\[r_{XY} = r_{T_X T_Y} \times \sqrt{\rho_{XX'} \times \rho_{YY'}}\]
Attenuation bias
Semakin rendah reliabilitas alat ukur, semakin besar distorsi (noise) pada estimasi korelasi. Ini berarti measurement error yang tinggi akan membuat kita mengunderestimate kekuatan hubungan antar-variabel yang sesungguhnya.
Contohnya: Misalkan korelasi true scores antara kecemasan dan prokrastinasi adalah 0.60. Tetapi skala kecemasan yang digunakan memiliki reliabilitas 0.70 dan skala prokrastinasi 0.65.
Korelasi yang akan kita temukan di data:
\[r_{XY} = 0.60 \times \sqrt{0.70 \times 0.65} = 0.60 \times 0.674 = \mathbf{0.40}\]
Koreksi atenuasi
Korelasi true scores dapat diestimasi dari korelasi observed scores dengan koreksi atenuasi: \(r_{T_X T_Y} = \frac{r_{XY}}{\sqrt{\rho_{XX'} \times \rho_{YY'}}}\)
| Model | Apa yang dimodelkan | Kelebihan dibanding CTT |
|---|---|---|
| CTT | X = T + E (level item) | Fondasi — sederhana, tapi tidak menguji struktur laten |
| EFA | Struktur faktor laten yang tidak diketahui | Menemukan faktor laten dari suatu dataset (data-driven) |
| CFA | Struktur faktor laten yang sudah dihipotesiskan oleh teori | Menguji validitas konstruk berdasarkan teori |
| SEM | Hubungan antar faktor laten + model pengukuran | Menguji hubungan antara variabel laten sesuai yang dihipotesiskan oleh teori |
Penjelasannya
Keempat model ini membentuk satu kontinum dari yang paling sederhana (CTT) ke yang paling kompleks (SEM). Setiap model yang lebih kompleks mengandung logika model sebelumnya.
CTT bekerja di level item — hanya bisa menghitung reliabilitas dan korelasi item-total.
EFA (Exploratory Factor Analysis) memungkinkan kita untuk menemukan struktur faktor laten dari data. Berguna saat teori belum terlalu matang bukti empirisnya atau sedang dalam tahap eksplorasi.
CFA (Confirmatory Factor Analysis) memungkinkan kita untuk menguji apakah struktur faktor yang dihipotesiskan berdasarkan teori didukung oleh data. Ini adalah uji validitas konstruk yang paling ketat.
SEM menggabungkan model pengukuran (CFA) dengan model struktural (regresi/jalur) untuk menguji hipotesis teoritis yang kompleks sekaligus mengontrol measurement error.
Dalam latent variable modeling, ada dua cara konseptual yang berbeda untuk memahami hubungan antara variabel laten dan indikatornya.
Model reflektif: variabel laten menyebabkan indikator bervariasi.
Model formatif: indikator membentuk/mendefinisikan variabel laten.
Mengapa ini penting?
Mayoritas konstruk psikologi menggunakan model reflektif, misalnya: skala kepribadian, kecemasan, depresi, dll. Menggunakan model formatif untuk konstruk reflektif (atau sebaliknya) adalah kesalahan konseptual yang serius.

Reflektif: panah dari laten ke indikator

Formatif: panah dari indikator ke laten
jamovi — antarmuka grafis (point-and-click), gratis dan open source. Digunakan dalam workshop ini. Module SEMLj menyediakan EFA dan CFA dengan antarmuka yang user-friendly.
JASP — mirip jamovi, antarmuka grafis, gratis. Juga mendukung EFA dan CFA.
lavaan di — package yang paling lengkap dan fleksibel untuk SEM, CFA, EFA. Membutuhkan coding, tetapi memberikan kendali penuh atas spesifikasi model.
semopy di — alternatif di , coding style mirip lavaan.
Mplus — perangkat lunak komersial dengan fitur lebih lengkap (termasuk power analysis dan simulasi), tetapi proprietary (berbayar).
Note