Statistik Dasar dalam Penelitian Psikologi
2026-04-25
Korelasi mengukur seberapa kuat dan ke arah mana dua variabel kontinu bergerak bersama:
Note
Korelasi hanya mengukur hubungan linear. Dua variabel bisa punya korelasi mendekati nol tetapi tetap memiliki hubungan yang kuat secara non-linear (misalnya, kurva U terbalik antara stres dan performa).
Dataset masukangin.omv berisi 1.160 responden dengan variabel:
| Variabel | Keterangan |
|---|---|
| glegekan | Frekuensi glegekan (sendawa berulang) per minggu |
| antangin | Konsumsi jamu antangin per minggu |
| kerokan | Frekuensi kerokan per bulan |
| merah | Tingkat kemerahan kulit setelah kerokan (skala 1–10) |
| usia | Usia responden dalam tahun |
Kita akan menggunakan dataset ini untuk mengeksplorasi hubungan antar variabel yang berkaitan dengan kepercayaan kesehatan tradisional Jawa.
Sebelum menghitung angka korelasi apapun, visualisasikan dulu hubungan antara dua variabel dengan scatterplot:
Yang perlu diperhatikan:
Important
Koefisien korelasi bisa menyesatkan tanpa visualisasi. Seperti Anscombe’s quartet, berbagai pola data yang sangat berbeda bisa menghasilkan nilai r yang identik. Selalu inspeksi scatterplot sebelum menarik kesimpulan.
Buka dataset masukangin.omv, kemudian buat scatterplot untuk pasangan variabel berikut:
Pertanyaan untuk didiskusikan:
Pearson’s r adalah kovarians yang distandardisasi — korelasi yang tidak tergantung pada satuan variabel:
\[r = \frac{\sum_{i=1}^{n}(X_i - \bar{X})(Y_i - \bar{Y})}{(n-1) s_X s_Y} = \frac{\text{Cov}(X,Y)}{s_X \cdot s_Y}\]
Kuadratnya (\(r^2\), disebut coefficient of determination) menunjukkan proporsi varians Y yang dapat dijelaskan oleh X.
| r | r² | Interpretasi | |
|---|---|---|---|
| Positif/Negatif | ±0.10 | ~1% | Sangat lemah |
| Positif/Negatif | ±0.30 | ~9% | Lemah-sedang |
| Positif/Negatif | ±0.50 | ~25% | Sedang |
| Positif/Negatif | ±0.70 | ~49% | Kuat |
| Positif/Negatif | ±0.90 | ~81% | Sangat kuat |
Note
Benchmark ini adalah panduan umum, bukan aturan kaku. Di Psikologi Sosial dan Kepribadian, r = 0.30 bisa sangat bermakna. Di Psikologi Klinis atau Neuropsikologi, r = 0.30 mungkin terlalu kecil untuk punya nilai diagnostik. Interpretasikan selalu dalam konteks bidang dan pertanyaan penelitian.
Hubungan antara glegekan dan merah:
\[r = .629, \quad 95\%\text{ CI} = [.593, .663], \quad p < .001\]
Interpretasi: Terdapat korelasi positif sedang-kuat antara frekuensi glegekan dan tingkat kemerahan kulit setelah kerokan. Responden yang lebih sering glegekan cenderung mendapat kulit yang lebih merah saat kerokan. Sekitar 39.6% variabilitas kemerahan kulit dapat dijelaskan oleh frekuensi glegekan (\(r^2 = .396\)).
Hubungan antara glegekan dan kerokan:
\[r = .390, \quad 95\%\text{ CI} = [.340, .438], \quad p < .001\]
Interpretasi: Korelasi positif lemah-sedang. Responden yang lebih sering glegekan juga lebih sering melakukan kerokan. \(r^2 = .152\) — sekitar 15.2% variabilitas kerokan dapat dijelaskan glegekan.
Hubungan antara kerokan dan merah:
\[r = .082, \quad 95\%\text{ CI} = [.025, .139], \quad p = .005\]
Important
Contoh kasus N besar menghasilkan signifikansi yang menyesatkan
Dengan N = 1.160, korelasi sekecil r = 0.082 sudah signifikan (p = .005). Namun \(r^2\) = 0.0067 — artinya hanya 0.67% variabilitas kemerahan kulit yang dapat dijelaskan oleh frekuensi kerokan. Secara praktis, hubungan ini hampir tidak bermakna.
Ini menegaskan pentingnya melaporkan CI dan effect size, bukan hanya p-value.
Ketika kita punya banyak variabel, matriks korelasi menyajikan semua pasangan korelasi secara ringkas:
\[\begin{pmatrix} 1 & r_{12} & r_{13} \\ r_{21} & 1 & r_{23} \\ r_{31} & r_{32} & 1 \end{pmatrix}\]
Note
Ketika memeriksa banyak korelasi sekaligus, perhatikan masalah multiple comparisons — dengan 10 variabel, kita menguji 45 pasangan korelasi. Secara kebetulan, sekitar 5% dari 45 uji (~2-3 uji) akan signifikan meski tidak ada hubungan sesungguhnya, jika α = 0.05 per uji.
Dengan dataset masukangin.omv, hitung matriks korelasi untuk semua variabel:
Pertanyaan untuk didiskusikan:
Korelasi Spearman menggunakan rank alih-alih nilai asli, sehingga lebih robust untuk:
\[\rho = 1 - \frac{6 \sum d_i^2}{n(n^2-1)}\]
Di mana \(d_i\) adalah selisih rank antara dua variabel untuk observasi ke-\(i\).
Tip
Jika data memenuhi asumsi Pearson (normalitas, linear), gunakan Pearson karena power-nya sedikit lebih tinggi. Jika tidak, Spearman adalah pilihan yang lebih aman. Ketika Pearson dan Spearman memberikan kesimpulan yang berbeda, curigai adanya outlier atau hubungan non-linear.
Dengan dataset masukangin.omv, bandingkan korelasi Pearson dan Spearman:
Pertanyaan untuk didiskusikan:
Untuk korelasi, effect size sudah merupakan koefisien korelasi itu sendiri (r).
Contoh: Alfonso dan hubungan pendapatan-berat badan
Alfonso ingin menguji apakah ada korelasi antara pendapatan dan berat badan dalam populasi dewasa Indonesia. Dari literatur sebelumnya, ia memperkirakan r = 0.4.
Langkah di G*Power (korelasi bivariate):
Hasil: N = 46
Note
Dengan r = 0.4 (efek sedang), hanya butuh 46 responden untuk power 80%. Tapi jika korelasi sesungguhnya ternyata hanya r = 0.2, studi yang sama akan sangat underpowered dan cenderung menghasilkan estimasi yang inflated.
Menemukan korelasi yang kuat antara dua variabel tidak berarti salah satunya menyebabkan yang lain. Ada tiga penjelasan alternatif:
A → B
A menyebabkan B (causal, arah yang kita duga)
B → A
B menyebabkan A (reverse causality)
C → A dan B
Variabel ketiga C menyebabkan keduanya (confounding)
Contoh dari dataset masukangin:
Glegekan berkorelasi dengan kerokan (r = .390). Apakah glegekan menyebabkan kerokan? Atau keduanya disebabkan oleh faktor ketiga seperti keyakinan tentang “angin dalam tubuh”?
Important
Untuk menegakkan kausalitas, kita membutuhkan: (1) korelasi yang konsisten, (2) temporal precedence (A terjadi sebelum B), dan (3) eliminasi penjelasan alternatif. Studi korelasional cross-sectional tidak bisa memenuhi syarat (2) dan (3).
Korelasi bisa muncul dari kebetulan — terutama ketika menguji banyak pasangan variabel tanpa hipotesis yang jelas (data dredging).
Contoh korelasi spurious yang terkenal:
Tip
Praktik yang baik:
Note