Statistik Dasar dalam Penelitian Psikologi
2026-05-17
Korelasi mengukur seberapa kuat dan ke arah mana dua variabel kontinu bergerak bersama:
Note
Korelasi hanya mengukur hubungan linear. Dua variabel bisa punya korelasi mendekati nol tetapi tetap memiliki hubungan yang kuat secara non-linear (misalnya, kurva U terbalik antara stres dan performa).
Dataset masukangin.omv berisi 1.160 responden dengan variabel:
| Variabel | Keterangan |
|---|---|
| glegekan | Frekuensi glegekan (sendawa berulang) per minggu |
| antangin | Konsumsi jamu antangin per minggu |
| kerokan | Frekuensi kerokan per bulan |
| merah | Tingkat kemerahan kulit setelah kerokan (skala 1–10) |
| usia | Usia responden dalam tahun |
Kita akan menggunakan dataset ini untuk mengeksplorasi hubungan antar variabel yang berkaitan dengan kepercayaan kesehatan tradisional Jawa.
Sebelum menghitung angka korelasi apapun, visualisasikan dulu hubungan antara dua variabel dengan scatterplot:
Yang perlu diperhatikan:
Important
Koefisien korelasi bisa menyesatkan tanpa visualisasi. Seperti Anscombe’s quartet, berbagai pola data yang sangat berbeda bisa menghasilkan nilai r yang identik. Selalu inspeksi scatterplot sebelum menarik kesimpulan.
Buka dataset masukangin.omv, kemudian buat scatterplot untuk pasangan variabel berikut:
Pertanyaan untuk didiskusikan:
Pearson’s r adalah kovarians yang distandardisasi — korelasi yang tidak tergantung pada satuan variabel:
\[r = \frac{\sum_{i=1}^{n}(X_i - \bar{X})(Y_i - \bar{Y})}{(n-1) s_X s_Y} = \frac{\text{Cov}(X,Y)}{s_X \cdot s_Y}\]
Kuadratnya (\(r^2\), disebut coefficient of determination) menunjukkan proporsi varians Y yang dapat dijelaskan oleh X.
| r | r² | Interpretasi | |
|---|---|---|---|
| Positif/Negatif | ±0.10 | ~1% | Sangat lemah |
| Positif/Negatif | ±0.30 | ~9% | Lemah-sedang |
| Positif/Negatif | ±0.50 | ~25% | Sedang |
| Positif/Negatif | ±0.70 | ~49% | Kuat |
| Positif/Negatif | ±0.90 | ~81% | Sangat kuat |
Note
Benchmark ini adalah panduan umum, bukan aturan kaku. Di Psikologi Sosial dan Kepribadian, r = 0.30 bisa sangat bermakna. Di Psikologi Klinis atau Neuropsikologi, r = 0.30 mungkin terlalu kecil untuk punya nilai diagnostik. Interpretasikan selalu dalam konteks bidang dan pertanyaan penelitian.
Hubungan antara glegekan dan merah:
\[r = .629, \quad 95\%\text{ CI} = [.593, .663], \quad p < .001\]
Interpretasi: Terdapat korelasi positif sedang-kuat antara frekuensi glegekan dan tingkat kemerahan kulit setelah kerokan. Responden yang lebih sering glegekan cenderung mendapat kulit yang lebih merah saat kerokan. Sekitar 39.6% variabilitas kemerahan kulit dapat dijelaskan oleh frekuensi glegekan (\(r^2 = .396\)).
Hubungan antara glegekan dan kerokan:
\[r = .390, \quad 95\%\text{ CI} = [.340, .438], \quad p < .001\]
Interpretasi: Korelasi positif lemah-sedang. Responden yang lebih sering glegekan juga lebih sering melakukan kerokan. \(r^2 = .152\) — sekitar 15.2% variabilitas kerokan dapat dijelaskan glegekan.
Hubungan antara kerokan dan merah:
\[r = .082, \quad 95\%\text{ CI} = [.025, .139], \quad p = .005\]
Important
Contoh kasus N besar menghasilkan signifikansi yang menyesatkan
Dengan N = 1.160, korelasi sekecil r = 0.082 sudah signifikan (p = .005). Namun \(r^2\) = 0.0067 — artinya hanya 0.67% variabilitas kemerahan kulit yang dapat dijelaskan oleh frekuensi kerokan. Secara praktis, hubungan ini hampir tidak bermakna.
Ini menegaskan pentingnya melaporkan CI dan effect size, bukan hanya p-value.
Ketika kita punya banyak variabel, matriks korelasi menyajikan semua pasangan korelasi secara ringkas:
\[\begin{pmatrix} 1 & r_{12} & r_{13} \\ r_{21} & 1 & r_{23} \\ r_{31} & r_{32} & 1 \end{pmatrix}\]
Note
Ketika memeriksa banyak korelasi sekaligus, perhatikan masalah multiple comparisons — dengan 10 variabel, kita menguji 45 pasangan korelasi. Secara kebetulan, sekitar 5% dari 45 uji (~2-3 uji) akan signifikan meski tidak ada hubungan sesungguhnya, jika α = 0.05 per uji.
Dengan dataset masukangin.omv, hitung matriks korelasi untuk semua variabel:
Pertanyaan untuk didiskusikan:
Korelasi Spearman menggunakan rank alih-alih nilai asli, sehingga lebih robust untuk:
\[\rho = 1 - \frac{6 \sum d_i^2}{n(n^2-1)}\]
Di mana \(d_i\) adalah selisih rank antara dua variabel untuk observasi ke-\(i\).
Important
Rumus di atas adalah rumus singkat (shortcut) yang hanya berlaku apabila tidak ada tied ranks (tidak ada dua observasi dengan nilai yang sama). Bila ada data yang nilainya sama (umum pada data ordinal seperti skala Likert), rumus ini memberikan hasil yang kurang tepat. Dalam kondisi tersebut, Spearman’s ρ dihitung sebagai korelasi Pearson yang diterapkan pada data yang sudah dikonversi ke rank — persis seperti yang dilakukan jamovi secara otomatis.
Tip
Jika data memenuhi asumsi Pearson (normalitas, linear), gunakan Pearson karena power-nya sedikit lebih tinggi. Jika tidak, Spearman adalah pilihan yang lebih aman. Ketika Pearson dan Spearman memberikan kesimpulan yang berbeda, curigai adanya outlier atau hubungan non-linear.
Dengan dataset masukangin.omv, bandingkan korelasi Pearson dan Spearman:
Pertanyaan untuk didiskusikan:
Untuk korelasi, effect size sudah merupakan koefisien korelasi itu sendiri (r).
Contoh: Alfonso dan hubungan pendapatan-berat badan
Alfonso ingin menguji apakah ada korelasi antara pendapatan dan berat badan dalam populasi dewasa Indonesia. Dari literatur sebelumnya, ia memperkirakan r = 0.4.
Langkah di G*Power (korelasi bivariate):
Hasil: N = 46
Note
Dengan r = 0.4 (efek sedang), hanya butuh 46 responden untuk power 80%. Tapi jika korelasi sesungguhnya ternyata hanya r = 0.2, studi yang sama akan sangat underpowered dan cenderung menghasilkan estimasi yang inflated.
Menemukan korelasi yang kuat antara dua variabel tidak berarti salah satunya menyebabkan yang lain. Ada tiga penjelasan alternatif:
A → B
A menyebabkan B (causal, arah yang kita duga)
B → A
B menyebabkan A (reverse causality)
C → A dan B
Variabel ketiga C menyebabkan keduanya (confounding)
Contoh dari dataset masukangin:
Glegekan berkorelasi dengan kerokan (r = .390). Apakah glegekan menyebabkan kerokan? Atau keduanya disebabkan oleh faktor ketiga seperti keyakinan tentang “angin dalam tubuh”?
Important
Untuk menegakkan kausalitas, kita membutuhkan: (1) korelasi yang konsisten, (2) temporal precedence (A terjadi sebelum B), dan (3) eliminasi penjelasan alternatif. Studi korelasional cross-sectional tidak bisa memenuhi syarat (2) dan (3).
Korelasi bisa muncul dari kebetulan — terutama ketika menguji banyak pasangan variabel tanpa hipotesis yang jelas (data dredging).
Contoh korelasi spurious yang terkenal:
Tip
Praktik yang baik:
Note