Analisis Data Kategorikal

Statistik Dasar dalam Penelitian Psikologi

2026-05-17

Outline

  • Apa itu data kategorikal?
  • Binomial test
  • Uji χ²
  • Fisher’s exact test
  • McNemar’s test (data berpasangan)
  • Effect size untuk analisis kategorikal

Data kategorikal dalam penelitian psikologi

Apa itu data kategorikal?

Data kategorikal adalah data yang nilainya berupa kategori atau kelas, bukan angka yang sifatnya continuum.

Jenis Definisi Contoh
Nominal Kategori tanpa urutan Jenis kelamin, agama, metode terapi
Ordinal Kategori dengan urutan, tapi jarak tidak sama Tingkat pendidikan, skala Likert
Dikotomi Tepat dua kategori Ya/tidak, lulus/tidak lulus, sembuh/tidak sembuh

Note

Meskipun kita sering mengkodekan kategori dengan angka (0 dan 1, 1 dan 2, dll.), angka tersebut hanyalah label, sehingga operasi aritmatika seperti mean tidak bermakna pada data nominal. Pilih teknik analisis yang sesuai dengan skala pengukuran variabel.

Teknik analisis yang tepat

Data Pertanyaan Teknik
Satu variabel dikotomi Apakah proporsi berbeda dari nilai tertentu? Binomial test
Dua variabel kategorikal, bebas Apakah ada asosiasi antar keduanya? χ²
Dua variabel kategorikal, sampel kecil Apakah ada asosiasi? Fisher’s exact test
Dua variabel dikotomi, berpasangan Apakah ada perubahan proporsi sebelum-sesudah? McNemar’s test

Binomial test

Apa itu binomial test?

Binomial test menguji apakah proporsi yang diamati dalam salah satu kategori berbeda dari proporsi yang diharapkan berdasarkan teori atau nilai referensi.

\[H_0: p = p_0 \quad \text{vs} \quad H_1: p \neq p_0\]

Di mana \(p\) adalah proporsi populasi yang sesungguhnya dan \(p_0\) adalah proporsi yang dihipotesiskan (nilai referensi).

Contoh: Dalam 500 klien yang menjalani terapi CBT, 327 menunjukkan perbaikan signifikan. Apakah tingkat keberhasilan CBT berbeda dari 60% yang dilaporkan literatur internasional?

\[H_0: p = 0.60 \quad \text{vs} \quad H_1: p \neq 0.60\]

Proporsi sampel = 327/500 = 65.4%

Logika binomial test

Binomial test menghitung probabilitas mendapatkan hasil yang kita amati atau yang lebih ekstrem secara tepat (exact), dengan asumsi proporsi populasi yang sebenarnya adalah \(p_0\).

\[P(X \geq k) = \sum_{i=k}^{n} \binom{n}{i} p_0^i (1-p_0)^{n-i}\]

Tip

Untuk sampel besar (ketika \(np_0 \geq 5\) dan \(n(1-p_0) \geq 5\)), binomial test bisa diaproksimasi dengan uji z untuk proporsi. Namun binomial test memberikan hasil yang lebih tepat (exact) dan akurat, terutama untuk sampel kecil atau ketika proporsi mendekati 0 atau 1.

Latihan: Binomial test di jamovi

Buka dataset terapi.omv yang berisi data 500 klien CBT:

  1. Klik menu Frequencies Proportion Test (Binomial)
  2. Masukkan hasil_terapi ke Variable
  3. Di Hypothesis, masukkan nilai referensi 0.60 sebagai proporsi \(H_0\)
  4. Centang Confidence interval untuk proporsi

Pertanyaan untuk didiskusikan:

  • Berapa p-value yang kalian dapatkan? Apakah proporsi sampel secara signifikan berbeda dari 60%?
  • Apa arti CI untuk proporsi yang kalian peroleh?
  • Berapa besar perbedaan antara proporsi sampel (65.4%) dan nilai referensi (60%) — apakah perbedaan ini bermakna secara praktis?

Uji χ²

Uji χ²: hubungan antara dua variabel kategorikal

Uji χ² menguji apakah ada asosiasi antara dua variabel kategorikal — apakah distribusi satu variabel berbeda bergantung pada kategori variabel lainnya.

\[H_0: \text{Tidak ada asosiasi antara variabel A dan variabel B}\] \[H_1: \text{Ada asosiasi antara variabel A dan variabel B}\]

Statistik uji:

\[\chi^2 = \sum \frac{(O - E)^2}{E}\]

Di mana \(O\) adalah frekuensi yang diamati (observed) dan \(E\) adalah frekuensi yang diharapkan (expected) jika tidak ada asosiasi.

\[E_{ij} = \frac{\text{total baris}_i \times \text{total kolom}_j}{N}\]

Contoh: metode belajar dan kelulusan

Apakah metode belajar (belajar sendiri vs kelompok vs online) berhubungan dengan kelulusan tepat waktu?

Lulus tepat waktu Tidak lulus tepat waktu Total
Sendiri 135 45 180
Kelompok 165 30 195
Online 90 60 150
Total 390 135 525

Frekuensi yang diharapkan (misalnya, untuk sel Kelompok × Lulus tepat waktu): \(E = \frac{195 \times 390}{525} = 144.9\)

Syarat penggunaan χ²

χ² membutuhkan frekuensi yang cukup besar agar distribusinya mendekati distribusi \(\chi^2\):

  • Semua sel memiliki frekuensi yang diharapkan ≥ 5 (aturan praktis umum)
  • Untuk tabel 2×2: gunakan Yates’ continuity correction
  • Jika frekuensi yang diharapkan kecil (< 5) → gunakan Fisher’s exact test

Important

χ² hanya mengukur ada/tidaknya asosiasi — bukan arah atau kekuatannya. Selalu laporkan effect size (Cramér’s V) bersama χ² untuk memberikan gambaran yang lengkap.

Latihan: χ² di jamovi

Buka dataset metodebelajar.omv, kemudian uji hubungan antara metode belajar dan kelulusan:

  1. Klik menu Frequencies Contingency Tables
  2. Masukkan metode_belajar ke Rows dan kelulusan ke Columns
  3. Di Statistics, centang χ² dan Cramér’s V
  4. Di Cells, centang Expected counts dan Row, Column, Total percentages

Pertanyaan untuk didiskusikan:

  • Apakah ada sel dengan frekuensi yang diharapkan < 5? Apa implikasinya?
  • Berapa nilai Cramér’s V? Seberapa kuat hubungannya?
  • Kelompok metode belajar mana yang menunjukkan profil kelulusan yang berbeda paling mencolok?

Fisher’s exact test

Kapan menggunakan Fisher’s exact test?

Ketika frekuensi yang diharapkan dalam satu atau lebih sel < 5, χ² tidak dapat diandalkan. Dalam kondisi ini, gunakan Fisher’s exact test:

  • Menghitung probabilitas exact dari distribusi frekuensi yang diamati (atau yang lebih ekstrem), dengan asumsi marginal total (total baris dan kolom) tetap
  • Tepat digunakan untuk semua ukuran sampel, baik kecil maupun besar
  • Paling umum digunakan untuk tabel 2×2

Note

Fisher’s exact test menghitung probabilitas dengan mengasumsikan marginal total (total baris dan kolom) tetap, lalu menjumlahkan peluang semua distribusi sel yang sama ekstrem atau lebih ekstrem dari yang diamati. Karena distribusinya diskrit, p-value yang dihasilkan sering sedikit lebih besar dari χ², sifat konservatif ini paling berdampak pada sampel kecil.

Di jamovi: saat menjalankan Contingency Tables, centang Fisher’s exact test di bagian Statistics — jamovi akan menampilkan hasilnya di samping χ².

Contoh: intervensi kelompok kecil

Seorang konselor sekolah menguji apakah sesi konseling kelompok (N = 20) mengurangi perilaku agresif. Dari 10 siswa yang mendapat konseling, 8 menunjukkan perbaikan. Dari 10 kontrol, hanya 3 yang menunjukkan perbaikan.

Perbaikan Tidak Total
Konseling 8 2 10
Kontrol 3 7 10
Total 11 9 20

Frekuensi yang diharapkan untuk sel kiri atas = (10 × 11)/20 = 5.5 — beberapa sel memiliki nilai diharapkan < 5, sehingga Fisher’s exact test lebih tepat.

McNemar’s test

Asosiasi dalam data berpasangan

Ketika kita mengukur variabel dikotomi yang sama pada kelompok yang sama pada dua titik waktu (sebelum-sesudah), kita tidak bisa menggunakan χ² biasa — observasinya tidak independen.

McNemar’s test dirancang khusus untuk situasi ini.

Contoh: Apakah proporsi mahasiswa yang setuju dengan hukuman fisik berbeda sebelum vs sesudah mengikuti kuliah Psikologi Perkembangan?

Sesudah: Setuju Sesudah: Tidak
Sebelum: Setuju a (tetap setuju) b (berubah dari setuju → tidak)
Sebelum: Tidak c (berubah dari tidak → setuju) d (tetap tidak setuju)

McNemar’s test berfokus pada sel b dan c — partisipan yang berubah pendapat.

Statistik McNemar’s test

\[\chi^2_{\text{McNemar}} = \frac{(b - c)^2}{b + c}\]

Dengan df = 1.

Note

Jika jumlah perubahan kecil (b + c < 25), gunakan versi exact yang menggunakan distribusi binomial alih-alih aproksimasi χ².

Di jamovi:

  1. Frequencies Contingency Tables
  2. Masukkan variabel sebelum dan sesudah
  3. Di Statistics, centang McNemar’s test

Effect size untuk analisis kategorikal

Mengapa effect size penting?

Seperti pada t-test dan ANOVA, signifikansi statistik dari χ² tidak mencerminkan kekuatan asosiasi. Dengan N yang besar, asosiasi yang sangat lemah pun akan signifikan.

Effect size Digunakan untuk Rentang Interpretasi
Cramér’s V χ² (tabel k×m apapun) 0–1 0.10 kecil, 0.30 sedang, 0.50 besar (berlaku langsung untuk tabel 2×2; untuk tabel lebih besar, ambang batas ini adalah panduan kasar — nilainya bergantung pada df = min(baris−1, kolom−1))
Phi (φ) χ² tabel 2×2 saja 0–1 Sama dengan Cramér’s V untuk tabel 2×2
Odds ratio (OR) Asosiasi dalam tabel 2×2 0–∞ OR = 1 → tidak ada asosiasi
Risk ratio (RR) Perbandingan risiko dua kelompok 0–∞ RR = 1 → risiko sama

Tip

Untuk penelitian klinis dan kesehatan mental, odds ratio sering lebih informatif dari Cramér’s V karena memberikan gambaran konkret tentang besaran perbedaan risiko antar kelompok.

Odds ratio: interpretasi intuitif

Odds ratio membandingkan peluang (odds) suatu kejadian antara dua kelompok:

\[OR = \frac{a/b}{c/d} = \frac{ad}{bc}\]

Menggunakan contoh konseling kelompok:

\[OR = \frac{8 \times 7}{2 \times 3} = \frac{56}{6} = 9.33\]

Interpretasi: Siswa yang mendapat konseling punya odds 9.33 kali lebih tinggi untuk menunjukkan perbaikan dibanding siswa kontrol.

Note

Odds ratiorisk ratio. Jika prevalensi outcome rendah (< 10%), keduanya mendekati satu sama lain. Ketika prevalensi tinggi, OR bisa terlihat lebih dramatis dari RR — perhatikan ini saat membaca literatur klinis.

Latihan: analisis kategorikal lengkap di jamovi

Buka dataset attitudinal_change.omv yang berisi data mahasiswa sebelum dan sesudah kuliah Psikologi Perkembangan:

  1. Jalankan McNemar’s test untuk variabel sikap_hukuman_fisik (sebelum vs sesudah)
  2. Hitung χ² untuk asosiasi jurusan × perubahan_sikap
  3. Di Statistics, centang Cramér’s V dan Odds ratio

Pertanyaan untuk didiskusikan:

  • Apakah proporsi mahasiswa yang mendukung hukuman fisik berubah secara signifikan setelah kuliah?
  • Apakah jurusan berhubungan dengan arah perubahan sikap? Seberapa kuat asosiasinya?
  • Kenapa kita tidak bisa menggunakan χ² biasa untuk membandingkan sebelum-sesudah dalam kelompok yang sama?

Ada pertanyaan❓

Note