ANOVA

Statistik Dasar dalam Penelitian Psikologi

Rizqy Amelia Zein

Departemen Psikologi, Universitas Airlangga

2026-06-26

Outline

Mengapa ANOVA, bukan t-test berulang?
Logika ANOVA: partisi varians
Rasio F
Implementasi di jamovi
Effect size (η² dan ω²)
Post-hoc tests
Asumsi dan uji asumsi
Merencanakan jumlah sampel

Mengapa ANOVA?

Masalah dengan t-test berulang

Bayangkan kita ingin membandingkan tiga kelompok: partisipan yang diberi placebo, obat lama, dan obat baru. Kita bisa saja menjalankan tiga t-test terpisah:

Placebo vs obat lama
Placebo vs obat baru
Obat lama vs obat baru

Masalah yang terjadi: inflasi Type I error

Jika α = 0.05 per uji, probabilitas tidak terjadinya false positive dalam satu uji = 0.95.

Untuk tiga uji independen: \(P(\text{tidak ada FP}) = 0.95^3 = 0.857\)

Artinya, probabilitas minimal satu false positive = 1 − 0.857 = 14.3% — jauh di atas α = 5%!

Kelebihan ANOVA dibandingkan t-test

ANOVA menjaga family-wise error rate pada α = 0.05 untuk seluruh perbandingan sekaligus. Ia menguji \(H_0\) bahwa semua mean kelompok sama, dalam satu kali uji.

ANOVA: satu uji untuk banyak kelompok

Analysis of Variance (ANOVA), dikembangkan oleh Ronald Fisher pada awal abad ke-20, membandingkan mean dari dua atau lebih kelompok secara bersamaan.

\[H_0: \mu_1 = \mu_2 = \mu_3 = \ldots = \mu_k\] \[H_a: \text{tidak benar bahwa semua } \mu_k \text{ sama}\]

Note

Perhatikan bahwa \(H_a\) hanya menyatakan perbedaan mean semua kelompok ≠ 0. Ia tidak menentukan kelompok mana yang berbeda dan seberapa besar perbedaannya. Untuk mengetahui seberapa besar perbedaan spesifik antar pasangan kelompok, kita harus melakukan post-hoc test.

Logika ANOVA: partisi varians

Studi Ferguso: obat flu baru

Ferguso ingin menguji apakah obat flu barunya (flungalih) lebih efektif dibanding plasebo dan obat standar (mixagrip). Ia mengacak 18 peserta ke tiga kelompok (N = 6 per kelompok) dan mengukur konsentrasi zat aktif dalam darah pasien setelah pemberian obat.

Kelompok	Mean konsentrasi	SD
Plasebo	0.450	0.281
Mixagrip	0.717	0.392
Flungalih	1.48	0.214

Dataset: cobaobat.omv

Mempartisi total varians

ANOVA mempartisi total variabilitas dataset menjadi dua sumber:

\[SS_{\text{tot}} = SS_{\text{between}} + SS_{\text{within}}\]

\[\sum_{k}\sum_{i}(Y_{ik} - \bar{Y})^2 = \sum_{k} N_k(\bar{Y}_k - \bar{Y})^2 + \sum_{k}\sum_{i}(Y_{ik} - \bar{Y}_k)^2\]

Sumber	Simbol	Interpretasi
Between-group	\(SS_b\)	Variabilitas antar kelompok — efek perlakuan
Within-group	\(SS_w\)	Variabilitas dalam kelompok — noise / kesalahan pengukuran
Total	\(SS_{\text{tot}}\)	Total variabilitas seluruh data

Rasio F

Dari Sum of Squares, kita hitung Mean Squares dengan membagi degrees of freedom:

\[MS_b = \frac{SS_b}{df_b} \quad \text{di mana } df_b = G - 1\]

\[MS_w = \frac{SS_w}{df_w} \quad \text{di mana } df_w = N - G\]

Kemudian rasio F:

\[F = \frac{MS_b}{MS_w} = \frac{\text{varians antar kelompok}}{\text{varians dalam kelompok}}\]

Cara memahami rasio F

Jika semua kelompok memiliki mean yang sama (\(H_0\) benar), \(MS_b\) dan \(MS_w\) seharusnya mengestimasi kuantitas yang sama, sehingga F ≈ 1. Semakin besar perbedaan antar kelompok relatif terhadap noise, semakin besar nilai F, dan semakin kecil p-value.

Implementasi di `jamovi`

Langkah ANOVA di `jamovi`

Buka dataset cobaobat.omv, kemudian jalankan one-way ANOVA:

Klik menu ANOVA ANOVA
Masukkan konsentrasi ke Dependent Variable dan obat ke Fixed Factors
Di opsi Effect Size, centang η² dan ω²
Di opsi Assumption Checks, centang Homogeneity test (Levene) dan Q-Q plot of residuals
Di opsi Post-Hoc Tests, masukkan obat dan centang Tukey dan Bonferroni
Di opsi Estimated Marginal Means, masukkan obat ke Terms 1

Membaca hasil ANOVA

Tabel ANOVA (ringkasan):

Sumber	F	df	p	ω²
obat	18.6	2, 15	< .001	0.662
Residuals	—	15	—	—

Interpretasi: Terdapat perbedaan yang signifikan dalam kadar konsentrasi antar tiga kelompok obat, F(2, 15) = 18.6, p < .001, ω² = 0.662.

Important

Hasil ANOVA yang signifikan hanya memberi tahu kita bahwa ada perbedaan di suatu tempat — bukan di mana persisnya. Untuk mengetahui pasangan kelompok mana yang berbeda, kita butuh post-hoc test.

Effect size untuk ANOVA

η² dan ω²

Kedua ukuran ini menggambarkan proporsi varians variabel dependen yang dapat dijelaskan oleh faktor kelompok:

\[\eta^2 = \frac{SS_b}{SS_{\text{tot}}}\]

\[\omega^2 = \frac{SS_b - (G-1) \cdot MS_w}{SS_{\text{tot}} + MS_w}\]

	η²	ω²
Bias	Lebih besar (overestimate)	Lebih konservatif, unbiased
Default software	Sering digunakan karena mudah dihitung	Lebih jarang, tapi lebih disarankan
Pada contoh	0.713	0.662

Tip

Gunakan ω² sebagai default, karena ω² memberikan estimasi yang lebih akurat tentang effect size populasi. Sebagian besar software statistik secara default melaporkan η² karena lebih mudah dihitung, tapi η² cenderung mengoverestimate ukuran efek, terutama pada sampel yang kecil.

Interpretasi effect size ANOVA (konvensi Cohen)

ω² (atau η²)	Interpretasi
0.01	Efek kecil
0.06	Efek sedang
0.14	Efek besar

Pada studi Ferguso: ω² = 0.662 → efek yang sangat besar — obat flungalih dan plasebo memberikan kadar konsentrasi yang sangat berbeda.

Post-hoc tests

Mengapa perlu post-hoc test?

ANOVA yang signifikan hanya memberikan bukti bahwa mean kelompok berbeda signifikan.
Post-hoc test mengidentifikasi pasangan kelompok mana yang berbeda secara signifikan, tetapi sambil mengontrol Type I error.

Tiga pilihan utama di jamovi:

Tukey’s HSD (Honestly Significant Difference): Seimbang antara power dan kontrol Type I error — cocok untuk kebanyakan kasus jika asumsi homogenitas varians terpenuhi
Games-Howell: Gunakan sebagai pengganti Tukey’s HSD jika Levene’s test signifikan (p < .05) — tidak mengasumsikan homogenitas varians
Bonferroni correction: Lebih konservatif — membagi α dengan jumlah perbandingan; lebih tepat jika ada hipotesis spesifik yang sudah dirumuskan sebelumnya

Catatan

Ada puluhan post-hoc test yang berbeda (Scheffé, Dunnett, dll.). Pilih berdasarkan asumsi yang terpenuhi: Tukey’s HSD jika varians homogen, Games-Howell jika tidak. Jangan memilih berdasarkan mana yang memberikan p-value terkecil.

Hasil post-hoc test: studi Ferguso

Perbandingan berpasangan (Bonferroni):

Perbandingan	Perbedaan mean	SE	p (Bonferroni)
Plasebo vs Mixagrip	−0.174	0.174	0.998
Plasebo vs Flungalih	−0.929	0.168	< .001
Mixagrip vs Flungalih	−0.755	0.182	.003

Interpretasi:

Plasebo dan mixagrip tidak berbeda signifikan (p = 0.998)
Flungalih secara signifikan lebih efektif dari plasebo dan mixagrip (keduanya p < .05)
Flungalih adalah obat baru yang menjanjikan — tapi perlu studi replikasi dengan sampel lebih besar

Asumsi ANOVA

Tiga asumsi utama

Asumsi	Cara memeriksa	Akibat pelanggaran
Normalitas residual	Q-Q plot residual, Shapiro-Wilk	Bias pada p-value, terutama sampel kecil
Homogenitas varians (homoscedasticity)	Levene’s test	F-ratio tidak akurat
Independensi observasi	Desain penelitian	Sangat serius — p-value tidak valid

Important

ANOVA relatif robust terhadap pelanggaran normalitas jika ukuran sampel setiap kelompok cukup besar (≥ 30) dan seimbang. Namun heterogenitas varians yang ekstrem lebih bermasalah, terutama jika ukuran kelompok tidak seimbang.

Memeriksa asumsi di `jamovi`

Normalitas residual (bukan data mentah!):

Lihat Q-Q plot of residuals — titik-titik harus mengikuti garis diagonal
Secara opsional, jalankan Shapiro-Wilk pada residual
Catatan penting: ANOVA mengasumsikan normalitas residual, bukan normalitas data mentah

Homogenitas varians — Levene’s test:

Pada studi Ferguso: F(2, 15) = 1.20, p = 0.327 → varians homogen, asumsi terpenuhi
Jika Levene’s signifikan (p < 0.05): pertimbangkan Welch’s ANOVA (robust terhadap heterogenitas varians)

Merencanakan jumlah sampel

Effect size f untuk G*Power

Untuk ANOVA, G*Power menggunakan effect size f (berbeda dari Cohen’s d):

\[f = \frac{\sigma_{\text{between}}}{\sigma_{\text{within}}} = \sqrt{\frac{\eta^2}{1 - \eta^2}}\]

Konvensi Cohen:

f	Interpretasi
0.10	Efek kecil
0.25	Efek sedang
0.40	Efek besar

Contoh: analisis power untuk studi 3 kelompok

Ferguso berencana mereplikasi studinya dengan sampel lebih besar. Dari literatur, ia memperkirakan efek sedang-kecil (f = 0.2).

Langkah di G*Power:

Test family F tests
Statistical test ANOVA: Fixed effects, main effects and interactions
Type of power analysis A priori
Masukkan: Effect size f = 0.2, α = 0.05, Power = 0.80, Number of groups = 3
Klik Calculate

Hasil: N = 159 (53 per kelompok)

Note

Studi asli Ferguso hanya memiliki N = 18 — jauh terlalu kecil untuk mendeteksi efek sedang-kecil dengan power yang cukup. Efek yang ditemukan (f ≈ 1.58) adalah efek yang sangat besar — itulah mengapa studi kecil pun berhasil mendeteksinya.

Latihan: Analisis power untuk ANOVA

Kalian berencana meneliti perbedaan tingkat burnout di antara tiga kelompok mahasiswa: mahasiswa yang bekerja penuh waktu, bekerja paruh waktu, dan tidak bekerja.

Buka G*Power F tests ANOVA: Fixed effects
Pilih A priori masukkan f = 0.25, α = 0.05, Power = 0.80, 3 kelompok
Bandingkan dengan f = 0.10 dan f = 0.40 — seberapa sensitif sampel yang dibutuhkan terhadap asumsi effect size?
Dengan N total yang kalian dapat, berapa sampel yang dibutuhkan per kelompok agar proporsional?

Pertanyaan untuk didiskusikan:

Dari mana kalian bisa memperkirakan f yang realistis sebelum mengumpulkan data?
Apa yang terjadi jika kelompok dalam ANOVA tidak seimbang (ukuran berbeda)?

Ada pertanyaan❓

Note

Paparan disusun dengan menggunakan dan Quarto dengan template dari UNAIR Theme.
Kontak saya via amelia.zein@psikologi.unair.ac.id

ANOVA

Outline

Mengapa ANOVA?

Masalah dengan t-test berulang

ANOVA: satu uji untuk banyak kelompok

Logika ANOVA: partisi varians

Studi Ferguso: obat flu baru

Mempartisi total varians

Rasio F

Implementasi di jamovi

Langkah ANOVA di jamovi

Membaca hasil ANOVA

Effect size untuk ANOVA

η² dan ω²

Interpretasi effect size ANOVA (konvensi Cohen)

Post-hoc tests

Mengapa perlu post-hoc test?

Hasil post-hoc test: studi Ferguso

Asumsi ANOVA

Tiga asumsi utama

Memeriksa asumsi di jamovi

Merencanakan jumlah sampel

Effect size f untuk G*Power

Contoh: analisis power untuk studi 3 kelompok

Latihan: Analisis power untuk ANOVA

Ada pertanyaan❓

Implementasi di `jamovi`

Langkah ANOVA di `jamovi`

Memeriksa asumsi di `jamovi`