ANOVA Pengukuran Berulang

Statistik Dasar dalam Penelitian Psikologi

Rizqy Amelia Zein

Departemen Psikologi, Universitas Airlangga

2026-06-26

Outline

Kapan perlu menggunakan ANOVA pengukuran berulang?
Logika: mempartisi varians individual
Asumsi sphericity dan Mauchly’s test
Koreksi Greenhouse-Geisser dan Huynh-Feldt
Implementasi di jamovi
Effect size (η² dan η²G)
Post-hoc tests
A priori analisis power

Kapan menggunakan RM-ANOVA?

Keterbatasan ANOVA satu jalur untuk data berulang

Bayangkan Alfonso mengukur durasi membaca kucing pada minggu ke-1, ke-2, dan ke-3 dari kucing yang sama. Jika ia melakukan uji ANOVA satu jalur biasa:

Akan timbul masalah: Observasi yang tidak independen!

Kucing yang membaca lama di minggu ke-1 cenderung juga membaca lama di minggu ke-2 dan ke-3. Ini bukan karena perlakuan, tapi karena karakteristik yang melekat pada kucing tersebut.

Pelanggaran asumsi ANOVA satu jalur

ANOVA satu jalur mengasumsikan bahwa semua observasi independen satu sama lain. Ketika partisipan yang sama diukur berulang kali, asumsi ini dilanggar, dan p-value yang dihasilkan menjadi tidak valid.

Apa itu ANOVA pengukuran berulang?

Repeated Measures ANOVA (RM-ANOVA), atau disebut juga within-subjects ANOVA atau related ANOVA, dirancang khusus untuk situasi di mana partisipan yang sama diukur pada tiga atau lebih kondisi/waktu pengukuran.

Kapan digunakan:

Studi longitudinal: mengukur variabel yang sama di beberapa titik waktu
Studi crossover: setiap partisipan mendapatkan semua kondisi perlakuan
Desain counterbalanced: urutan kondisi diacak per partisipan

Keunggulan dibanding between-subjects ANOVA:

Lebih powerful — varians individu “diisolasi” dari error
Membutuhkan lebih sedikit partisipan untuk mencapai power yang sama

Mempartisi varians: perbedaan kunci dengan ANOVA satu jalur

Dalam ANOVA satu jalur biasa: \[SS_{\text{tot}} = SS_{\text{between}} + SS_{\text{within}}\]

Dalam RM-ANOVA, \(SS_{\text{within}}\) (error) dikenali mengandung dua sumber yang tercampur: \[SS_{\text{within}} = SS_{\text{individu}} + SS_{\text{error}}\]

Sehingga total varians dipartisi menjadi tiga komponen: \[SS_{\text{tot}} = SS_{\text{perlakuan}} + SS_{\text{individu}} + SS_{\text{error}}\]

Komponen	Interpretasi
\(SS_{\text{perlakuan}}\)	Perubahan akibat kondisi/waktu pengukuran
\(SS_{\text{individu}}\)	Perbedaan antar-individu yang konsisten (dikontrol)
\(SS_{\text{error}}\)	Sisa variabilitas yang tidak dapat dijelaskan

Note

Dengan “mengeluarkan” \(SS_{\text{individu}}\) dari error, denominator rasio F menjadi lebih kecil, sehingga F lebih besar dan power meningkat.

Studi Alfonso: kucing membaca

Konteks penelitian

Alfonso ingin mengetahui apakah memperdengarkan musik klasik secara rutin dapat meningkatkan durasi membaca kucing. Ia memilih satu kelompok kucing dan:

Memperdengarkan Frühlingsstimmen — Strauss II setiap hari, 30 menit, selama 3 minggu
Mengukur durasi membaca (dalam detik) setiap akhir minggu
Membandingkan durasi membaca di minggu ke-1, ke-2, dan ke-3

Variabel:

Within-subjects factor: waktu (minggu ke-1, ke-2, ke-3) — 3 level
Variabel dependen: durasi_membaca

Dataset: minat-baca.omv

Mean durasi membaca per minggu

Waktu	Mean (detik)	SD
Minggu ke-1	42.3	8.14
Minggu ke-2	78.6	11.5
Minggu ke-3	130.4	14.2

Secara deskriptif, durasi membaca meningkat dari minggu ke minggu. Namun apakah perbedaan ini signifikan secara statistik?

Note

Dalam RM-ANOVA, kita membandingkan apakah mean antar kondisi berbeda, setelah mengontrol variabilitas antar-individu. Ini membuat uji RM-ANOVA lebih sensitif dibanding ANOVA biasa.

Asumsi sphericity

Apa itu sphericity?

Sphericity adalah asumsi kritis RM-ANOVA yang menyatakan bahwa varians dari perbedaan antara semua pasangan kondisi adalah sama.

Lebih mudahnya: varians dari (Minggu 2 − Minggu 1), (Minggu 3 − Minggu 1), dan (Minggu 3 − Minggu 2) harus kurang lebih sama.

Important

Ketika asumsi sphericity dilanggar, rasio F dari RM-ANOVA terlalu besar (inflated) — artinya kita akan terlalu sering menolak \(H_0\) yang benar (Type I error meningkat). Uji F standar tidak valid jika sphericity dilanggar.

Catatan penting:

Sphericity hanya relevan jika within-subjects factor memiliki ≥ 3 level
Dengan 2 level, hanya ada satu pasangan perbedaan — sphericity secara otomatis terpenuhi

Mauchly’s Test of Sphericity

Mauchly’s W menguji apakah asumsi sphericity terpenuhi:

\[H_0: \text{asumsi } sphericity \text{ terpenuhi}\] \[H_a: \text{asumsi } sphericity \text{ dilanggar}\]

Cara membaca:

Hasil Mauchly’s W	Tindakan
p ≥ .05	Asumsi terpenuhi — gunakan F tanpa koreksi
p < .05	Asumsi dilanggar — terapkan koreksi df

Pada studi Alfonso: Mauchly’s W = 0.812, p = .043 → asumsi sphericity dilanggar — perlu koreksi.

Koreksi sphericity: GG dan HF

Ketika sphericity dilanggar, kita menyesuaikan degrees of freedom menggunakan faktor koreksi ε (epsilon):

\[F_{\text{corrected}} \text{ menggunakan } df^* = df \times \varepsilon\]

Dua pilihan koreksi:

Greenhouse-Geisser (GG)

Lebih konservatif (ε lebih kecil)
Gunakan jika ε < 0.75
“Lebih aman” dari Type I error

Huynh-Feldt (HF)

Lebih liberal (ε mendekati 1)
Gunakan jika ε > 0.75
Power lebih tinggi

Tip

Aturan praktis: periksa nilai ε Greenhouse-Geisser terlebih dahulu. Jika ε < 0.75, gunakan koreksi GG. Jika ε ≥ 0.75, gunakan koreksi HF (lebih powerful). Pada studi Alfonso: ε = 0.831 > 0.75 → gunakan koreksi Huynh-Feldt.

Implementasi di `jamovi`

Langkah RM-ANOVA di `jamovi`

Buka dataset minat-baca.omv, kemudian:

Klik menu ANOVA Repeated Measures ANOVA
Di kolom Repeated Measures Factors: beri nama faktor — mis. “waktu” — dan tambahkan 3 level: minggu1, minggu2, minggu3
Di kolom Repeated Measures Cells: masukkan variabel durasi_minggu1, durasi_minggu2, durasi_minggu3 ke baris yang sesuai
Di opsi Effect Size, centang η² dan Generalised η²

Langkah lanjutan: asumsi dan post-hoc

Di opsi Assumption Checks, centang Sphericity Test
Di sub-menu Sphericity Corrections, centang Greenhouse-Geisser dan Huynh-Feldt
Di opsi Post-Hoc Tests, masukkan faktor waktu ke kolom kanan
Centang Bonferroni
Di opsi Estimated Marginal Means:
- Masukkan waktu ke Terms 1
- Centang Marginal means plot, Marginal means table, dan Observed scores

Membaca hasil: Sphericity Test

Output Mauchly’s W di jamovi:

Mauchly’s W	p	ε (Greenhouse-Geisser)	ε (Huynh-Feldt)
0.812	.043	0.831	0.921

p = .043 < .05 → sphericity dilanggar → gunakan koreksi.

ε (GG) = 0.831 > 0.75 → gunakan Huynh-Feldt.

Note

Jamovi secara otomatis menampilkan tabel ANOVA dengan koreksi GG dan HF. Pilih baris yang sesuai dengan nilai ε yang relevan untuk pelaporan.

Membaca hasil: tabel ANOVA

Tabel RM-ANOVA (dengan koreksi HF):

Sumber	F	df (HF)	p	η²_p	η²G
waktu	3292.4	1.843, 182.4	< .001	0.971	0.957
Residuals	—	182.4	—	—	—

Cara melaporkan:

“Terdapat perbedaan yang signifikan dalam durasi membaca kucing antara minggu ke-1, ke-2, dan ke-3, F(1.843, 182.4) = 3292.4, p < .001, η²G = 0.957 — efek yang sangat besar.”

Important

Perhatikan bahwa df yang dilaporkan adalah df setelah dikoreksi (bukan integer bulat). Ini menandakan bahwa koreksi sphericity telah diterapkan.

Effect size untuk RM-ANOVA

η² dan η² Generalisasi (η²G)

Untuk RM-ANOVA, ada dua ukuran effect size yang relevan:

\[\eta^2_p = \frac{SS_{\text{perlakuan}}}{SS_{\text{perlakuan}} + SS_{\text{error}}}\]

\[\eta^2_G = \frac{SS_{\text{perlakuan}}}{SS_{\text{perlakuan}} + SS_{\text{individu}} + SS_{\text{error}}}\]

	η²_p (partial)	η²G (Generalisasi)
Penyebut	SS perlakuan + SS error (mengecualikan SS individu)	SS total termasuk SS individu
Interpretasi	Lebih besar karena SS individu tidak dihitung — bisa melebih-lebihkan ES bila dibandingkan lintas desain	Lebih konservatif dan dapat dibandingkan antar desain
Rekomendasi	Kurang disarankan untuk perbandingan lintas studi	Lebih disarankan untuk perbandingan lintas studi

Tip

Gunakan η²G jika kalian ingin membandingkan effect size studi RM dengan studi between-subjects — η²G lebih stabil dan dapat digeneralisasi. Konvensi Cohen (kecil: .01, sedang: .06, besar: .14) berlaku untuk keduanya.

Post-hoc tests

Perbandingan berpasangan Bonferroni

Setelah RM-ANOVA yang signifikan, post-hoc test mengidentifikasi minggu mana yang berbeda satu sama lain:

Hasil post-hoc (Bonferroni):

Perbandingan	Perbedaan mean	SE	t	p (Bonferroni)
Minggu 1 vs Minggu 2	−36.3	1.42	−25.6	< .001
Minggu 1 vs Minggu 3	−88.1	1.87	−47.1	< .001
Minggu 2 vs Minggu 3	−51.8	1.53	−33.8	< .001

Semua pasangan minggu berbeda secara signifikan (semua p < .001) — durasi membaca meningkat secara progresif setiap minggunya.

Note

Post-hoc dalam RM-ANOVA menggunakan paired comparisons — bukan independent samples — karena data berasal dari subjek yang sama. Ini lebih powerful dibanding post-hoc biasa.

A priori analisis power untuk RM-ANOVA

GPower untuk repeated measures*

RM-ANOVA memerlukan parameter tambahan dibanding ANOVA biasa karena kita perlu mengantisipasi korelasi antar pengukuran.

Langkah di G*Power:

Test family F tests
Statistical test ANOVA: Repeated measures, within factor
Type of power analysis A priori
Masukkan parameter:
- Effect size f (konversi Cohen’s f)
- α = 0.05
- Power (1 − β)
- Number of groups = 1 (satu kelompok subjek)
- Number of measurements = jumlah level within-subjects factor
- Correlation among rep measures (estimasi r antar pengukuran)
- Nonsphericity correction ε

Parameter penting: korelasi dan nonsphericity

Korelasi antar pengukuran (r):

Pengukuran berulang pada subjek yang sama cenderung berkorelasi. Estimasi r memengaruhi sampel yang dibutuhkan:

Korelasi antar pengukuran	Implikasi
Tinggi (r ≈ 0.5–0.8)	Butuh lebih sedikit sampel — RM-ANOVA lebih powerful
Rendah (r ≈ 0–0.2)	Keunggulan RM-ANOVA berkurang; butuh sampel lebih besar
Negatif	RM-ANOVA bisa kurang powerful dari between-subjects

Koreksi nonsphericity (ε):

ε = 1.0 → sphericity terpenuhi sempurna
ε < 1.0 → sphericity dilanggar; semakin kecil ε, semakin besar sampel yang dibutuhkan
Estimasi konservatif: ε = 0.5–0.75

Contoh: power untuk studi kelinci Alfonso

Alfonso ingin mengulangi studi musik pada kelinci dengan asumsi:

Effect size f = 0.15 (efek moderat-kecil)
α = 0.05, Power = 0.90 (\(\beta\) = 0.10)
1 kelompok, diukur 3 kali (3 minggu)
Korelasi antar pengukuran: r = 0.01 (sangat kecil — kelinci lebih tidak konsisten)
Nonsphericity ε = 0.8

Di G*Power: masukkan semua parameter di atas.

Hasil: N ≈ 220 kelinci

Note

Dibanding ANOVA between-subjects yang mungkin membutuhkan N = 600+ untuk power yang sama dengan f = 0.15, RM-ANOVA jauh lebih efisien — meskipun korelasi antar pengukuran sangat kecil.

Latihan: RM-ANOVA di `jamovi`

Seorang peneliti ingin menguji efek program mindfulness 4 sesi pada skor stres peserta. Stres diukur sebelum sesi 1, setelah sesi 2, dan setelah sesi 4.

Buka dataset stres.omv dan jalankan RM-ANOVA
Masukkan faktor: sesi (3 level: sebelum, sesi2, sesi4)
Periksa asumsi sphericity — apakah perlu koreksi? Koreksi mana?
Jalankan post-hoc Bonferroni — pasangan sesi mana yang berbeda signifikan?
Buat marginal means plot — apakah polanya linear atau ada perubahan tiba-tiba?

Pertanyaan untuk didiskusikan:

Mengapa power RM-ANOVA lebih besar dibanding between-subjects ANOVA?
Apa perbedaan antara η² dan η²G dalam konteks studi ini?
Bagaimana carryover effects dapat menjadi ancaman validitas dalam desain repeated measures?
Kapan lebih baik menggunakan mixed ANOVA (gabungan within- dan between-subjects factor)?

Ada pertanyaan❓

Note

Paparan disusun dengan menggunakan dan Quarto dengan template dari UNAIR Theme.
Kontak saya via amelia.zein@psikologi.unair.ac.id

ANOVA Pengukuran Berulang

Outline

Kapan menggunakan RM-ANOVA?

Keterbatasan ANOVA satu jalur untuk data berulang

Apa itu ANOVA pengukuran berulang?

Mempartisi varians: perbedaan kunci dengan ANOVA satu jalur

Studi Alfonso: kucing membaca

Konteks penelitian

Mean durasi membaca per minggu

Asumsi sphericity

Apa itu sphericity?

Mauchly’s Test of Sphericity

Koreksi sphericity: GG dan HF

Implementasi di jamovi

Langkah RM-ANOVA di jamovi

Langkah lanjutan: asumsi dan post-hoc

Membaca hasil: Sphericity Test

Membaca hasil: tabel ANOVA

Effect size untuk RM-ANOVA

η² dan η² Generalisasi (η²G)

Post-hoc tests

Perbandingan berpasangan Bonferroni

A priori analisis power untuk RM-ANOVA

G*Power untuk repeated measures

Parameter penting: korelasi dan nonsphericity

Contoh: power untuk studi kelinci Alfonso

Latihan: RM-ANOVA di jamovi

Ada pertanyaan❓

Implementasi di `jamovi`

Langkah RM-ANOVA di `jamovi`

GPower untuk repeated measures*

Latihan: RM-ANOVA di `jamovi`