lme untuk Pengukuran Berulang dan Experience SamplingMenggunakan jamovi (GAMLj)
2026-04-16
lme biasa untuk data berulanglme
lme sangat berguna ketika struktur data kita berjenjang (murid dalam sekolah, karyawan dalam organisasi).Tapi apa yang terjadi jika orang yang sama diukur berkali-kali?

Bayangkan kita mengukur tingkat kecemasan menteri pada:
Kecemasan Menteri Purbaya di T1 dan T2 sangat mungkin berkorelasi, karena Purbaya yang sama yang diukur dua kali pada dua titik waktu (time points atau beep dalam literatur experience sampling).
Ketika ini terjadi, maka model melanggar asumsi independensi residual dari lme biasa.
| Waktu | Kecemasan Purbaya | Kecemasan Bahlil |
|---|---|---|
| T1 | 72 | 55 |
| T2 | 85 | 61 |
| T3 | 58 | 48 |
Warning
Observasi dalam satu orang tidak independen!
Kita perlu menspesifikasi dengan cara memberi tahu ´jamovi´, bagaimana pola korelasi antara residual dari pengukuran berulang pada orang yang sama.
Di GAMLj, kovarians residual dapat diatur melalui menu Residuals Options.
\[\mathbf{R} = \begin{bmatrix} \sigma^2_{T1} & \sigma_{12} & \sigma_{13} & \sigma_{14} \\ \sigma_{12} & \sigma^2_{T2} & \sigma_{23} & \sigma_{24} \\ \sigma_{13} & \sigma_{23} & \sigma^2_{T3} & \sigma_{34} \\ \sigma_{14} & \sigma_{24} & \sigma_{34} & \sigma^2_{T4} \end{bmatrix}\]
Bayangkan satu orang diukur sebanyak 4 kali (T1–T4). Matriks R di atas menggambarkan varians (garis diagonal) dan kovarians (luar garis diagonal) antar pengukuran (beep).
Pertanyaan kuncinya: apakah kita asumsikan kovarians pengukuran antar waktu (beep) itu nol, sama semua, atau berbeda-beda?
Jawaban atas pertanyaan ini menentukan struktur varians-kovarians yang kita pilih.
\[\mathbf{R} = \sigma^2 \begin{bmatrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix}\]
Hati-hati
Identity adalah opsi default yang kemungkinan besar tidak sesuai dalam banyak kasus desain penelitian pengukuran berulang. Jika tidak ada alasan teoritis yang kuat, sebaiknya hindari opsi ini.
\[\mathbf{R} = \begin{bmatrix} \sigma^2 & \sigma_c & \sigma_c & \sigma_c \\ \sigma_c & \sigma^2 & \sigma_c & \sigma_c \\ \sigma_c & \sigma_c & \sigma^2 & \sigma_c \\ \sigma_c & \sigma_c & \sigma_c & \sigma^2 \end{bmatrix}\]
Mirip dengan ANOVA repeated measures
Compound symmetry adalah asumsi yang diuji oleh Mauchly’s test dalam ANOVA repeated measures. Jika Mauchly’s test signifikan, sphericity dilanggar dan CS bukan pilihan terbaik.
\[\mathbf{R} = \begin{bmatrix} \sigma^2_1 & \sigma_{12} & \sigma_{13} & \sigma_{14} \\ \sigma_{12} & \sigma^2_2 & \sigma_{23} & \sigma_{24} \\ \sigma_{13} & \sigma_{23} & \sigma^2_3 & \sigma_{34} \\ \sigma_{14} & \sigma_{24} & \sigma_{34} & \sigma^2_4 \end{bmatrix}\]
Tips praktis
Gunakan UN untuk menguji apakah struktur yang lebih sederhana (CS) sudah cukup. Apabila setelah dibandingkan, AIC/BIC UN dan CS tidak jauh berbeda, pilih CS karena lebih parsimonious. CS tidak bisa dipakai untuk intensive ESM >5 time points.
| Struktur | Parameter | Kapan pakai |
|---|---|---|
| Identity | 1 | Tidak ada korelasi temporal (bukan pilihan tepat pada kebanyakan kasus) |
| Compound Symmetry | 2 | Korelasi sama untuk semua jarak waktu |
| Unstructured | p(p+1)/2 | Baseline; time points sedikit, N besar |
| AR(1) | 2 | Korelasi meluruh (decayed) seiring jarak waktu |
| ARMA(1,1) | 3 | AR(1) + efek lokal antar pengukuran berdekatan |
Tips
Gunakan AIC/BIC untuk memilih❗
Model dengan AIC/BIC lebih kecil = lebih baik
lmelme lebih baik dari RM-ANOVA?Keterbatasan RM-ANOVA:
Keunggulan lme:
Amel adalah seorang mahasiswa psikologi yang penasaran apakah tingkat kecemasan teman-temannya berubah selama masa ujian.
Ia melakukan survei pada 120 mahasiswa dari 4 fakultas berbeda di dua universitas, sebanyak 4 kali pengukuran:
Klik datasetnya di bawah ini
Variabel:
Format long (format yang dibutuhkan untuk lme):
| id | t | cemas | neuro |
|---|---|---|---|
| 001 | 1 | 52 | 68 |
| 001 | 2 | 61 | 68 |
| 001 | 3 | 78 | 68 |
| 001 | 4 | 49 | 68 |
| 002 | 1 | 44 | 55 |
| 002 | 2 | 50 | 55 |
| … | … | … | … |
Perhatikan: neuro tidak berubah antar waktu (variabel Level-2), sedangkan cemas berubah antar waktu (variabel Level-1).
Buka dataset-rm.omv
Langkah 1 — Model kosong (null model):
Note
Catatan penting: Saat ini, kita belum menentukan struktur kovarians dari residual — ini berarti kita masih menggunakan Identity (asumsi independensi). Kita akan coba bandingkan dengan model di langkah berikutnya.
Langkah 2 — Tambahkan waktu sebagai prediktor:
Kapan waktu diset sebagai kontinum atau kategorikal?
Tergantung prediksi teoritisnya. Apabila perubahan outcome mengikuti pola tertentu (e.g., linear, kuadratik/curvilinear, atau pola lainnya), maka set waktu sebagai kontinum. Apabila tidak ada prediksi teoritis tertentu mengenai pola perubahannya, set waktu sebagai variabel kategorikal/diskrit.
Langkah 3 — Ubah struktur kovarians residual:
Tips
Urutkan dari yang paling sederhana ke yang paling kompleks: Identity → CS → UN. Jika CS sudah cukup baik (AIC/BIC tidak jauh lebih kecil dari UN), gunakan CS.
Model dengan waktu + CS biasanya sudah jauh lebih baik daripada model dengan Identity
Lihat tabel Model Info (AIC) dan Fixed Coefficients (efek waktu terhadap kecemasan)
Tetapi ada problem spesifikasi ketika struktur residual diset compound asymmetry atau unstructured
Jika efek waktu signifikan: ada perubahan rata-rata kecemasan yang bermakna antar time point
Periksa juga Random Coefficients: apakah varians random intercept besar? Ini menunjukkan bahwa ada perbedaan mean tingkat kecemasan yang besar antar individu, setelah memperhitungkan tren waktu rata-rata di seluruh sampel
Interpretasi
Misalnya, B(waktu) = 8.5, artinya setiap bertambah 1 unit waktu (1 time point), skor kecemasan rata-rata meningkat 8.5 poin pada individu yang sama (within-person).
| Varians Random Intercept |
Varians Random Slope |
Interpretasi |
|---|---|---|
| Besar | Kecil | Individu berbeda dalam baseline kecemasan, tetapi memiliki trajektori yang serupa dari waktu ke waktu |
| Kecil | Besar | Individu memulai dari baseline yang relatif sama, tetapi trajektori mereka berbeda seiring waktu |
| Besar | Besar | Individu berbeda baik dalam baseline maupun trajektori — periksa kovarians intercept-slope |
| Kecil | Kecil | Sedikit variasi antar individu ataupun antarwaktu — mungkin tidak butuh spefikasi random effects (?) |
ESM (Experience Sampling Method) adalah metode pengumpulan data di mana peserta mengisi survei singkat berkali-kali dalam kehidupan sehari-hari, biasanya melalui aplikasi di smartphone.
Tujuannya: menangkap pengalaman, perasaan, dan perilaku seseorang in the moment, dalam konteks kehidupan nyata, bukan hanya retrospektif.
Ada tiga jenis:
Nama lain ESM
Validitas ekologis tinggi — data dikumpulkan dalam kehidupan nyata, bukan di laboratorium
Mengurangi bias retrospektif — orang tidak selalu akurat mengingat bagaimana perasaannya kemarin
Mengungkap dinamika temporal — perubahan mood dari jam ke jam, bukan hanya rata-rata
Memisahkan efek within-person dan between-person secara lebih jelas
Mendeteksi intra-individual variability — seberapa fluktuatif seseorang dari waktu ke waktu
Data ESM adalah data bersarang 3 level yang kita sederhanakan menjadi 2 level:
Level 3: Orang (N = 80)
└── Level 2 (disederhanakan): Hari (7 hari/orang)
└── Level 1: Pengukuran/beep (5x/hari → 35 beep/orang)
Total observasi: 80 × 35 = 2.800 baris
Dalam GAMLj 2-level: beep bersarang dalam orang.
Misalnya: mood Bahlil jam 10 pagi sangat berkorelasi dengan mood Bahlil jam 10.30, cukup berkorelasi dengan mood Bahlil jam 12, dan hampir tidak berkorelasi dengan mood Bahlil jam 10 malam.
Korelasi meluruh (decay) seiring bertambahnya jarak waktu.
Fenomena ini disebut temporal autocorrelation — dan tidak cukup hanya ditangani dengan struktur Identity atau Compound Symmetry, karena:
\[\mathbf{R} = \sigma^2 \begin{bmatrix} 1 & \rho & \rho^2 & \rho^3 \\ \rho & 1 & \rho & \rho^2 \\ \rho^2 & \rho & 1 & \rho \\ \rho^3 & \rho^2 & \rho & 1 \end{bmatrix}\]
Intuisi AR(1)
Jika ρ = 0.5: korelasi beep berturutan = 0.5, dua beep terpisah = 0.25, tiga beep terpisah = 0.125. Semakin jauh jarak waktunya, korelasi makin melemah.
Note
Contoh ARMA(1,1): Bayangkan ada kejadian mendadak (telepon penting jam 2 siang) yang meningkatkan kecemasan Anda. Efeknya sangat terasa di pengukuran jam 2.30, tapi mulai memudar setelahnya. Komponen MA menangkap “lonjakan lokal” ini — di luar pola meluruh reguler dari AR(1).
Dalam data ESM, kita menjawab dua pertanyaan penelitian yang sangat berbeda:
Efek within-person (Level 1): ketika Purbaya saat ini lebih stres dari biasanya, apakah afek negatifnya juga lebih tinggi dari biasanya?
Efek between-person (Level 2): apakah orang yang secara umum lebih stres juga secara umum memiliki afek negatif yang lebih tinggi?
Tanpa centering, kedua efek ini tercampur dan koefisien yang dihasilkan tidak dapat diinterpretasikan secara bermakna.
Formula: \[\text{stres\_centered}_{ij} = \text{stres}_{ij} - \bar{\text{stres}}_j\]
di mana \(\bar{\text{stres}}_j\) adalah rata-rata stres orang \(j\) di semua beep-nya.
Note
Teknik ini mirip dengan group-mean centering di materi sebelumnya, tapi unit pengelompokannya (level-2) adalah individu, bukan sekolah/organisasi.
Karena lme memungkinkan person-mean centering efek within-person dengan between-person bisa dipisahkan
Fitur inilah yang membuat lme lebih baik daripada cross-lagged panel model (CPLM) karena CPLM tidak punya mekanisme untuk mempartisi kedua jenis varians ini (Hamaker, Kuiper, & Grasman, 2015)
| Orang | Beep | Stres | M_stres | Stres_centered |
|---|---|---|---|---|
| Purbaya | 1 | 60 | 55 | +5 |
| Purbaya | 2 | 50 | 55 | -5 |
| Bahlil | 1 | 40 | 45 | -5 |
| Bahlil | 2 | 50 | 45 | +5 |
Purbaya dan Bahlil pada beep 2 sama-sama stres = 50, tetapi artinya berbeda: Purbaya lebih rendah dari biasanya, Bahlil lebih tinggi dari biasanya.
Penting
Rata-rata individu (M_stres) dimasukkan sebagai prediktor Level-2 yang terpisah untuk mengestimasi between-person effect secara eksplisit — sama seperti grand-mean centering dalam materi sebelumnya.
Pertanyaan yang paling menarik dalam banyak studi ESM: apakah hubungan within-person berbeda antar individu?
Misalnya: apakah hubungan antara stres sesaat dengan afek negatif sesaat lebih kuat pada orang dengan neuroticism tinggi?
Pertanyaan ini merefleksikan adanya cross-level interaction: interaksi antara prediktor Level-1 (stres_centered) dengan prediktor Level-2 (neuroticism).
Cara setup di GAMLj:
Bahlil adalah seorang mahasiswa S3 yang ingin tahu apakah strategi regulasi emosi seseorang mempengaruhi dinamika afek harian mereka.
Ia merekrut 80 mahasiswa dan meminta mereka mengisi survei singkat 5 kali sehari selama 7 hari melalui aplikasi smartphone.
Setiap beep, partisipan diminta menilai:
Sebelum studi dimulai, partisipan mengisi:
Klik teks di bawah ini untuk mengunduh dataset dataset-esm.omv
Variabel Level-1 (beep):
Variabel Level-2 (person):
Persiapan data:
stres - VMEAN(stres, group_by = id) (mengurangi dengan rata-rata dalam kelompok id)VMEAN(stres, group_by = id) → variabel ini mewakili between-person effectNote
Tips: dalam jamovi, fungsi VMEAN(var, group_by = group) menghitung rata-rata variabel var untuk setiap nilai group. Ini mirip dengan group-mean centering yang kita gunakan di materi sebelumnya.
Langkah 1 — Model null:
more fit indicesLangkah 2 — Tambahkan prediktor Level 1 dan 2:
none untuk stres_centered dan stress_meanLangkah 3 — Cross-level interaction:
Bandingkan AIC antar model!
Fixed effects:
Random effects:
AR(1) parameter:
Untuk menguji hipotesis penelitian, kami melakukan analisis linear mixed effects (LME) dengan menggunakan REML (Restricted Maximum Likelihood) di jamovi (GAMLj). Data bersarang dalam dua level: pengukuran sesaat (beep, N=2.800) bersarang dalam individu (N=80).
Sebelum analisis, variabel stres sesaat di-person-mean centered dengan cara mengurangi skor stres setiap beep dengan rata-rata skor stres individu tersebut di seluruh beep-nya. Rata-rata stres individu dimasukkan sebagai prediktor Level-2 yang terpisah untuk mengestimasi efek between-person secara eksplisit.
Struktur kovarians residual AR(1) dipilih untuk menangkap temporal autocorrelation antar pengukuran, yang diperkuat oleh estimasi koefisien autokorelasi ρ = 0.372, menunjukkan korelasi yang moderat antara pengukuran berturutan.
Model null menunjukkan bahwa 59.9% varians afek positif sesaat berada di level individu (ICC = 0.599), mengindikasikan bahwa penggunaan
lmelebih sesuai daripada regresi OLS.
Efek within-person stres sesaat terhadap afek positif sesaat signifikan negatif (B = -0.336 95% CI [-0.371, -301], SE = 0.017, t = -18.72, p = .001), artinya ketika seseorang saat ini lebih stres dari biasanya, afek positifnya juga lebih rendah dari biasanya sebesar 0.336 poin.
Efek between-person stres juga signifikan (B = -0.409 95% CI [-0.548, -0.271], SE = 0.069, t = -5.89, p = .001), artinya orang yang secara umum lebih stres memiliki afek positif rata-rata yang lebih rendah sebesar 0.409 poin, dibanding orang yang lebih tidak stres — bahkan ketika perbedaan fluktuasi sesaat sudah dikontrol.
Efek regulasi emosi positif dan signifikan berkaitan dengan afek positif (B = 0.176 95% CI [0.053, 0.300], SE = 0.061, t = 2.86, p = .006). Artinya, partisipan dengan regulasi emosi yang baik juga cenderung memiliki afek positif yang lebih baik.
Cross-level interaction antara stres sesaat dan regulasi emosi signifikan (B = 0.006 95% CI [0.004, 0.009], SE = 0.001, t = 6.08, p = .001), menunjukkan bahwa orang dengan regulasi emosi yang lebih baik menunjukkan reaktivitas stres-afek yang lebih lemah.
Repeated measures (sedikit time points, ≤ 5):
ESM / daily diary (banyak time points, interval waktu regular):
Selalu lakukan:
Data ESM 3-level: pengukuran bersarang dalam hari, bersarang dalam individu
lme4 dengan dua cluster variablesLagged predictors: apakah stres sebelumnya memprediksi afek sekarang?
Intra-individual variability sebagai outcome (bukan hanya rata-rata)
Intensive longitudinal data: ketika jumlah beep sangat banyak (>100/orang)
ESM dengan variabel kategoris (mis. afek diukur dengan item nominal)
lme (GLMM)Note