Confirmatory Factor Analysis (CFA)

Multigroup Structural Equation Modeling: Bagian 4️⃣

Rizqy Amelia Zein

Departemen Psikologi, Universitas Airlangga

Research Data & Methods Team, Center for Advanced Internet Studies

2026-06-25

Outline

Definisi factor analysis
Exploratory vs confirmatory factor analysis
Kapan menggunakan CFA?
Model pengukuran reflektif vs formatif
Model pengukuran congeneric, tau equivalence, dan paralel
Constraining parameter dalam model CFA
Correlated error variances
Metode estimasi
Average Variance Extracted (AVE) dan validitas diskriminan
Menuliskan hasil analisis CFA dalam laporan penelitian

Analisis faktor

Awalnya dikembangkan oleh Charles Spearman (1904) untuk menyelidiki g factor theory of intelligence
Terdiri dari:
- Exploratory factor analysis (EFA)
- Confirmatory factor analysis (CFA)
Analisis faktor digunakan untuk menguji model common variance
Mengasumsikan bahwa dua atau lebih observed variable memiliki shared/common variance (commonality atau common factor) ditunjukkan dengan factor loading

EFA vs. CFA

Exploratory Factor Analysis	Confirmatory Factor Analysis
Mencari model yang cocok menggambarkan data, sehingga peneliti mengeksplorasi berbagai pilihan model yang cocok kemudian mencari rasionalisasi teoritisnya	Menguji hipotesis yang sudah ditentukan sebelumnya, sehingga peneliti ingin tahu apakah hipotesisnya didukung oleh data
Jumlah faktor belum diketahui sampai peneliti melakukan analisisnya	Jumlah faktor sudah ditentukan sebelum mengambil data
Peneliti tidak memiliki model yang dihipotesiskan a priori	Peneliti sudah memiliki model hipotesis yang ditentukan a priori

Confirmatory factor analysis

Menyediakan solusi untuk mengkoreksi bias karena measurement error ketika mengestimasi korelasi antar-variabel
Cara kerjanya adalah dengan membandingkan variance-covariance matrix yang dihipotesiskan dengan variance-covariance matrix pada data (sampel)
Perhatian 📢
- Sangat tidak disarankan untuk melakukan EFA kemudian CFA pada sampel yang sama
- Karena generating hypothesis dengan testing hypothesis adalah dua proses yang berbeda yang tidak seharusnya dilakukan pada sampel yang sama
- Kalau hal tsb dilakukan, maka tentu saja peneliti akan mendapatkan hasil yang ‘sesuai prediksinya’
- Ingat Texas Sharpshooter Fallacy

Texas sharpshooter fallacy

Model Reflektif vs. Formatif

Reflektif

Variabel laten menjelaskan mengapa variabel indikator bervariasi
Misalnya individu dengan intelegensi yang tinggi akan mendapatkan nilai yang berbeda dalam tes matematika
Biasanya mengasumsikan bahwa kovariansi antar-error (residual) variabel indikator = 0 (local independence) artinya, korelasi antar-indikator sepenuhnya dijelaskan oleh variabel laten, tidak ada sumber varians bersama lain di luar model
Mayoritas konstruk psikologis mengasumsikan model pengukuran reflektif

Formatif

Variabel observed menjelaskan mengapa variabel laten bervariasi
Misalnya gengsi sebuah mobil ditentukan oleh usia mobil, kondisi, harga, dan intensitas pemakaian
Korelasi antara variabel observed tidak diketahui
Biasanya digunakan untuk menentukan indeks pada konstruk yang orthogonal (contoh contohnya, adverse childhood experience)
Tetapi, sangat jarang konstruk psikologi yang mengasumsikan model formatif

Model Reflektif

Model Formatif

Jenis-jenis model pengukuran

Ada tiga macam model pengukuran:

Model congeneric
Model tau equivalence
Model parallel

Model congeneric

Model yang paling longgar asumsunya dan secara default untuk mengestimasi reliabilitas untuk analisis SEM di berbagai perangkat lunak
Asumsinya, skala, error variance, dan factor loading boleh berbeda (dibebaskan)
Koefisien reliabilitas skala yang mengasumsikan model pengukuran congeneric ω, McDonald’s ω, ω total (ω_t), Revelle’s ω, composite reliability.

Model tau equivalence

Model yang sedikit lebih rigid daripada congeneric
Asumsinya, skala dan error variance boleh berbeda (dibebaskan), namun factor loading harus sama (dibatasi)
Ketika asumsi tau equivalence dipenuhi, maka Cronbach’s α dapat digunakan
Koefisien reliabilitas: Formula Rulon, KR-20, Flanagan-Rulon, Guttman’s λ₃, λ₄, Hoyt method
- Pada kebanyakan kasus, jarang sekali ada konstruk psikologi yang memenuhi asumsi tau equivalence, sehingga sangat disarankan untuk tidak menggunakan koefisien reliabilitas yang mengasumsikan tau equivalence

Model parallel

Model yang paling rigid
Asumsinya, skala, error variance, dan factor loading harus sama (dibatasi)
- Koefisien reliabilitas: Spearman-Brown’s Formula, Standardized α.

Constraining parameter model

Membatasi/menentukan varians untuk setiap variabel/faktor laten
- Dilakukan untuk mengeluarkan standardized estimates
- Factor loading di z-scorekan
- Sehingga defaultnya, mean variabel laten = 0, variance = 1
Membatasi/menentukan error covariance untuk setiap variabel/faktor laten = 0
- Dilakukan agar error variance bebas diestimasi

Apa yang terjadi ketika error variance berkorelasi?

Kedua variabel indikator tersebut mengukur variabel laten lain di luar model (unique factor)
Bisa jadi karena ada item unfavourable dalam skala
Kemungkinan konstruk laten bukan konstruk tunggal (multidimensi)
Perhatikan justifikasi teori ketika menambah error covariance

Skor faktor (factor scores)

Apabila kita memiliki informasi tentang factor loading, maka kita bisa menghitung factor scores estimasi (fitted) skor variabel laten
Caranya dengan mengali factor loading dengan skor kasar metode regresi
Namun ingat, mengalikan factor loading dengan skor kasar masih berisiko mendapatkan estimasi yang bias. Itulah yang menyebabkan factor scores akan berubah ketika model diujikan pada kelompok sampel yang berbeda.
Ada tiga cara yang bisa digunakan untuk menghitung factor scores:
- Metode Regresi dengan mengoptimalisasi validitas konstruk (variance explained)
- Metode Bartlett mengasumsikan variabel indikator tidak saling berkorelasi
- Metode Anderson-Rubin mengasumsikan variabel indikator saling berkorelasi

Memilih metode estimasi

Maximum Likelihood distribusi data (multivariate) normal, level pengukuran harus interval/continuous, tidak ada data missing
- Gunakan Robust Maximum Likelihood (MLR) ketika asumsi multivariate normality tidak terpenuhi
Generalized-least squares menggunakan asumsi yang sama dengan ML namun performanya kurang baik apabila dibandingkan dengan ML
Weighted-least squares dapat digunakan pada data kategorikal (nominal dan ordinal), estimasi menggunakan polychoric correlation matrix. Varian WLS, misalnya: WLSM, WLSMV, WLSMVS.
Diagonally weighted-least squares dapat digunakan pada data kategorikal, bekerja dengan baik pada sampel yang relatif kecil dan data yang tidak berdistribusi normal

Tips memilih estimator

Untuk skala Likert dengan 6–7 pilihan, dengan respons yang relatif simetris, MLR sudah baik performanya. Untuk skala Likert 4 pilihan dengan distribusi yang sangat juling (skew), WLSMV merupakan pilihan yang lebih aman (Rhemtulla, Brosseau-Liard & Savalei, 2012).

Average Variance Extracted (AVE)

AVE mengukur seberapa besar varians pada variabel indikator yang dijelaskan oleh faktor laten, dibandingkan dengan varians yang berasal dari error
Formula AVE (dengan λᵢ = standardized factor loading tiap indikator):

\[AVE = \frac{\sum \lambda_i^2}{\sum \lambda_i^2 + \sum (1 - \lambda_i^2)}\]

Intinya: dari seluruh varians indikator, berapa proporsinya yang merupakan benar-benar “sinyal” dari konstruk dan bukan noise?
Kriteria AVE ≥ 0.50 (Fornell & Larcker, 1981)
- AVE < 0.50 berarti error variance lebih besar daripada construct variance validitas konvergen tidak terpenuhi

AVE vs. Composite Reliability (CR)

	AVE	CR
Yang diukur	Rasio sinyal (common variance) dibandingkan total varians per indikator	Konsistensi internal skala
Sensitif terhadap	Loading rendah sangat menekan nilai AVE	Kurang sensitif — loading tinggi dapat mengompensasi
Kriteria	≥ 0.50	≥ 0.70
Kegunaan utama	Validitas konvergen & diskriminan	Reliabilitas (alternatif Cronbach’s α)

CR tinggi belum tentu AVE tinggi

Skala dengan loading sedang (misalnya semua λ = 0.60, 5 item) bisa menghasilkan CR ≈ 0.78 namun AVE ≈ 0.36. CR fokus pada “apakah item-item saling berkaitan?”; AVE fokus pada “apakah item-item benar-benar mewakili konstruknya?”

Validitas Diskriminan

Selain validitas konvergen, AVE juga digunakan untuk menguji validitas diskriminan — apakah setiap konstruk benar-benar berbeda dari konstruk lainnya
Kriteria Fornell-Larcker: AVE setiap konstruk harus lebih besar dari kuadrat korelasi antara konstruk tersebut dengan konstruk lain mana pun

\[AVE_A > r^2_{AB} \quad \text{dan} \quad AVE_B > r^2_{AB}\]

Artinya: konstruk A berbagi lebih banyak varians dengan indikatornya sendiri daripada dengan konstruk B
Apabila kriteria ini tidak terpenuhi kemungkinan dua konstruk terlalu mirip dan tidak dapat dibedakan secara empiris

Cara membaca tabel Fornell-Larcker

Letakkan √AVE tiap konstruk di diagonal tabel korelasi antar-konstruk. Validitas diskriminan terpenuhi apabila nilai diagonal (√AVE) lebih besar dari semua nilai di baris dan kolom yang sama.

Menggunakan `semTools` untuk menghitung AVE

Setelah menjalankan model CFA, gunakan semTools::reliability() untuk menghitung AVE dan CR sekaligus:

library(lavaan); library(semTools)

fit <- cfa(model, data = data_anda, estimator = "MLR")

reliability(fit)

Menggunakan `semTools` untuk menghitung AVE

Output yang dihasilkan mencakup informasi berikut ini:

Baris output	Keterangan
`alpha`	Cronbach’s α (mengasumsikan tau equivalence)
`omega`	McDonald’s ω (congeneric)
`omega2` / `omega3`	Varian ω untuk model yang lebih kompleks
`ave`	AVE per faktor laten

jamovi menyediakan perhitungan AVE + composite reliability

Karena SEMLj juga menggunakan semTools, maka AVE tersedia bersama composite reliability.

Demonstrasi CFA

Unduh Dataset Contoh CFA

Latihan mandiri: Mencoba confirmatory factor analysis

Unduh Dataset Latihan
Unduh Kamus Data disini
Lakukan CFA pada skala social dominance orientation
- Diukur dengan skala Likert, 6 item dengan 7 pilihan jawaban
Laporkan model fit, factor loading, dan multivariate normality
Lakukan penyesuaian apabila perlu

Ada pertanyaan❓

Note

Paparan disusun dengan menggunakan dan Quarto dengan template dari UNAIR Theme.
Kontak saya via amelia.zein@psikologi.unair.ac.id

Confirmatory Factor Analysis (CFA)

Outline

Analisis faktor

EFA vs. CFA

Confirmatory factor analysis

Texas sharpshooter fallacy

Model Reflektif vs. Formatif

Model Reflektif

Model Formatif

Jenis-jenis model pengukuran

Model congeneric

Model tau equivalence

Model parallel

Constraining parameter model

Apa yang terjadi ketika error variance berkorelasi?

Skor faktor (factor scores)

Memilih metode estimasi

Average Variance Extracted (AVE)

AVE vs. Composite Reliability (CR)

Validitas Diskriminan

Menggunakan semTools untuk menghitung AVE

Menggunakan semTools untuk menghitung AVE

Demonstrasi CFA

Latihan mandiri: Mencoba confirmatory factor analysis

Ada pertanyaan❓

Menggunakan `semTools` untuk menghitung AVE

Menggunakan `semTools` untuk menghitung AVE