Confirmatory Factor Analysis (CFA)

Multigroup Structural Equation Modeling: Bagian 4️⃣

2026-05-11

Outline

  • Definisi factor analysis
  • Exploratory vs confirmatory factor analysis
  • Kapan menggunakan CFA?
  • Constraining parameter model
  • Model pengukuran (paralel, tau equivalence, dan congeneric)
  • Variabel indikator (reflektif vs formatif)
  • Correlated error variances
  • Metode estimasi
  • Average Variance Extracted (AVE) dan validitas diskriminan
  • Menuliskan hasil analisis CFA dalam laporan penelitian

Analisis faktor

  • Awalnya dikembangkan oleh Charles Spearman (1904) untuk menyelidiki g factor theory of intelligence

  • Terdiri dari:

    • Exploratory factor analysis (EFA)
    • Confirmatory factor analysis (CFA)
  • Analisis faktor digunakan untuk menguji model common variance

  • Mengasumsikan bahwa dua atau lebih observed variable memiliki shared/common variance (commonality atau common factor) ditunjukkan dengan factor loading

EFA vs. CFA

Exploratory Factor Analysis Confirmatory Factor Analysis
Mencari model yang cocok menggambarkan data, sehingga peneliti mengeksplorasi berbagai pilihan model yang cocok kemudian mencari rasionalisasi teoritisnya Menguji hipotesis yang sudah ditentukan sebelumnya, sehingga peneliti ingin tahu apakah hipotesisnya didukung oleh data
Jumlah faktor belum diketahui sampai peneliti melakukan analisisnya Jumlah faktor sudah ditentukan sebelum mengambil data
Peneliti tidak memiliki model yang dihipotesiskan a priori Peneliti sudah memiliki model hipotesis yang ditentukan a priori

Confirmatory factor analysis

  • Menyediakan solusi untuk mengkoreksi bias karena measurement error ketika mengestimasi korelasi antar-variabel

  • Cara kerjanya adalah dengan membandingkan variance-covariance matrix yang dihipotesiskan dengan variance-covariance matrix pada data (sampel)

  • Perhatian 📢

    • Sangat tidak disarankan untuk melakukan EFA kemudian CFA pada sampel yang sama
    • Karena generating hypothesis dengan testing hypothesis adalah dua proses yang berbeda yang tidak seharusnya dilakukan pada sampel yang sama
    • Kalau hal tsb dilakukan, maka tentu saja peneliti akan mendapatkan hasil yang ‘sesuai prediksinya’
    • Ingat Texas Sharpshooter Fallacy

Texas sharpshooter fallacy

Constraining parameter model

  • Membatasi/menentukan varians untuk setiap variabel/faktor laten
    • Dilakukan untuk mengeluarkan standardized estimates
    • Factor loading di z-scorekan
    • Sehingga defaultnya, mean variabel laten = 0, variance = 1
  • Membatasi/menentukan error covariance untuk setiap variabel/faktor laten = 0
    • Dilakukan agar error variance bebas diestimasi

Jenis-jenis model pengukuran

Ada tiga macam model pengukuran:

  • Model congeneric
  • Model tau equivalence
  • Model parallel

Model congeneric

  • Model yang paling moderat dan default di berbagai perangkat lunak SEM
  • Asumsinya, skala, error variance, dan factor loading boleh berbeda (dibebaskan)
  • Koefisien reliabilitas skala yang mengasumsikan model pengukuran congeneric ω, McDonald’s ω, ω total (ωt), Revelle’s ω, composite reliability.

Model tau equivalence

  • Model yang sedikit lebih rigid daripada congeneric
  • Asumsinya, skala dan error variance boleh berbeda (dibebaskan), namun factor loading harus sama (dibatasi)
  • Ketika asumsi tau equivalence dipenuhi, maka Cronbach’s α dapat digunakan
  • Koefisien reliabilitas: Formula Rulon, KR-20, Flanagan-Rulon, Guttman’s λ3, λ4, Hoyt method
    • Pada kebanyakan kasus, jarang sekali ada kosntruk psikologi yang memenuhi asumsi tau equivalence, sehingga sangat disarankan untuk tidak menggunakan koefisien reliabilitas yang mengasumsikan tau equivalence

Model parallel

  • Model yang paling rigid
  • Asumsinya, skala, error variance, dan factor loading harus sama (dibatasi)
    • Koefisien reliabilitas: Spearman-Brown’s Formula, Standardized α.

Model Reflektif vs. Formatif

  • Reflektif
    • Variabel laten menjelaskan mengapa variabel indikator bervariasi
    • Misalnya individu dengan intelegensi yang tinggi akan mendapatkan nilai yang berbeda dalam tes matematika
    • Biasanya mengasumsikan bahwa kovariansi antar-error (residual) variabel indikator = 0 (local independence) artinya, korelasi antar-indikator sepenuhnya dijelaskan oleh variabel laten, tidak ada sumber varians bersama lain di luar model
    • Mayoritas konstruk psikologis mengasumsikan model pengukuran reflektif
  • Formatif
    • Variabel observed menjelaskan mengapa variabel laten bervariasi
    • Misalnya gengsi sebuah mobil ditentukan oleh usia mobil, kondisi, harga, dan intensitas pemakaian
    • Korelasi antara variabel observed tidak diketahui
    • Biasanya digunakan untuk menentukan indeks pada konstruk yang orthogonal (contoh contohnya, adverse childhood experience)
    • Tetapi, sangat jarang konstruk psikologi yang mengasumsikan model formatif

Model Reflektif

Model Formatif

Apa yang terjadi ketika error variance berkorelasi?

  • Kedua variabel indikator tersebut mengukur variabel laten lain di luar model (unique factor)
  • Bisa jadi karena ada item unfavourable dalam skala
  • Kemungkinan konstruk laten bukan konstruk tunggal (multidimensi)
  • Perhatikan justifikasi teori ketika menambah error covariance

Skor faktor (factor scores)

  • Apabila kita memiliki informasi tentang factor loading, maka kita bisa menghitung factor scores estimasi (fitted) skor variabel laten

  • Caranya dengan mengali factor loading dengan skor kasar metode regresi

  • Namun ingat, mengalikan factor loading dengan skor kasar masih berisiko mendapatkan estimasi yang bias. Itulah yang menyebabkan factor scores akan berubah ketika model diujikan pada kelompok sampel yang berbeda.

  • Ada tiga cara yang bisa digunakan untuk menghitung factor scores:

    • Metode Regresi dengan mengoptimalisasi validitas konstruk (variance explained)
    • Metode Bartlett mengasumsikan variabel indikator tidak saling berkorelasi
    • Metode Anderson-Rubin mengasumsikan variabel indikator saling berkorelasi

Memilih metode estimasi

  • Maximum Likelihood distribusi data (multivariate) normal, level pengukuran harus interval/continuous, tidak ada data missing

    • Gunakan Robust Maximum Likelihood (MLR) ketika asumsi multivariate normality tidak terpenuhi
  • Generalized-least squares menggunakan asumsi yang sama dengan ML namun performanya kurang baik apabila dibandingkan dengan ML

  • Weighted-least squares dapat digunakan pada data kategorikal (nominal dan ordinal), estimasi menggunakan polychoric correlation matrix. Varian WLS, misalnya: WLSM, WLSMV, WLSMVS.

  • Diagonally weighted-least squares dapat digunakan pada data kategorikal, bekerja dengan baik pada sampel yang relatif kecil dan data yang tidak berdistribusi normal

Tips memilih estimator

Untuk skala Likert dengan 6–7 pilihan, dengan respons yang relatif simetris, MLR sudah baik performanya. Untuk skala Likert 4 pilihan dengan distribusi yang sangat juling (skew), WLSMV merupakan pilihan yang lebih aman (Rhemtulla, Brosseau-Liard & Savalei, 2012).

Average Variance Extracted (AVE)

  • AVE mengukur seberapa besar varians pada variabel indikator yang dijelaskan oleh faktor laten, dibandingkan dengan varians yang berasal dari error

  • Formula AVE (dengan λᵢ = standardized factor loading tiap indikator):

\[AVE = \frac{\sum \lambda_i^2}{\sum \lambda_i^2 + \sum (1 - \lambda_i^2)}\]

  • Intinya: dari seluruh varians indikator, berapa proporsinya yang merupakan benar-benar “sinyal” dari konstruk dan bukan noise?

  • Kriteria AVE ≥ 0.50 (Fornell & Larcker, 1981)

    • AVE < 0.50 berarti error variance lebih besar daripada construct variance validitas konvergen tidak terpenuhi

AVE vs. Composite Reliability (CR)

AVE CR
Yang diukur Rasio sinyal-terhadap-total per indikator Konsistensi internal skala
Sensitif terhadap Loading rendah sangat menekan nilai AVE Kurang sensitif — loading tinggi dapat mengompensasi
Kriteria ≥ 0.50 ≥ 0.70
Kegunaan utama Validitas konvergen & diskriminan Reliabilitas (alternatif Cronbach’s α)

CR tinggi belum tentu AVE tinggi

Skala dengan loading sedang (misalnya semua λ = 0.60, 5 item) bisa menghasilkan CR ≈ 0.78 namun AVE ≈ 0.36. CR fokus pada “apakah item-item saling berkaitan?”; AVE fokus pada “apakah item-item benar-benar mewakili konstruknya?”

Validitas Diskriminan

  • Selain validitas konvergen, AVE juga digunakan untuk menguji validitas diskriminan — apakah setiap konstruk benar-benar berbeda dari konstruk lainnya

  • Kriteria Fornell-Larcker: AVE setiap konstruk harus lebih besar dari kuadrat korelasi antara konstruk tersebut dengan konstruk lain mana pun

\[AVE_A > r^2_{AB} \quad \text{dan} \quad AVE_B > r^2_{AB}\]

  • Artinya: konstruk A berbagi lebih banyak varians dengan indikatornya sendiri daripada dengan konstruk B

  • Apabila kriteria ini tidak terpenuhi kemungkinan dua konstruk terlalu mirip dan tidak dapat dibedakan secara empiris

Cara membaca tabel Fornell-Larcker

Letakkan √AVE tiap konstruk di diagonal tabel korelasi antar-konstruk. Validitas diskriminan terpenuhi apabila nilai diagonal (√AVE) lebih besar dari semua nilai di baris dan kolom yang sama.

Menggunakan semTools untuk menghitung AVE

Setelah menjalankan model CFA, gunakan semTools::reliability() untuk menghitung AVE dan CR sekaligus:

library(lavaan); library(semTools)

fit <- cfa(model, data = data_anda, estimator = "MLR")

reliability(fit)

Menggunakan semTools untuk menghitung AVE

Output yang dihasilkan mencakup informasi berikut ini:

Baris output Keterangan
alpha Cronbach’s α (mengasumsikan tau equivalence)
omega McDonald’s ω (congeneric)
omega2 / omega3 Varian ω untuk model yang lebih kompleks
ave AVE per faktor laten

jamovi menyediakan perhitungan AVE + composite reliability

Karena SEMLj juga menggunakan semTools, maka AVE tersedia bersama composite reliability.

Demonstrasi CFA

Unduh Dataset Contoh CFA

Latihan mandiri: Mencoba confirmatory factor analysis

  • Unduh Dataset Latihan SEM

  • Unduh Kamus Data disini

  • Lakukan CFA pada skala social dominance orientation

    • Diukur dengan skala Likert, 6 item dengan 7 pilihan jawaban
  • Laporkan model fit, factor loading, dan multivariate normality

  • Lakukan penyesuaian apabila perlu

Ada pertanyaan❓

Note