Confirmatory Factor Analysis (CFA)

Multigroup Structural Equation Modeling: Bagian 4️⃣

2026-04-09

Outline

  • Definisi factor analysis
  • Exploratory vs confirmatory factor analysis
  • Kapan menggunakan CFA?
  • Constraining parameter model
  • Model pengukuran (paralel, tau equivalence, dan congeneric)
  • Variabel indikator (reflektif vs formatif)
  • Correlated error variances
  • Metode estimasi
  • Menuliskan hasil analisis CFA dalam laporan penelitian

Analisis faktor

  • Awalnya dikembangkan oleh Charles Spearman (1904) untuk menyelidiki g factor theory of intelligence

  • Terdiri dari:

    • Exploratory factor analysis (EFA)
    • Confirmatory factor analysis (CFA)
  • Analisis faktor digunakan untuk menguji model common variance

  • Mengasumsikan bahwa dua atau lebih observed variable memiliki shared/common variance (commonality atau common factor) ditunjukkan dengan factor loading

EFA vs CFA

EFA CFA
Mencari model yang cocok menggambarkan data, sehingga peneliti mengeksplorasi berbagai pilihan model yang cocok kemudian mencari rasionalisasi teoritisnya Menguji hipotesis yang sudah ditentukan sebelumnya, sehingga peneliti ingin tahu apakah hipotesisnya didukung oleh data
Jumlah faktor belum diketahui sampai peneliti melakukan analisisnya Jumlah faktor sudah ditentukan sebelum mengambil data
Peneliti tidak memiliki model yang dihipotesiskan a priori Peneliti sudah memiliki model hipotesis yang ditentukan a priori

Confirmatory factor analysis

  • Menyediakan solusi untuk mengkoreksi bias karena measurement error ketika mengestimasi korelasi antar-variabel

  • Cara kerjanya adalah dengan membandingkan variance-covariance matrix yang dihipotesiskan dengan variance-covariance matrix pada data (sampel)

  • Perhatian 📢

    • Sangat tidak disarankan untuk melakukan EFA kemudian CFA pada sampel yang sama
    • Karena generating hypothesis dengan testing hypothesis adalah dua proses yang berbeda yang tidak seharusnya dilakukan pada sampel yang sama
    • Kalau hal tsb dilakukan, maka tentu saja peneliti akan mendapatkan hasil yang ‘sesuai prediksinya’
    • Ingat Texas Sharpshooter Fallacy

Texas sharpshooter fallacy

Constraining parameter model

  • Membatasi/menentukan varians untuk setiap variabel/faktor laten
    • Dilakukan untuk mengeluarkan standardized estimates
    • Factor loading di z-scorekan
    • Sehingga defaultnya, mean variabel laten = 0, variance = 1
  • Membatasi/menentukan error covariance untuk setiap variabel/faktor laten
    • Dilakukan untuk menentukan error variance

Jenis-jenis model pengukuran

Ada tiga macam model pengukuran:

  • Model congeneric
  • Model tau equivalence
  • Model parallel

Model congeneric

  • Model yang paling moderat dan default di berbagai perangkat lunak SEM
  • Asumsinya, skala, error variance, dan factor loading boleh berbeda (dibebaskan)
  • Koefisien reliabilitas skala yang mengasumsikan model pengukuran congeneric ω, McDonald’s ω, ω total (ωt), Revelle’s ω, composite reliability.

Model tau equivalence

  • Model yang sedikit lebih rigid daripada congeneric
  • Asumsinya, skala dan error variance boleh berbeda (dibebaskan), namun factor loading harus sama (dibatasi)
  • Ketika asumsi tau equivalence dipenuhi, maka Cronbach’s α dapat digunakan
  • Koefisien reliabilitas: Formula Rulon, KR-20, Flanagan-Rulon, Guttman’s λ3, λ4, Hoyt method
    • Pada kebanyakan kasus, jarang sekali ada kosntruk psikologi yang memenuhi asumsi tau equivalence, sehingga sangat disarankan untuk tidak menggunakan koefisien reliabilitas yang mengasumsikan tau equivalence

Model parallel

  • Model yang paling rigid
  • Asumsinya, skala, error variance, dan factor loading harus sama (dibatasi)
    • Koefisien reliabilitas: Spearman-Brown’s Formula, Standardized α.

Reflektif vs Formatif

  • Reflektif
    • Variabel laten menjelaskan mengapa variabel indikator bervariasi
    • Misalnya individu dengan intelegensi yang tinggi akan mendapatkan nilai yang berbeda dalam tes matematika
    • Biasanya mengasumsikan bahwa korelasi antar-variabel indikator = 0
  • Formatif
    • Variabel observed menjelaskan mengapa variabel laten bervariasi
    • Misalnya gengsi sebuah mobil ditentukan oleh usia mobil, kondisi, harga, dan intensitas pemakaian
    • Korelasi antara variabel observed tidak diketahui
    • Biasanya digunakan untuk menentukan indeks pada konstruk yang orthogonal (contoh kepribadian pada Five Factor model)

Model Reflektif

Model Formatif

Apa yang terjadi ketika error variance berkorelasi?

  • Kedua variabel indikator tersebut mengukur variabel laten lain di luar model (unique factor)
  • Bisa jadi karena ada item unfavourable dalam skala
  • Kemungkinan konstruk laten bukan konstruk tunggal (multidimensi)
  • Perhatikan justifikasi teori ketika menambah error covariance

Skor faktor (factor scores)

  • Apabila kita memiliki informasi tentang factor loading, maka kita bisa menghitung factor scores estimasi (fitted) skor variabel laten

  • Caranya dengan mengali factor loading dengan skor kasar metode regresi

  • Namun ingat, mengalikan factor loading dengan skor kasar masih berisiko mendapatkan estimasi yang bias. Itulah yang menyebabkan factor scores akan berubah ketika model diujikan pada kelompok sampel yang berbeda.

  • Ada tiga cara yang bisa digunakan untuk menghitung factor scores:

    • Metode Regresi dengan mengoptimalisasi validitas konstruk (variance explained)
    • Metode Bartlett mengasumsikan variabel indikator tidak saling berkorelasi
    • Metode Anderson-Rubin mengasumsikan variabel indikator saling berkorelasi

Memilih metode estimasi

  • Maximum Likelihood distribusi data (multivariate) normal, level pengukuran harus interval/continuous, tidak ada data missing

    • Gunakan Robust Maximum Likelihood (MLR) ketika asumsi multivariate normality tidak terpenuhi
  • Generalized-least squares menggunakan asumsi yang sama dengan ML namun performanya kurang baik apabila dibandingkan dengan ML

  • Weighted-least squares dapat digunakan pada data kategorikal (nominal dan ordinal), estimasi menggunakan polychoric correlation matrix. Varian WLS, misalnya: WLSM, WLSMV, WLSMVS.

  • Diagonally weighted-least squares dapat digunakan pada data kategorikal, bekerja dengan baik pada sampel yang relatif kecil dan data yang tidak berdistribusi normal

Tips memilih estimator

Untuk skala Likert dengan 6–7 pilihan, dengan respons yang relatif simetris, MLR sudah baik performanya. Untuk skala Likert 4 pilihan dengan distribusi yang sangat juling (skew), WLSMV merupakan pilihan yang lebih aman (Rhemtulla, Brosseau-Liard & Savalei, 2012).

Demonstrasi CFA

Unduh Dataset Contoh CFA

Latihan mandiri 4️⃣: Mencoba confirmatory factor analysis

  • Unduh Dataset Latihan SEM

  • Unduh Kamus Data disini

  • Lakukan CFA pada skala social dominance orientation

    • Diukur dengan skala Likert, 6 item dengan 7 pilihan jawaban
  • Laporkan model fit, factor loading, dan multivariate normality

  • Lakukan penyesuaian apabila perlu

Ada pertanyaan❓

Note