The Role of Normality in SEM (Kumpulan tulisan tentang Statistik)
Metodologi Structural Equation Model, yang lebih sering disebut sebagai SEM, merupakan metode analisis penting yang diterapkan tidak hanya dalam domain ilmu sosial, psikologi, dan penelitian bisnis, tetapi juga di bidang sistem informasi. Analisis statistik semacam ini sangat berguna untuk mempelajari hubungan antar variable baik observed maupun unobserved dengan model yang cukup kompleks untuk menjelaskan suatu phenomena. Misalnya, penelitian yang bertujuan untuk menjelaskan faktor-faktor yang mempengaruhi kepuasan penggunaan suatu teknologi. Saat melakukan penelitian yang menganalisis dampak teknologi terhadap tindakan manusia dan organisasi, tidak jarang kita menemukan hubungan seperti ini. Dalam SEM, penting untuk mempertimbangkan normalitas data (Joseph Hair et al., 2019) sebagai bagian dari data preparation sebelum mengambil keputusan apakah akan menggunakan pendekatan statistik parametrik atau non-parametrik. Keandalan dan keakuratan kesimpulan yang diperoleh dari penelitian ini mungkin dipengaruhi secara signifikan oleh keputusan ini, yang mungkin berdampak besar.
Normalitas sendiri berhubungan dengan bentuk distribusi data serta karateristik statistiknya untuk suatu indicator individu dari suatu variable (Joseph Hair et al., 2019). Menurut (Goodhue et al., 2012), distribusi normal ditandai dengan bentuk kurva lonceng dan dipengaruhi oleh sebaran serta besar kecilnya sampel. Normalitas berdampak pada kehandalan (robustness) estimasi model. Ketika data terdistribusi secara normal, estimasi dan kesalahan standar cenderung lebih akurat, sehingga menghasilkan pengujian signifikansi yang lebih andal.
Sebagai representasi distribusi normal digunakan kurva berbentuk lonceng. Normalitas distribusi data ini sangat berpengaruh pada metode parametrik dalam SEM yang menyandarkan pada asumsi distribusi normal. Jika asumsi benar, metode ini sangat bermanfaat untuk menghasilkan perkiraan yang efektif dan tidak bias. Meskipun memerlukan kondisi normalitas yang ketat, metode parametrik SEM yang paling popular, utamanya untuk menguji hipotesis secara konfirmatori. Teknik ini juga dikenal dengan istilah CB-SEM (Covariate Based SEM) dengan beberapa tools yang cukup popular, seperti LISREL dan AMOS. Sebaliknya metode non-parametrik merupakan teknik yang lebih fleksibel dan berfokus pada pemaksimalan varian yang dijelaskan dari variabel dependen. Pendekatan ini tidak mengasumsikan distribusi normal dan cenderung lebih robust terhadap pelanggaran asumsi ini. Istilah PLS-SEM digunakan untuk menyatakan metode non-parametrik dan lebih cocok untuk penelitian eksploratif, model dengan kompleksitas tinggi, dan situasi di mana peneliti lebih tertarik pada prediksi daripada pengujian hubungan struktural ketat. Oleh karenanya distribusi data ini perlu diperiksa untuk memastikan normalitasnya.
Ada beberapa teknik yang dapat digunakan untuk pengujian ini seperti yang telah di-summary oleh Vaithilingam et al. (2024) baik menggunakan inspeksi visual maupun uji statistik. Dalam laporan tersebut uji skewness dan kurtosis paling banyak digunakan oleh para peneliti. Skewness mengukur asimestris distribusi data dimana nilai skewness di sekitar 0 menunjukkan distribusi simetris, sementara nilai yang jauh dari 0 menunjukkan distribusi miring ke kiri atau kanan. Sedangkan kurtosis mengukur puncak distribusi data. Selain itu, Uji Kolmogorov-Smirnov merupan uji statistic yang membandingkan distribusi kumulatif data dengan distribusi normal. Uji ini lebih cocok untuk sampel besar. Jika nilai p dari uji ini signifikan (biasanya p < 0,05), maka data tidak mengikuti distribusi normal. Atau dapat menggunakan visual graphis dengan histogram ataupun teknik Q-Q Plot. Q-Q plot adalah alat yang sederhana namun kuat untuk memeriksa normalitas data dan merupakan bagian penting dari analisis statistik eksploratif.
Pertanyaan menariknya, bagaimana jika distribusi data tidak normal. Ada beberapa opsi untuk menangani distribusi data yang tidak normal. Opsi pertama adalah melakukan uji parametrik dengan data tidak normal dengan asumsi normalitas. JF Hair et al. (2010) berpendapat bahwa sedikit penyimpangan dari normalitas dapat mengakibatkan sedikit ketidakakuratan dalam uji parametrik. Opsi kedua adalah melakukan pengujian nonparametrik untuk data nonnormal. Uji non-parametrik tidak mengasumsikan distribusi data yang spesifik, meskipun uji tersebut mungkin kurang kuat dibandingkan dengan uji parametrik (Joseph Hair et al., 2017). Opsi ketiga adalah menerapkan transformasi data sebagai solusi untuk mengubah data agar mendapatkan distribusi normal. Pada pilihan ini, proses transformasi menggunakan banyak fungsi matematika (seperti akar kuadrat, logaritma atau archine) untuk mendapatkan data berdistribusi normal. Opsi keempat adalah menerapkan pemodelan persamaan struktural berbasis varian seperti PLS (Joseph Hair et al., 2017).
Pemeriksaan normalitas data pada tahap persiapan data merupakan langkah krusial sebelum menentukan teknik analisis yang akan digunakan dalam Structural Equation Model (SEM). Normalitas data memengaruhi keandalan dan keakuratan hasil estimasi model. Teknik seperti uji skewness dan kurtosis, uji Kolmogorov-Smirnov, dan metode grafis seperti histogram dan Q-Q plot sangat penting untuk mengevaluasi normalitas data. Mengetahui apakah data berdistribusi normal membantu dalam memilih antara pendekatan parametrik yang lebih efisien namun sensitif terhadap penyimpangan, atau pendekatan non-parametrik yang lebih fleksibel dan robust terhadap pelanggaran asumsi normalitas. Oleh karena itu, memeriksa normalitas data adalah langkah awal yang vital dalam memastikan validitas dan integritas analisis SEM.
Refences:
Goodhue, D. L., Lewis, W., & Thompson, R. (2012). DOES PLS HAVE ADVANTAGES FOR SMALL SAMPLE SIZE OR NON-NORMAL DATA? MIS Quarterly, 36(3), 981-A916.
Hair, J., Black, W., Babin, B., & Anderson, R. (2010). Multivariate data analysis (Vol. 7). Upper Saddle River, NJ: Pearson Prentice Hall.
Hair, J., Matthews, L., Matthews, R., & Sarstedt, M. (2017). PLS-SEM or CB-SEM: updated guidelines on which method to use. International Journal of Multivariate Data Analysis, 1(2), 107-123.
Hair, J., Risher, J., Sarstedt, M., & Ringle, C. (2019). When to use and how to report the results of PLS-SEM. European business review, 31(1), 2-24. doi:https://doi.org/10.1108/EBR-11-2018-0203
Vaithilingam, S., Ong, C. S., Moisescu, O. I., & Nair, M. S. (2024). Robustness checks in PLS-SEM: A review of recent practices and recommendations for future applications in business research. Journal of business research, 173, 114465.