Memahami Regresi Poisson

Regresi Poisson adalah jenis model statistik yang digunakan untuk memprediksi jumlah kejadian yang terjadi dalam periode waktu atau ruang tertentu. Model ini sangat berguna ketika data melibatkan hitungan yang mengikuti distribusi Poisson, yang ditandai dengan mean sama dengan variansnya. Model ini banyak digunakan di bidang seperti epidemiologi, asuransi, dan ekologi, di mana variabel hasil adalah hitungan.
Dasar-dasar Regresi Poisson
Model regresi Poisson didefinisikan oleh persamaan:
log(λ) = β0 + β1X1 + β2X2 + … + βnXn
Di mana:
λ adalah perkiraan jumlah kejadian.
β0 adalah intersep.
β1, β2, …, βn adalah koefisien untuk variabel prediktor X1, X2, …, Xn.
Fungsi tautan log memastikan bahwa prediksi jumlah kejadian tidak negatif, yang merupakan persyaratan untuk data hitungan.
Contoh Regresi Poisson
Pertimbangkan dataset di mana seorang peneliti mempelajari jumlah kecelakaan lalu lintas di berbagai persimpangan di sebuah kota. Variabel prediktor mungkin termasuk volume lalu lintas, jumlah lajur, dan keberadaan lampu lalu lintas.
Dataset:
Persimpangan | Volume Lalu Lintas | Jumlah Lajur | Lampu Lalu Lintas | Kecelakaan
1 | 2000 | 2 | Ya | 3
2 | 1500 | 3 | Tidak | 1
3 | 3000 | 4 | Ya | 5
4 | 2500 | 2 | Tidak | 2
Pemasangan Model
Dengan menggunakan perangkat lunak statistik, kita dapat memasang model regresi Poisson ke data ini. Model tersebut mungkin terlihat seperti ini:
log(λ) = β0 + β1 × Volume Lalu Lintas + β2 × Jumlah Lajur + β3 × Lampu Lalu Lintas
Interpretasi
Misalkan model yang terpasang menghasilkan koefisien sebagai berikut:
β0 = 0,5
β1 = 0,0003
β2 = 0,2
β3 = −0,1
Interpretasi dari koefisien ini adalah sebagai berikut:
Untuk setiap peningkatan satu unit dalam volume lalu lintas, log dari perkiraan jumlah kecelakaan meningkat sebesar 0,0003, dengan variabel lainnya tetap konstan.
Setiap tambahan lajur meningkatkan log dari perkiraan jumlah kecelakaan sebesar 0,2.
Keberadaan lampu lalu lintas menurunkan log dari perkiraan jumlah kecelakaan sebesar 0,1.
Visualisasi
Gambar 1: Kecelakaan yang Diprediksi vs. Aktual
Gambar ini menunjukkan jumlah kecelakaan yang diprediksi melawan jumlah kecelakaan aktual untuk setiap persimpangan. Model yang baik akan memiliki poin yang mendekati garis kesetaraan.
Gambar 2: Pengaruh Volume Lalu Lintas
Grafik ini menggambarkan bagaimana perkiraan jumlah kecelakaan berubah dengan volume lalu lintas, dengan variabel lainnya tetap konstan. Kurva menunjukkan sifat eksponensial dari model regresi Poisson.
Keuntungan dan Keterbatasan
Keuntungan:
Menangani Data Hitungan: Regresi Poisson dirancang khusus untuk data hitungan, menjadikannya lebih tepat daripada regresi linier untuk dataset semacam itu.
Koefisien yang Dapat Diinterpretasikan: Koefisien dapat dengan mudah diinterpretasikan dalam hal log dari perkiraan hitungan, yang dapat diubah kembali ke skala asli.
Keterbatasan:
Overdispersi: Jika varians data lebih besar dari mean, model mungkin tidak sesuai. Dalam kasus seperti itu, regresi binomial negatif mungkin lebih tepat.
Inflasi Nol: Jika ada lebih banyak nol dalam data daripada yang diharapkan, model dengan inflasi nol mungkin diperlukan.
Kesimpulan
Regresi Poisson adalah alat yang kuat untuk memodelkan data hitungan, memberikan wawasan tentang hubungan antara variabel prediktor dan perkiraan jumlah kejadian. Dengan memahami asumsi dan keterbatasannya, peneliti dapat secara efektif menerapkan model ini pada berbagai masalah praktis. Seperti metode statistik lainnya, pertimbangan yang cermat terhadap data dan konteks sangat penting untuk memastikan hasil yang akurat dan bermakna.