Confusion Matrix
Menurut Sofia,et al (2011), untuk menganalisis dan mengukur seberapa efektif suatu model klasifikator dapat memprediksi hasil klasifikasi dengan benar pada jumlah kelas yang banyak. Confusion Matrix menyimpulkan performa klasifikasi dari classifier dengan test data. Confusion Matrix merupakan matrix dengan 2 dimensi; 1 dimensi berupa data yang tepat dari satu objek, dan dimensi yang lain berupa kelas yang ditentukan oleh classifier.
Confusion Matrix pada klasifikasi dengan 2 kelas ditunjukkan dalam gambar dibawah ini. Dari tabel tersebut, bisa diambil kesimpulan bahwa ada 4 kemungkinan hasil klasifikasi. Hasil positif dan negatif yang benar adalah klasifikasi yang benar, sementara hasil positif dan negatif yang salah adalah kemungkinan tipe error yang berkemungkinan terjadi. Berikut penjelasan mengenai variable:
- a mewakilkan jumlah prediksi yang benar jika kejadian tersebut adalah negative atau true negative
- b mewakilkan jumlah prediksi yang salah jika kejadian tersebut adalah positif false positive
- c mewakilkan jumlah prediksi yang salah jika kejadian tersebut adalah negative atau false negative
- d mewakilkan jumlah prediksi yang salah jika kejadian tersebut adalah negative atau false negative
Menurut Takaya Saito dan Marc Rehmsmeier(2015), jika ada 2 kelas dalam sebuah matrik maka diperlukan beberapa istilah, yaitu accuracy, true positive rate, false positive rate, true negative rate, false negative rate, precision, dan f-measure.
- Accuracy, adalah perbandingan keberhasilan dari hasil yang benar sesuai dengan prediksi dan kejadian di antara jumlah kejadian yang diperiksa kebenarannya.
- True positive rate (recall), adalah perbandingan kejadian positif yang benar prediksinya, dibandingkan dengan jumlah kejadian yang benar positif.
- False positive rate, adalah perbandingan dari kejadian negatif yang tidak sesuai dengan prediksi sehingga diklasifikasikan sebagai positif.
- True negative rate, didefinisikan sebagai perbandingan kejadian negatif yang diprediksi dan diklasifikasikan dengan benar,
- False negative, adalah perbandingan kejadian positif yang salah diprediksi dan diklasifikasikan sebagai kejadian negative.
- Precision Precision menyajikan data dengan benar berdasarkan total kejadian dan prediksi yang benar
Referensi:
Saito, Takaya, and Marc Rehmsmeier. 2015. “The Precision-Recall Plot Is More Informative Than the Roc Plot When Evaluating Binary Classifiers on Imbalanced Datasets.” PloS One 10 (3): e0118432.
Sofia Visa, Brian Ramsay, Anca Ralescu, Esther van der Knaap, “Confusion Matrix-based Feature Selection,” CEUR Workshop Proceefings, pp. 120-127, 2011