Mengenal Algoritma Naïve Bayes
Naïve bayes adalah sebuah alat/metode untuk melakukan klasifikasi yang berakar pada teori probabilitas dan statistic yang ditemukan oleh ilmuan asal inggris yaitu thomas bayes. Ciri khas dari naïve bayes adalah metode klasifier ini memiliki asumsi yang kuat terhadap independensi dari masing-masing kondisi / kejadian. Pada metode naïve bayes, setiap kelas keputusan akan menghitung probabilitas dengan syarat bahwa kelas keputusan tersebut benar dan juga metode ini mengasumsikan bahwa atribut objek adalah pelaku independen.
Untuk mengenal lebih jauh lagi pada algoritma naïve bayes, berikut adalah parameter yang dapat dikonfigurasikan pada algoritma naïve bayes :
- Laplace_correction : Parameter ini menunjukkan apakah koreksi Laplace harus digunakan untuk mencegah pengaruh probabilitas nol yang tinggi. Ada trik sederhana untuk menghindari probabilitas nol. Kita dapat berasumsi bahwa set pelatihan kita sangat besar sehingga menambahkan satu ke setiap hitungan yang kita butuhkan hanya akan membuat perbedaan yang dapat diabaikan dalam perkiraan probabilitas, namun akan menghindari kasus nilai probabilitas nol. Teknik ini dikenal sebagai koreksi Laplace. Parameter ini memiliki range nilai Boolean.
- Estimation_mode : Parameter ini menentukan mode estimasi kepadatan kernel. Tersedia dua pilihan.
- Option penuh: Jika opsi ini dipilih, Anda dapat memilih bandwidth melalui heuristik atau bandwidth tetap dapat ditentukan.
- Option serakah: Jika opsi ini dipilih, Anda harus menentukan bandwidth minimum dan jumlah kernel.
- Bandwith_selection : Parameter ini hanya tersedia bila parameter mode estimasi diatur ke ‘penuh’. Parameter ini menentukan metode untuk mengatur bandwidth kernel. Bandwidth dapat dipilih melalui heuristik atau bandwidth fix dapat ditentukan. Harap dicatat bahwa bandwidth kernel adalah parameter bebas yang menunjukkan pengaruh kuat pada perkiraan yang dihasilkan. Penting untuk memilih bandwidth yang paling tepat karena nilai yang terlalu kecil atau terlalu besar tidak berguna.
- Bandwidth : Parameter ini hanya tersedia bila parameter mode estimasi diatur ke ‘penuh’ dan parameter pemilihan bandwidth diatur ke ‘perbaiki’. Parameter ini menentukan bandwidth kernel.
- Minimum_bandwidth : Parameter ini hanya tersedia bila parameter mode estimasi diatur ke ‘serakah’. Parameter ini menentukan bandwidth kernel minimum.
- Number_of_kernel : Parameter ini hanya tersedia bila parameter mode estimasi diatur ke ‘serakah’. Parameter ini menentukan jumlah kernel.
- Use_application_grid : Parameter ini menunjukkan apakah kisi fungsi kepadatan kernel harus digunakan dalam aplikasi model. Ini mempercepat aplikasi model dengan mengorbankan presisi fungsi kepadatan.
- Application_grid_size : Parameter ini hanya tersedia bila parameter grid aplikasi penggunaan disetel ke true. Parameter ini menentukan ukuran kisi aplikasi.
References : https://scikit-learn.org/stable/modules/naive_bayes.html