Topik 8 – Perbedaan Classification, Regression, Dan Time Series Association
Classification
Metode yang paling umum digunakan untuk penambangan data adalah Classification . Metode Classification biasanya digunakan dalam masalah bisnis seperti analisis churn dan manajemen risiko,classification akan melewati proses data yang bertujuan untuk mendapatkan data yang lebih akurasi.
Tindakan menugaskan grup untuk setiap keadaan dikenal sebagai Classification . Atribut kelas adalah salah satu dari sekelompok atribut yang ditemukan di setiap negara bagian. Metode ini membutuhkan pengembangan model yang dapat menjelaskan atribut kelas sebagai fungsi dari input.
Dalam Classification ada variabel kategori target dalam klasifikasi. Pengelompokan pendapatan, misalnya, dapat dikategorikan menjadi tiga bagian: berpenghasilan tinggi, berpenghasilan sedang, dan berpenghasilan rendah. Klasifikasi lain dalam korporasi dan penelitian meliputi:
- Identifikasi apakah transaksi kartu kredit tidak sah atau tidak.
- Mengetahui pelanggan-pelanggan perusahaan yang telah berpindah ke saingan perusahaan yang lain.
- Untuk menentukan penyakit apa yang diderita pasien, diagnosa penyakitnya.
Membantu teknik data mining seperti predictive modeling dengan menggunakan metode Classification Dari sejumlah nilai kelas opsi, fungsi ini digunakan untuk membuat perkiraan tamu awal tentang kelas tertentu untuk setiap record dalam database.
Regression
Metode Regression mirip dengan metode Classification , dengan pengecualian tidak dapat mencari struktur yang diklasifikasikan ke dalam kelas. Metode Regression mencari pola dan memberikan nilai numerik padanya.
Teknik regresi dapat digunakan untuk memprediksi masa depan. Hubungan antara satu atau lebih variabel bebas dan variabel terikat dapat dimodelkan dengan menggunakan analisis regresi. Variabel independen adalah karakteristik yang sudah diketahui dalam data mining, sedangkan variabel respon adalah yang ingin kita prediksi. Sayangnya, banyak masalah dunia nyata tidak bisa diramalkan secara sederhana. Sebagai contoh, Volume penjualan, harga saham, dan tingkat kegagalan produk, misalnya, semuanya sulit diramalkan karena interaksi yang kompleks antara berbagai variabel prediktor. Untuk memprediksi nilai masa depan, teknik yang lebih kompleks (misalnya, regresi logistik, pohon keputusan, atau jaringan saraf) mungkin diperlukan.Dalam hal regresi dan klasifikasi, jenis model yang sama sering digunakan. Algoritma pohon keputusan CART (Classification and Regression Trees), misalnya, dapat digunakan untuk membuat pohon klasifikasi (untuk mengkategorikan variabel respon kategorik) serta pohon regresi (untuk meramalkan variabel respon berkelanjutan).Jaringan saraf juga dapat membuat model klasifikasi dan regresi. Jenis metode regresi:
- Regresi Linier
- Regresi Linier Multivariate
- Regresi Nonlinear
- Regresi Non Linier Multivariat
Time Series Association
Time Series Association adalah Pola seperti keacakan, tren, pergeseran level, periode atau siklus, pengamatan yang tidak biasa, atau campuran pola dapat ditemukan. Setelah itu, pola umum dalam data deret waktu dibahas, bersama dengan contoh situasi yang mendorong pola tersebut.
Time Series analysis dapat dibagi menjadi cabang-cabang utama yaitu
Forecasting artinya meramalkan nilai masa depan berdasarkan pemahaman distribusi data sebelumnya yaitu mean, variance, skewness, dan kurtosis.
pemodelan dinamis. Cabang ini lebih relevan dalam konteks EKC( environmental kuznets curve ). Secara khusus, kami menguji hipotesis, menyelidiki hubungan ekonomi, dan memvalidasi teori ekonomi dalam cabang deret waktu ini. Ada dua arus utama di cabang ini, berdasarkan keputusan apakah ada hubungan jangka panjang atau tidak. Jika ada hubungan jangka panjang di antara variabel-variabel yang digarisbawahi, maka kita beralih ke model analisis kointegrasi dan koreksi kesalahan.
Referensi
https://www.stat.ipb.ac.id/en/uploads/KS/S2%20-%20ADW/3%20Montgomery%20-%20Introduction%20to
%20Time%20Series%20Analysis%20and%20Forecasting.pdf
https://core.ac.uk/download/pdf/229192374.pdf
https://www.itl.nist.gov/div898/handbook/pmc/section4/pmc4.htm
https://www.sciencedirect.com/science/article/abs/pii/S0360835212000253
https://www.researchgate.net/publication/329018412_Predictive_Modeling_Data_Mining_Regression_Tec hnique_Applied_in_a_Prototype