School of Information Systems

Supervised vs Unsupervised Learning

Machine learning adalah bidang ilmu komputer yang memungkinkan komputer untuk belajar tanpa harus diprogram secara eksplisit. Terdapat dua jenis utama machine learning: supervised learning dan unsupervised learning.

Supervised Learning

Supervised learning adalah jenis algoritma machine learning yang belajar dari data berlabel. Data berlabel adalah data yang telah ditandai dengan jawaban atau klasifikasi yang benar. Dalam supervised learning, mesin dilatih menggunakan data berlabel sehingga dapat memprediksi output untuk data input baru. Supervised learning sering digunakan untuk tugas-tugas seperti klasifikasi, regresi, dan deteksi objek.

Pada supervised learning, mesin diajarkan menggunakan data yang diberi label. Misalnya, dataset gambar hewan seperti gajah, unta, dan sapi, setiap gambar diberi label yang sesuai. Mesin kemudian menganalisis data latih dan menghasilkan hasil yang benar dari data berlabel tersebut. Setelah dilatih, mesin dapat membuat prediksi pada data baru yang belum diberi label.

Contoh supervised learning adalah mengidentifikasi buah dalam keranjang. Mesin pertama-tama menganalisis gambar untuk mengekstrak fitur seperti bentuk, warna, dan tekstur. Kemudian, membandingkan fitur-fitur ini dengan buah-buah yang telah dipelajari. Misalnya, jika gambar baru memiliki fitur yang paling mirip dengan apel, maka mesin akan memprediksi bahwa buah tersebut adalah apel.

Sumber: https://www.geeksforgeeks.org/supervised-unsupervised-learning/

Jenis-Jenis Supervised Learning

Supervised learning terbagi menjadi dua kategori algoritma: regresi dan klasifikasi.

  1. Regresi: Digunakan untuk memprediksi nilai kontinu, seperti harga rumah atau harga saham. Algoritma regresi belajar dari fitur input untuk memetakan nilai output.
    • Algoritma regresi yang umum: Linear Regression, Polynomial Regression, Support Vector Machine Regression, Decision Tree Regression, Random Forest Regression.
  1. Klasifikasi: Digunakan untuk memprediksi nilai kategorikal, seperti apakah email termasuk spam atau bukan. Algoritma klasifikasi memetakan fitur input ke distribusi probabilitas dari kelas output.
    • Algoritma klasifikasi yang umum: Logistic Regression, Support Vector Machines, Decision Trees, Random Forests, Naive Bayes.

Keuntungan Supervised Learning

  • Menghasilkan output data dari pengalaman sebelumnya.
  • Membantu mengoptimalkan kriteria kinerja berdasarkan pengalaman.
  • Menyelesaikan berbagai masalah komputasi dunia nyata.
  • Melakukan tugas klasifikasi dan regresi.

Kekurangan Supervised Learning

  • Memerlukan banyak waktu dan komputasi untuk pelatihan.
  • Sulit menangani data besar.
  • Tidak dapat menangani semua tugas kompleks dalam machine learning.

Unsupervised Learning

Sumber: https://www.geeksforgeeks.org/supervised-unsupervised-learning/

Unsupervised learning adalah jenis machine learning yang belajar dari data tidak berlabel. Data tidak berlabel berarti data tidak memiliki label atau kategori yang telah ada sebelumnya. Tujuan unsupervised learning adalah menemukan pola dan hubungan dalam data tanpa panduan eksplisit.

Unsupervised learning melibatkan mesin dalam mengelompokkan informasi yang tidak terurut berdasarkan kesamaan, pola, dan perbedaan tanpa pelatihan sebelumnya. Algoritma ini sering digunakan untuk tugas-tugas seperti clustering dan asosiasi.

Jenis-Jenis Unsupervised Learning

Unsupervised learning terbagi menjadi dua kategori algoritma: clustering dan association.

  1. Clustering: Digunakan untuk mengelompokkan data yang serupa. Contoh algoritma clustering: Hierarchical clustering, K-means clustering, Principal Component Analysis (PCA).
  2. Association: Digunakan untuk mengidentifikasi pola dalam data. Contoh algoritma association: Apriori Algorithm, Eclat Algorithm, FP-Growth Algorithm.

Keuntungan Unsupervised Learning

  • Tidak memerlukan data berlabel.
  • Mampu menemukan pola yang tidak diketahui sebelumnya dalam data.
  • Membantu dalam pengurangan dimensi data.

Kekurangan Unsupervised Learning

  • Sulit mengukur akurasi atau efektivitas.
  • Hasilnya sering kurang akurat.
  • Sensitif terhadap kualitas data, termasuk nilai yang hilang dan data yang bising.

 

Sumber:

https://www.ibm.com/think/topics/supervised-vs-unsupervised-learning

https://www.geeksforgeeks.org/supervised-unsupervised-learning/

https://medium.com/@byanalytixlabs/supervised-vs-ee0e856505ee

Yulia Ery Kurniawati