Pernahkah kamu bertanya-tanya bagaimana caranya AI bisa memiliki kemampuan untuk mengenali wajah, menerjemahkan bahasa, bahkan menjadi juru jawaban saat kita sedang memiliki pertanyaan? Jawabannya cukup sederhana, yaitu belajar. Namun bagaimana cara AI belajar selayaknya kita sebagai manusia yang dapat belajar. Menariknya AI dapat dengan mudah untuk mempelajari sesuatu dengan adanya “Data”. Tapi, sebenarnya berapa banyak data yang AI perlukan agar ia bisa menjadi pintar dan menjadi model yang baik.

Bayangkan seorang anak kecil yang sedang belajar mengenali hewan. Pada awalnya, ia mungkin hanya melihat beberapa gambar anjing dan kucing. Semakin sering ia melihat berbagai jenis hewan dengan bentuk, warna, dan ukuran berbeda, semakin tajam kemampuannya membedakan mana anjing, mana kucing, dan mana kelinci. Proses belajar seperti ini  perlahan mengenali pola dari pengalaman adalah cerminan sederhana dari bagaimana kecerdasan buatan (AI) bekerja. Bedanya, AI tidak belajar dari pengalaman hidup, melainkan dari data. 

Data merupakan asupan makanan bagi AI 

Bagi AI, data adalah bahan bakar sekaligus guru. Setiap gambar, teks, atau potongan suara yang dimasukkan ke dalam sistem menjadi contoh pembelajaran. Model machine learning mempelajari pola dari data tersebut agar mampu membuat prediksi baru. Misalnya, untuk melatih sistem pengenal wajah, dibutuhkan ribuan bahkan jutaan foto dengan beragam ekspresi, pencahayaan, dan sudut pandang agar model dapat mengenali wajah manusia secara akurat. 

Namun, proses ini bukan sekadar tentang memberi “sebanyak mungkin” data. Sama seperti manusia, AI juga membutuhkan variasi dan konteks. Jika data yang diberikan hanya berisi gambar wajah dari satu kelompok ras atau usia tertentu, maka AI akan kesulitan mengenali wajah di luar kelompok itu. Dengan kata lain, data yang banyak tetapi tidak beragam hanya membuat AI “cerdas secara sempit”. 

Apakah Banyak Data, Membuat Model AI yang lebih hebat? 

Terdapat asumsi bahwa, jika lebih banyak data yang digunakan untuk membuat Model Machine Learning untuk belajar, sama dengan Model tersebut akan menjadi lebih pintar dan lebih hebat. Kenyataannya, setelah model telah mempelajari banyak data yang membuat model tersebut cukup akurat dan baik, penambahan data bisa menjadi pisau bermata dua. Hal ini bisa membuat penambahan data membuat model tersebut lebih buruk, dikarenakan oleh penambahan data yang tidak berkualitas (tidak bermakna, tidak beragam, banyak outlier, dll) dan merusak model yang sebelumnya sudah baik.  

Kesimpulan 

Jadi, seberapa banyak data yang diperlukan agar AI bisa belajar dengan baik? Tidak ada angka pasti. Semua tergantung pada kompleksitas tugas, keberagaman data, serta kecanggihan model yang digunakan. Tetapi satu hal pasti: AI tidak hanya membutuhkan data yang banyak, melainkan data yang bermakna. Sama seperti manusia yang tidak menjadi pintar hanya karena banyak membaca, AI pun tidak otomatis unggul hanya karena dijejali jutaan contoh. Kunci kecerdasan baik manusia maupun mesin terletak pada pemahaman yang benar, bukan sekadar jumlah pengalaman. Ibarat kita mempelajari suatu hal beribu-ribu kali, tetapi hal yang kita pelajari merupakan hal yang salah. Sama dengan AI, apabila asupan data yang kita berikan tidak berkualitas, maka AI tersebut menjadi tidak fungsional.