Apa itu Web Mining
Web Mining
Web mining merupakan ekstraksi pola-pola penting dan bermanfaat namun tersimpan secara implisit pada kumpulan data yang relatif besar pada layanan world wide web. Web mining terdiri atas tiga bagian yaitu: web content mining, web structure mining, dan web usage mining. Teknik web mining pertama kali dikenalkan oleh Etzioni Oren pada tahun 1996. Web mining dapat didefinisikan sebagai suatu usaha untuk mengemplementasikan teknik data mininguntuk menggali dan kemudian mengkaji atau mengekstraksi. informasi yang berguna 9 dari data yang tersimpan di web secara otomatis. Dalam implementasinya web mining hampir mirip akar terminologinya dengan data mining tetapi pada dasarnya ada sedikit perbedaan. Perbedaan web mining yaitu memiliki hubungan sifat data yang tidak terstruktur dan sumber data yang tidak tersimpan dalam suatu data warehousemelainkan tersebar di berbagai sumber.
Penerapan Web Mining
Terdapat beberapa contoh dari penerapan web mining, yaitu:
- Penambangan web membantu meningkatkan kekuatan mesin pencari web dengan mengklasifikasikan dokumen web dan mengidentifikasi halaman web.
- Ini digunakan untuk Pencarian Web misalnya, Google, Yahoo dll dan Pencarian Vertikal misalnya, FatLens, Menjadi dll.
- Penambangan web digunakan untuk memprediksi perilaku pengguna.
- Penambangan web sangat berguna untuk Situs Web dan layanan elektronik tertentu, misalnya, pengoptimalan halaman arahan.Terdapat beberapa tahapan proses dalam text mining, yaitu text, text preprocessing / text transformation, feature generation, feature selection, dan pattern discovery.
Teknik pada Web Mining
Ada beberapa jenis teknik yang digunakan dalam web mining, yaitu web content mining, web structure mining, dan web usage mining.
- Web Content Mining
Web Content Mining adalah suatu proses otomatis untuk menemukan informasi yang berguna dari dokumen atau data. Pada prinsipnya teknik ini mengekstraksi kata kunci yang terkandung pada dokumen. Teknik Web Content Mining berfokus pada penggalian informasi dari isi (content) yang ada pada sebuah web, seperti teks, gambar, audio, video, metadata dan hyperlink. Ada dua strategi yang umum digunakan: pertama langsung melakukan mining terhadap data; kedua melakukan pencarian serta mengimprove hasil pencarian seperti layaknya search engine. Web Content Mining juga dapat disebut sebagai Web Text Mining yang dalam implementasi biasanya penggalian data terletak pada daerah teks. Teknik ini juga lebih banyak berhubungan dengan disiplin Information Retrieval (IR), tetapi dengan inovasi yang terus menerus dan seiring dengan perkembangan dunia teknologi informasi, secara dramatis akan meningkatkan akurasi dalam analisis dan mamp menghemat biaya.
- Web Structure Mining
Web Structure Mining adalah teknik yang digunakan untuk menemukan struktur link dari hyperlink sehingga dapat diketahui keterkaitan antara suatu halaman web dengan halaman web lainnya, kemudian akan digunakan untuk membangun rangkuman website dan halaman web. Jadi kategori kedua dari Web Mining ini berfokus pada penggalian informasi dari isi (content) yang disajikan dalam web.
- Web Usage Mining
Kategori ketiga dari Web Mining adalah Web Usage Mining. Model ini merupakan teknik yang selalu mengedepankan penggalian pada pola (pattern) dari pengguna (user) dalam mengakses halaman-halaman web yang ditandai melalui informasi dari log, click stream, cookies, dan query. Manfaat web usage mining adalah untuk melakukan perubahan halaman berdasarkan profil pengguna, menentukan ketertarikan pelanggan terhadap produk tertentu, dan menentukan target market yang sesuai.