School of Information Systems

Apa itu Teknik Web Usage Mining pada Web Mining

Web Usage Mining

            Web usage mining adalah teknik untuk mengidentifikasi atau menemukan pola penggunaan yang menarik dari kumpulan data yang besar. Dan pola ini memungkinkan untuk memahami perilaku pengguna atau semacamnya. Web mining merupakan ekstraksi pola-pola penting dan bermanfaat namun tersimpan secara implisit pada kumpulan data yang relatif besar pada layanan world wide web. Dalam web mining, pengguna mengakses data di web dan mengumpulkan data dalam bentuk log. Jadi, web mining juga disebut log mining.

Tahapan pada Web Usage Mining

Terdapat 3 tahap/fase dalam implementadi web usage mining untuk mendapatkan sumber informasi: Ada beberapa jenis teknik yang digunakan dalam web mining, yaitu web content mining, web structure mining, dan web usage mining.

  1. Tahap Preprocessing

            Tahap Preprocessing ini adalah tahapan awal untuk memulai proses keseluruhan dari Web Usage Mining. Tahap ini sangat penting dikerjakan untuk melakukan standarisasi data dan menghilangkan bagian–bagian data yang tidak diperlukan dalam proses mining. Tahap Preprocessing ini masih terbagi lagi menjadi beberapa tahapan, yaitu:

  • Data Cleaning, yaitu tahapan yang berfungsi untuk membersihkan file log yang tidak relevan dari data dengan proses mining, seperti data multimedia dan script CSS maupun Javascript.
  • User Identification, yaitu tahapan yang berfungsi sebagai proses pengidentifikasian user. Dalam realitanya, beberapa user dimungkinkan untuk menggunakan komputer (host) yang sama.
  • Session Identification, yaitu tahapan yang dimulai setelah user Halaman yang diakses juga harus dibagi ke dalam sesi tertentu agar dapat tercipta sesi tunggal untuk setiap user yang mengakses.
  • Path Completion, yaitu tahapan untuk melengkapi path yang mungkin belum lengkap karena tersimpan pada file log.
  • Transaction Identification, yaitu tahapan untuk mengindentifikasi sejumlah sesi tertentu agar dapat menunjukkan proses transaksi yang dilakukan oleh user.
  1. Tahap Pattern Discovery

            Tahap kedua dari web usage mining ini berupa pencarian pola akses yang dilakukan oleh user (pengguna) aplikasi. Tahap ini adalah tahap yang paling penting dan sangat menentukan keluaran dari proses web usage mining. Tahap ini juga memiliki beberapa algoritma dan teknik yaitu

  • Statistical Analysis (analisis statistik), yaitu teknik yang paling banyak digunakan dalam mendapatkan informasi atau pengetahuan dari pola akses user. Analisis statistik dapat disajikan dalam berbagai bentuk analisis dengan beragam variabel yang menjadi parameter analisis. Contoh analisis yang dapat dihasilkan adalah pola akses user yang dilihat dari waktu akses untuk setiap harinya.
  • Association Rules, yaitu teknik yang dapat diterapkan pada Web Usage Mining, dengan contoh keluaran yang dihasilkan berupa pola akses terhadap halaman-halaman web. Dari pola tersebut kemudian dapat diketahui halaman mana saja yang selalu diakses secara bersamaan oleh user. Hal tersebut dapat digunakan sebagai dasar untuk perancangan atau penyusunan kembali halaman web agar menjadi lebih efektif.
  • Clustering, yaitu teknik yang berupa proses pengelompokan sekumpulan objek fisik maupun abstrak ke dalam kelas tertentu berdasarkan kesamaannya. Dalam kaitannya dengan web usage mining, teknik clustering sering digunakan untuk menentukan segmentasi pasar pengunjung suatu situs ecommerce berdasarkan kesamaan pola akses maupun demografinya.
  • Classification, yaitu teknik yang berupa proses pengelompokan berdasarkan kelas yang sudah didefinisikan sebelumnya. Classification terbagi menjadi dua, yaitu proses membangun model sesuai dengan kelas yang sudah ditentukan dan proses menerapkan model untuk mengklasifikasi sekumpulan data.
  • Sequential Pattern, yaitu teknik yang digunakan untuk menganalisis pola urutan akses halaman web oleh user. Tren urutan pola akses user dapat digunakan untuk memprediksikan tren di masa yang akan datang atau untuk mengatur penempatan menu.
  • Dependency Modeling, yaitu teknik yang berusaha mencari ketergantungan antara satu variabel dengan variabel yang lain dalam web. Hal ini berguna untuk memprediksikan pola di masa mendatang.
  1. Tahap Pattern Analysis

            Tahap ke tiga ini merupakan fase terakhir dalam web usage mining. Pada fase ini dilakukan proses visualisasi hasil analisis pola yang telah dikerjakan pada langkah sebelumnya. Penyajian data menjadi hal yang penting dalam langkah ini, tergantung pada kebutuhan user dan bisnis. Dari hasil visualisasi tersebut, dapat dibuat suatu keputusan (action) misalnya keputusan untuk mengubah tampilan website, melakukan optimasi navigasi website, meningkatkan kemampuan website dengan melakukan caching halaman-halaman tertentu yang sering dikunjungi.

Zaki Izzani Akbar