TAHAP DESIGN PERANCANGAN BUSINESS INTELLIGENCE INSTAGRAM
Database Design
Instagram tentunya memiliki data yang sangat banyak dan kompleks. Sehingga, struktur database harus bisa memudahkan proses pengambilan atau pengaksesan data. Berikut adalah beberapa komponen yang mungkin terlibat dalam desain basis data untuk aplikasi Instagram dengan fokus pada BI:
- Registrasi:
Registrasi memuat informasi tentang pengguna, seperti nama pengguna, alamat email, tanggal bergabung, lokasi, jenis kelamin, dan preferensi lainnya. Metadata tentang setiap pengguna, seperti jumlah pengikut, jumlah yang diikuti, jumlah unggahan, jumlah like, komentar, dan aktivitas lainnya. Data demografis yang dapat membantu dalam analisis target pasar dan pengguna.
- Unggahan (Posts):
Informasi tentang setiap unggahan, termasuk teks yang diposting, gambar atau video yang terlampir, tanggal dan waktu unggahan, serta lokasi (jika disertakan). Metadata terkait dengan unggahan, seperti jumlah like, komentar, dan berbagi. Tag dan kategori yang terkait dengan unggahan, yang dapat digunakan untuk analisis konten.
- Interaksi Pengguna (User Interactions):
Data tentang interaksi pengguna dengan unggahan, seperti like, komentar, berbagi, serta klik pada tautan atau tag yang terdapat dalam unggahan. Informasi tentang siapa yang melakukan interaksi, waktu interaksi, dan konteks interaksi tersebut. Data tentang interaksi antar pengguna, misalnya ketika satu pengguna mengikuti pengguna lain atau melakukan pesan langsung.
- Hashtags dan Tagging:
Data tentang penggunaan hashtag dalam unggahan, termasuk hashtag yang paling populer dan tren saat ini. Informasi tentang tagging pengguna lain dalam unggahan, yang dapat digunakan untuk analisis keterlibatan dan interaksi antar pengguna.
Selanjutnya dilakukan perancangan multidimensional data model menggunakan 4 langkah pendekatan metode Kimball. Tahap metodologi tersebut terdiri atas :
- Memilih proses.
Tahap ini melibatkan identifikasi proses bisnis yang akan menjadi fokus utama dalam perancangan multidimensional data model. Proses bisnis yang dipilih harus relevan dengan tujuan analisis organisasi dan memiliki dampak signifikan terhadap kinerja dan keberhasilan bisnis. Contohnya, dalam konteks aplikasi Instagram, proses-proses yang dapat dipilih mungkin termasuk Registrasi pengguna baru, Pengunggahan konten, Interaksi pengguna dengan konten dan pengguna lainnya, serta Penggunaan hashtag dan tagging.
- Memilih grain.
Memilih grain yaitu memutuskan apa yang benar-benar ditampilkan dalam tabel fakta. Grain yang diperoleh adalah Registrasi, Unggahan, InteraksiPengguna, dan HashtagAndTagging.
- Identifikasi dan menyesuaikan dimensi.
Selain itu, juga dilakukan identifikasi dan menyesuaikan dimensi. Pada tahap ini diidentifikasi serta disesuaikan dimensi yang dimiliki oleh setiap tabel fakta.
Tabel Fakta | Dimensi |
Registrasi | Pengguna, Demografi, Lokasi, Perangkat |
Unggahan | Pengguna, Konten, Lokasi, Waktu |
InteraksiPengguna | Pengguna, Interaksi, Waktu |
HashtagAndTagging | Pengguna, Konten, Waktu |
- Choosing the fact
Star Schema Registrasi
Star schema registrasi melibatkan dimensi pengguna, demografi, lokasi, dan perangkat.
Design Considerations
- Data historical yang disimpan mencakup kurun waktu 5 (lima) tahun terakhir.
Performance Considerations
- Memvisualisasikan data dalam bentuk dashboard (chart dan tabel).
ETL Design
Proses Extract, Transform, Load (ETL) merupakan proses untuk menggabungkan data dari berbagai sumber (seperti database source {OLTP}) ke dalam repository pusat yang besar yang biasa disebut gudang data (data warehouse {OLAP}). Proses ETL pada penelitian ini menggunakan script yang akan berfungsi untuk menyimpan data-data yang akan digunakan untuk memvisualisasikan informasi yang dibutuhkan administrator.
Untuk instagram sendiri, menggunakan pull-method, dimana ETL code akan diimplementasikan pada data warehouse yang sudah ditentukan, agar pada setiap periode tertentu (yang sudah dijadwalkan), data-data perilaku pengguna instagram dapat secara langsung terekam, tersimpan, dan terakumulasi secara otomatis. Jadi, administrator tidak perlu mengambil data pengguna secara manual lagi.
Tool yang akan dipakai untuk melakukan ETL ini adalah script yang ditulis dalam bahasa query pada SQL Server Management Studio (SSMS).
Meta Data Repository Design
Berikut adalah beberapa komponen yang mungkin terdapat dalam desain metadata repository untuk aplikasi Instagram:
- Entitas Registrasi:
Metadata tentang pengguna, seperti nama pengguna, alamat email, tanggal bergabung, lokasi, jenis kelamin, dan preferensi lainnya. Informasi tentang hubungan antara pengguna, seperti pengikut dan yang diikuti.
- Entitas Demografi:
Metadata tentang demografi pengguna, seperti jenis kelamin dan tanggal Lahir. Informasi tentang like, komentar, berbagi, dan interaksi lainnya dengan konten.
- Entitas Hashtag dan Tagging:
Metadata tentang penggunaan hashtag dalam konten, termasuk teks hashtag dan jumlah penggunaan. Informasi tentang tagging pengguna lain dalam konten, seperti nama pengguna yang ditag dan konten yang di tag.
- Entitas Perangkat:
Metadata tentang perangkat yang digunakan pengguna, seperti jenis perangkat dan operation system (OS). Informasi tentang waktu, konten yang terlibat, dan pengguna yang terlibat dalam interaksi.
- Entitas Lokasi:
Metadata tentang lokasi geografis yang terkait dengan konten, seperti nama lokasi, koordinat geografis, dan informasi tambahan tentang lokasi.