Sejarah Big Data dan cara kerja Big Data.
Big data pertama kali diperkenalkan oleh seorang analis industry yang bernama Doug Laney, yang menyampaikan terkait 3 masalah utama yang dikenal sebagai the 3V of data yang terdiri dari Volume, Velocity dan Variety.
- Volume
Merupakan masalah data yang disebabkan karena volume data yang dimiliki oleh sebuah perusahaan atau organisasi atau bisnis sangat besar. Sebagai contoh perusahaan telekomunikasi yang melakukan record dari aktivitas browsing pengguna dalam satu hari yang dimana di dalam 1 hari bisa tercatat lebih dari 1 juta hingga 1 milyar record data pengguna. Apabila data tersebut di dalam 1 bulan, berarti ada sekitar 30 juta hingga 30 milyar record data.
Data tersebut saja bisa disimpan dalam sebuah warehouse, namun tentunya biaya yang perlu dikeluarkan tentunya juga besar dan akan menjadi lebih mahal. Hadoop merupakan sebuah platform big data dapat menjadi solusi penyimpan data – data tersebut dan dapat digunakan juga untuk mengolah dan menganalisa data, sehingga data yang awalnya tidak memiliki ekonomis dapat menjadi nilai tambah dan menghasilkan keuntungan bagi bisnis.
- Velocity
Merupakan masalah data yang disebabkan karena kecepatan data yang akan dihasilkan. Masalah ini muncul biasanya terjadi karena besarnya data yang dimiliki oleh perusahaan, membuat kecepatan data yang akan di proses memiliki waktu yang lama. Masalah ini tidak hanya terjadi pada pengolahan data dengan volume yang besar saja, namun terjadi juga pada data yang masuk secara realtime dengan jumlah yang besar sehingga membuat perusahaan membutuhakan sebuah perangkat lunak untuk pemrosesan data tersebut secara realtime juga. Sebagai contoh perusahaan di bidang telekomunikasi yang melakukan pemrosen data pelanggan secara real-time yang ingin mengukur dan mengetahui kualitas koneksi internet. Dapat dibayangkan berapa banyaknya data yang dapat masuk setiap menitnya. Dengan pemanfaatan big data, data tersebut dapat disimpan dan di proses ke software big data dan dianalisa pada saat itu juga untuk mengetahui kualitas jaringan internet, lalu hasil dari analisa tersebut akan dapat dikirimkan kepada tim teknis jaringan sehingga perusahaan pun mengetahui lokasi mana saja yang memperoleh gangguan koneksi internet.
- Variety
Merupakan masalah data yang disebabkan oleh variasi jenis data. Masalah ini merupakan salah satu masalah yang sulit dihadapi apabila perusahaan masih menggunakan sebuah platform data tradisional baik menggunakan database maupun warehouse, karena data yang disimpan terdapat berbagai jenis file dan tipe data yang berbeda, sehingga dalam proses pengolahan data membutuhkan waktu yang lebih lama.
Sebagai contoh tipe data yang sering kita jumpai seperti teks, numerik, video, suara, gambar, dan masih jenis tipe data lainnya, dengan pemanfaatan Hadoop perusahaan dapat melakukan sortir data sesuai dengan tipe file dan jenisnya, kemudian dapat dilakukan Analisa sehingga dapat menghasilkan data yang bernilai ekonomis.
Tentunya dalam pemanfaatan big data dalam perusahaan ada beberapa langkah yang perlu dilakukan terlebih dahulu agar implementasi big data yang akan dilakukan tidak sia – sia, antara lain :
- Perusahaan atau pelaku bisnis, harus dapat menetapkan strategi yang tepat untuk menggunakan big data.
- Perusahaan atau pelaku bisnis harus dapat melakukan identifikasi secara menyeluruh sumber dari big data.
- Perusahaan atau pelaku bisnis, harus dapat menenetukan terlebih dahulu dalam melakukan pengelolaan dan penyimpan data apakah menggunakan warehouse database, cloud, ataupun Hadoop.
- Setelah melakukan hal tersebut, perusahaan atau pelaku bisnis tentu harus melakukan analisa data.
- Perusahaan atau pelaku bisnis harus dapat mengambil keputusan yang tepat dari hasil analis data yang telah didapatkan sebelumnya.
Refrensi :
- https://gudangssl.id/blog/big-data/
- https://www.sas.com/id_id/insights/analytics/big-data-analytics.html