School of Information Systems

Tekhnologi Big Data ”Sistem Canggih Dibalik Google, Yahoo, Facebook, IBM”

Big data merupakan kumpulan data yang berukuran besar yang dianalisis oleh mesin pengolah sehingga menghasilkan informasi yang berguna bagi mereka yang menggunakannya. Google, Facebook dan lainnya mengelola dan memanfaatkan data tak berstruktur yang berupa Consumer Generated Media (CGM) maupun klik stream dengan volume yang sangat besar. Karena dalam jumlah yang besar dan kompleks big data memiliki tiga karakteristik yakni volume, variety, dan velocity. Demi menyederhanakan komplkesitas dari data yang ada dalam big data tersebut Apache Software Foundation (ASF) kemudian menciptakan Apache Hadoop yang terdiri dari Hadoop Distributed File System (HDFS) dan Framework Distributed Paralel System (FDPS) yang disebut Hadoop Mapreduce. Yang dimana HDFS berfungsi sebagai system penyimpan data secara terdistribusi sedangkan Hadoop mapreduce berfungsi sebagai framework pemrosesan data secara parallel pada HDFS.

Apache Hadoop inilah yang dipakai oleh kelompok Google, Yahoo dan masih banyak perusahaan besar lainnya. Inovasi ini menghasilkan pengetahuan baru ataupun pemahaman yang lebih mendalam, juga solusi-solusi yang sangat membantu dalam proses pengambilan keputusan. Keunggulan Hadoop scalability, fault tolerance, dan programming model yang sederhana banyak peneliti melakukan penelitian terkait dengan pemrosesan data multidimensi dalam jumlah besar. Map reduce juga memiliki keunggulan dalam hal memproses data dalam jumlah besar secara batch processing dengan model pemrograman yang relative sederhana. Namun masih memiliki kekurangan yakni tidak cocok untuk memproses data yang sifatnya interaktif dan real time. Untuk mengatasi kekurangan ini Apache kemudian mengembangkan sebuah software baru yakni Apache HBase yang berfungsi untuk melakukan pemrosesan data secara real time pada HDFS.

HBase mampu menerapkan Multi-dimensional Range Searching secara efektif tanpa mengorbankan fitur scalability. Eksistensi ini disebut dengan MD-HBase. Tekhnik yang diterapkan dalam MD-Hbase adalah dengan memetakan data dua dimensi menjadi satu dimensi menggunakan metode Space felling Curva yang dikenal dengan sebutan Z-Curva kemudian diterapkan Teknik space partition yang dikenal dengan KD-tree untuk Menyusun indeks dari data dua dimensi yang diproses.

Perkembangan teknologi ini bukan hanya terjadi di luar negeri namun juga diadopsi oleh di Indonesia. Software ini kemudian dipakai oleh beberapa platform di Indonseia seperti :

1. eBay : yakni teknologi Big data untuk amankan pajak

Software ini digunakan untuk membaca pola-pola penipuan ataupun penghindaran pajak yang mungkin disembunyikan, mengidentifikasi resiko ketidakpatuhan wajib pajak

2. Bank Mandiri : Teknologi big data untuk optimalkan layanan kredit

Berfungsi mengumpulkan dan menganalisa data-data nasabah berupa kebiasaan ataupun gaya dalam belanja juga bagaimana para nasabah tersebut melakukan transaksi hariannya

Selain itu big data bukan hanya data yang besar tetapi terdiri dari berbagai macam unsur yang ada di dalamnya dan memiliki fungsi untuk menghasilkan informasi yang dapat dipercaya seperti Data warehouse, NoSQL, DNS. Data ware house yang berfungsi untuk mengarsipkan dan menganalisis sebuah data historis, NoSQL berfungsi sebagai penyimpanan data yang terdistribusi dengan kebutuhan penyimpanan data yang besar, dan DNS yang berfungsi untuk menggabungkan semua system data base ke dalam big data.

 

Jurnal : Tekhnologi Big Data :”Sistem Canggih Dibalik Google, Yahoo, Facebook, IBM”

Link : https://books.google.co.id/books?hl=id&lr=&id=Ve-NDwAAQBAJ&oi=fnd&pg=PA80&dq=teknologi+big+data&ots=BrB3IKyNBM&sig=onqRbYpnDNsg6Spvk9D4BGzQQtU&redir_esc=y#v=onepage&q=teknologi%20big%20data&f=false

Avila Wona