DATA SAMPEL KE BIG DATA
Secara tradisional, model telah dibuat menggunakan subset dari data yang disebut sampel. Setelah satu model dibuat, set data kedua yang lebih besar digunakan untuk menguji atau memvalidasi model. Proses ini seringkali berulang. Setelah model tervalidasi, model digunakan untuk memvalidasi atau “menilai” semua data. Ini adalah pendekatan statistik yang terkenal selama beberapa dekade.
Dengan penggunaan Big Data, data scientist menggunakan banyak atau seluruh data untuk membuat model. Dengan melakukan ini, data scientist mampu memperkenalkan variable independen tambahan ke dalam model untuk meningkatkan daya angkat (akurasi) dari suatu model. Ketika data lampau digunakan, model dapat mengidentifikasi tren yang berada di luar siklus terpotong yang digunakan dalam teknik ekstraksi data historis. Sebagai contoh, dalam industri jasa keuangan, karena data dan batas komputasi, model pasar diciptakan dengan periode waktu yang relative singkat (contoh: 3 sampai 5 tahun) tetapi banyak dari siklus ekonomi berlangsung selama periode 10 tahun.
Big Data memberikan para data scientists peluang dalam industry keuangan untuk membuat model dari cakrawala waktu yang diperlukan.
Berpikir diluar dari biasanya
Sebagai pemikir multidisiplin, data scientist menggunakan beberapa teknik untuk membuat model analitik untuk memenuhi tujuan bisnis. Sebagai contoh, data scientists menggunakan lebih banyak “model ansambel” yang menyatukan banyak model lalu mengambil yang terbaik dari masing-masing model guna menghasilkan hasil prediksi terbaik (Seni & Elder, 2010). Selain itu, Data scientists lainnya juga sedang merakit teknik bersama-sama guna menghasilkan hasil yang terbaik.
Sebagai contoh, data scientists membuat model prediktif menggunakan teknik algoritma yang sudah populer dibanding menggunakan teknik simulasi untuk mengevaluasi jutaan skenario lalu menerapkan teknik optimasi untuk memaksilkan hasil model. Dengan berpikir outside of the box tentang pendekatan, data scientists mampu menghasilkan hasil yang lebih untuk perusahaan mereka.
Pemodelan 360 Derajat
Saat ini, model yang disebarkan ke lingkungan pengembangan produksi secara berkala dievaluasi kembali oleh pembuatnya. Frekuensi dimana model dievaluasi ulang oleh pembuatnya pun bervariasi. Saat lingkungan Big Data dibuka, bisnis menuntun agar model terus menerus di evaluasi kembali untuk mendapatkan peningkatan tambahan dari model saat data berevolusi dari waktu ke waktu dan terus menerus di evaluasi kembali. Hal ini bisa diselesaikan dengan cara membuat loop tertutup, dimana pembelajaran dimasukkan secara manual oleh data scientist dan / atau teknik pembelajaran mesin dapat digunakan untuk mempelajari dan beradaptasi berdasarkan data yang baru.
Kebutuhan akan “kecepatan”
Dalam era yang lalu, perusahaan berpindah dari proses manual ke proses otomatis untuk mendapatkan efisiensi. Seiring berkembangnya analitik, sebagian besar pemrosesan analitik dilakukan sebagai proyek khusus ad-hoc atau dalam proses batch offline. Kini di dunia yang hyperconnected, perusahaan mencoba untuk merespon dengan lebih cepat dan lebih cepat untuk menjadi yang tercepat dalam kompetisi. Perusahaan-perusahaan yang berusaha menjaga kecepatan yang melelahkan ini sedang bergerak menuju pemrosesan hampir-waktu-nyata dimana data dianalisis secara cepat sebagaimana data itu digunakan.
Teknologi Big Data memungkinkan untuk mengaktifkan pulsing karena jauh lebih sedikit keterlambatan dalam mendapatkan data dan mengubah data menjadi wawasan. Ini memungkinkan suatu organisasi untuk memprediksi kemungkinan pergerakan selanjutnya atau untuk mengambil tindakan korektif lebih cepat.
Sebagai contoh, selagi pelanggan sedang berbelanja di website untuk kamera inovatif baru, click dan action yang dilakukan di website dapat digunakan untuk membuat penawaran yang dipersonalisasi untuk mendorong pendapatan tambahan seperti garansi, baterai tambahan, dan tas jinjing. Semetara ini adalah rekomendasi yang “jelas”, rekomendasi yang tidak terkait tambahan, seperti pembelian dimuka dari iPad dan iPhone yang akan dirilis atau aplikasi untuk mengedit foto, juga dibuat berdasarkan profil kemungkinan dari si pembeli.
Contoh tindakan korektif awal dapat terjadi ketika sensor pada mobil anda mengirim informasi ke pabrik otomotif, dan pabrikan menggunakan informasi tersebut untuk mengantisipasi masalah dengan mobil dan mengingatkan pengemudi bahwa mobil perlu diservis, atau layanan pelanggan memanggil pengemudi untuk memperingatkan pengemudi secara pribadi tentang situasi yang berpotensi bahaya.