BIG DATA

    Sebagai orang awam kita sering mendenger istilah Big Data, namun tidak tahu secara jelas apa itu Big Data. Big data, adalah sebuah teknologi baru di dunia teknologi informasi dimana memungkinan proses pengolahan, penyimpanan dan analisis data dalam beragam bentuk/format, berjumlah besar dan pertambahan data yang sangat cepat. Pengolahan dan analisis data dalam jumlah sangat besar ini memerlukan waktu yang relatif jauh lebih singkat dengan menggunakan Big Data dibanding teknologi data sebelumnya, misalnya database relational seperti MySQL.

    BAGIAN PENTING DARI KONSEP BIG DATA

    Fenomena Big Data, dimulai pada tahun 2000an ketika seorang analis industry  Doug Laney menyampaikan 3 bagian penting konsep Big Data yaitunya volume, kecepatan, dan variasi, selain itu Laney juga mengungkapkan 2 bagian penting lainnya variabilitas dan kompleksitas.

    • Volume

    Kemunculan teknologi baru (Big Data ) membatu dalam proses pengumpulan data yang jumlahnya besar dari berbagai sumber. Sehingga banyaknya data tidak lagi menjadi masalah.

    • Kecepatan

    Proses aliran data harus dilakukan secara cepat dan tepat dengan menggunakan berbagai hardware dan software. Teknologi seperti tag RFID dan sensor pintar lainnya dibutuhkan untuk proses transfer data yang real-time.

    • Variasi

    Big Data bisa mengumpulkan data dengan format yang berbeda-beda.. Mulai dari yang terstruktur, data numerik dalam database tradisional, data dokumen terstruktur teks, email, video, audio, transaksi keuangan dan lain-lain.

    • Variabilitas

    Selain kecepatan pengumpulan data yang meningkat dan variasi data yang semakin beraneka ragam, arus data kadang tidak konsisten dalam periode tertentu. Beban puncak data dapat menantang dalam analisa Big Data, bahkan dengan data yang tidak terstruktur.

    • Kompleksitas

    Banyaknya sumber data, mengakibatkan sulitnya menghubungkan, mencocokan, dan mengubah data dari seluruh sistem. Big Data berguna untuk mengkorelasikan data, hirarki dan beberapa keterkaitan data lainnya.

    Jumlah data yang telah dibuat dan disimpan pada tingkat global hari ini hampir tak terbayangkan jumlahnya. Data tersebut terus tumbuh tanpa henti. Artinya, Big Data memiliki potensi tinggi untuk mengumpulkan wawasan kunci dari informasi bisnis. Sayangnya sampai saat ini, baru sebagian kecil data yang telah dianalisis. Big Data dalam bisnis menjadi strategi yang baik dalam mengolah informasi mentah menjadi keuntungan yang terus mengalir ke organisasi bisnis setiap hari.

     

    MENGAPA BIG DATA PENTING ?


    Pentingnya Big Data, tidak hanya sebatas jumlah data yang organisasi miliki, tetapi hal yang penting adalah bagaimana mengolah data internal dan eksternal. Kita dapat mengambil data dari sumber manapun dan menganalisanya untuk menemukan jawaban yang diinginkan dalam bisnis seperti :

    1. pengurangan biaya;
    2. pengurangan waktu;
    3. pengembangan produk baru dan optimalisasi penawaran produk;
    4. pengambilan keputusan yang cerdas.

    Ketika organisasi mampu menggabungkan jumlah data besar yang dimilikinya dengan analisis bertenaga tinggi, organisasi dapat menyelesaikan tugas-tugas yang berhubungan dengan bisnis seperti :

    • Menentukan akar penyebab kegagalan untuk setiap masalah bisnis.
    • Menghasilkan informasi mengenai titik penting penjualan berdasarkan kebiasaan pelanggan dalam membeli.
    • Menghitung kembali seluruh risiko yang ada dalam waktu yang singkat.
    • Mendeteksi perilaku penipuan yang dapat mempengaruhi organisasi.

    TOOLS BIG DATA

    Terdapat banyak sekali tools Big Data, berikut beberapa diantaranya : 

    1. Gephi

    Gephi merupakan perangkat lunak open-source yang dapat digunakan untuk visualisasi dan analisis jaringan. Gephi dapat digunakan untuk membantu analis data untuk mengungkapkan pola dan tren, menyoroti secara spresifik mengenai outliers (orang ataupun suatu hal yang terpisah dari badan atau sistem utama) dan menceritakan mengenai data mereka. Gephi dapat menggunakan render engine 3D untuk menampilkan grafik real-time skala besar dan dapat digunakan untuk memperluas eksplorasi visualisasi dan analisis data. Gephi memiliki kapabilitas karena terdiri dari gabungan arsitektur yang fungsional dan fleksibel yang dapat di kustomisasi dan disesuaikan sesuai kebutuhan dengan segala tipe jaringan yang ada.

    Gephi adalah hasil visualisasi dan manipulasi paradigma yang memperbolehkan user untuk menemukan jaringan dan property-properti data. Terlebih lagi, Gephi memang didesain untuk mengikuti dan menyesuaikan rantai dan alur dari sebuah dataset studi kasus yang memang memiliki banyak atribut. Gephi merupakan perangkat lunak yang dapat diakses bebas yang dapat didistribusikan dibawah GPL 3 (“GNU General Public License”). Paket atribut yang tersedia di Gephi dijalankan menggunakan Java pada NetBeans platform.

    2. Python

    Python merupakan bahasa pemrograman multiguna yang bersifat interpreter, berorientasi pada obyek dan dapat dioperasikan pada semua sistem operasi seperti Linux, Windows, Mac, dan lainnya. Python dibuat oleh seorang keturunan Belanda yang bernama Guido van Rossum. Tujuan utama python adalah lebih memusatkan pada keterbacaan kode dalam memahami sintaks, dimana sintaks tersebut berfungsi untuk mempermudah dan mempercepat pemrogram dalam proses pengkodeannya dibandingkan Java atau C++.

    Pada pengaplikasian python, terdapat banyak fungsi built-in (bawaan). Misalnya pada python 3.6 yang memiliki 68 fungsi built-in seperti abs(), all(), any(), ascii(), bin(), dan lainnya yang dapat memudahkan penggunanya dalam menyelesaikan suatu pekerjaan.

    Dengan menggunakan python, para pengguna dapat melakukan pemuatan kembali secara dinamis seperti merubah, mengkontruksi, dan memodifikasi tanpa menghentikan modul python, dapat melakukan kompilasi untuk portable kode byte yang berdampak pada peningkatan kecepatan eksekusi dan menjaga kode sumber, dan juga dapat mengatur memori otomatis yaitu kumpulan memori yang kotor sehingga dapat mencegah pencacatan kode.

    3. Netlytic

    Netlytic adalah sebuah aplikasi berbasis web penganalisa teks berbasis cloud dan visualisasi jaringan sosial. Netlytic secara otomatis dapat meringkas volume teks yang besar dan menemukan serta memvisualisasikan jaringan sosial dari percakapan pada situs media sosial seperti TwitterYoutube, komentar blog, forum online, dan obrolan. Netlytic dirancang untuk membantu peneliti dan yang lainnya memahami operasi grup online, dan menemukan bagaimana informasi mengalir dalam jaringan.

    4. NiFi

    Apache NiFi yang merupakan kepanjangan dari NiagaraFiles adalah sebuah proyek perangkat lunak dari Apache Software Foundation. Program ini di rancang untuk mengotomatisasi aliran data antara sistem perangkat lunak. Aliran data yang dimaksud disini yaitu aliran informasi otomatis yang terkelola antar sistem. Pola masalah ini sudah ada sejak perusahaan memiliki beberapa sistem, dimana ada sistem yang mengambil data dan ada sistem yang menggunakan data. Masalah dan pola solusi ini telah di diskusikan dan diartikulasikan menjadi sebuah bentuk yang komprehensif dan mudah dikonsumsi dalam Pola Integrasi Perusahaan (Enterprise Integration Patterns).

    5. Tableau

    Tableau merupakan alat yang mendukung Business Intelligent yang dapat digunakan untuk membantu mengumpulkan, menyimpan, mengatur dan menganalisis data mentah sehingga menjadi sebuah informasi yang bernilai. Software Tableau terdiri dari beberapa versi yaitu Tableau Desktop, Tableau Server, Tableau Online, Tableau Reader, dan Tableau Public. Secara umum, tableu digunakan untuk menganalisis data secara visual.

    Tableu merupakan sebuah solusi untuk menangani semua kebutuhan bisnis, seperti:

    • Tampilan Dashboard
    • Penemuan Data
    • Laporan Hasil Analisis Analyst Level Reporting
    • Laporan dengan “Pixel Perfect”untuk percetakan
    • Laporan Operasional
    • Kemampuan menangani Big Data
    • Self Service
    • Embedded Analytics
    • Pengolahan dan pelaporan OLAP (Online Analytical Analysis)
    • Peramalan dan prediksi analisis

    Dalam fenomena Big Datasoftware ini membantu dalam menerjemahkan data dengan skala besar ke dalam bentuk yang lebih mudah dipahami seperti grafik dan bagan yang unik. Mengingat pertumbuhan berbagai bentuk data yang terlalu banyak untuk ditangani dengan cara konvensional, sehingga memerlukan sebuah cara agar dapat mengolah data yang banyak tadi menjadi sebuah informasi dengan cepat dan mudah dipahami. Selain itu, Tableu juga dapat menyederhanakan data yang kompleks dan berantakan sehingga data tersebut dapat menghasilkan pola – pola yang mengandung wawasan yang mendukung analisa pada data. Dengan data yang dimiliki, dapat dilihat pola dari suatu trend dimana hal tersebut sangat membantu para analis khususnya dalam bidang bisnis. Selain grafik dan bagan, Tableau juga dapat menghasilkan bentuk visualisasi berupa geocoding atau peta.

    IMPLEMENTASI BIG DATA

    1. Bidang Bisnis

    Salah satu kelebihan dari Gephi sebagai pengananalisa jaringan sosial adalah kemudahan dalam penggunaannya. Tidak perlu kemampuan khusus untuk mengoperasikannya. Anda hanya perlu memasukkan data jaringan sosial ke Gephi dan menggunakan beberapa algoritma yang telah disediakan dalam Gephi. Anda dapat melihat jaringan yang terhubung dengan pengelompokkannya dalam bentuk visual untuk kemudian dianalisa agar mendapatkan beberapa implikasi bisnis penting.

    Saat ini sosial media merupakan sebuah tempat yang sangat powerful untuk mempromosikan sebuah brand atau produk. Hampir setiap brand hadir dalam media sosial terutama pada FacebookTwitter, dan Instagram. Karena situs media sosial tersebut memiliki sangat banyak pengguna yang akan menganalisa performa brand yang hadir pada media sosial. Melalui Gephi, seseorang dapat menganalisa koneksinya di media sosial dan dapat dengan mudah menemukan implikasi bisnis seperti targeting, posisitioning, dan lain-lain berdasarkan kluster yang terbentuk pada Gephi.

    Salah satu impikasi pemasaran yang paling penting dari visualisasi jaringan Gephi adalah targeting. Anda akan dengat sangat mudah menemukan demografi masyarakat atau kelompok dan kemudian mengambil keputusan targeting dan positioning dari sebuah brand.

    2. Bidang Kesehatan

    Mengetahui bahwa perkembangan penggunaan Big Data sudah sangat pesat dan kesadaran masyarakat dunia terhadap efektivitas penggunakan big datadalam aktifitasnya sehari hari juga merambah pada dunia kesehatan, yaitu dunia kedokteran. Dalam industri kesehatan digital, big data menggunakan teknik data science untuk menangkap dan menganalisis data yang sangat besar dan kompleks untuk memberikan dampak positif bagi hasil perawatan pasien dan mengoptimalkan proses bisnis.

    Meskipun istilah  big data  merujuk pada volume data, itu bukanlah permasalahan utama karena big data juga dapat merujuk pada tingkat teknologi yang dibutuhkan organisasi untuk menangani dan fasilitas yang dibutuhkan untuk menyimpannya. Industri kesehatan menghasilkan data klinis, finansial, administratif dan genom yang sangat besar sehingga memerlukan teknik big data untuk membantu mengorganisirnya.

    Pada tahun 2009, terdapat sebuah penelitian big data pada bidang kesehatan yaitu mengenai interaksi jaringan protein dalam melakukan prediksi kanker payudara menggunakan metode Dynamic Network Analysis. Pada penelitian dijelaskan bagaimana evolusi kelas-kelas yang terbentuk dari interaksi antar cell dalam tubuh sehingga bisa mendapatkan polarisasi pembentukan sel kanker payudara. Perangkat lunak Gephi dapat dimanfaatkan untuk menganalisis hal yang serupa dengan visualisasi yang bisa ditampilkan menggunakan perangkat lunak tersebut.

    INDUSTRI YANG MEMANFAATKAN BIG DATA

    Berikut tiga contoh industri yang dapat memanfaatkan penggunaan Big Data :

    1. Industri Penerbangan

    Setiap perusahaan penerbangan mempunyai data masing-masing, namun perusahaan penerbangan saat ini umumnya hanya menggunakan data pembelian tiket penumpang, seperti kota asal dan kota tujuan, serta pembelian tiket melalui situs resmi atau tidak. Perusahaan penerbangan tidak melihat data di luar itu, misalnya data interaksi ketika calon penumpang berada di depan komputer untuk membeli tiket. Mereka mungkin hanya melihat pelanggan terbang dari Jakarta-Jogja misalnya, tapi sebelum memutuskan itu sebenarnya dia ingin menuju Solo. Penting bagi perusahaan penerbangan untuk melihat pola interaksi calon penumpangnya.

    Sebagai contoh, ketika penumpang mengetik Solo dalam situs penjualan tiket, kemudian menge-klik back dan mengetik Jogja, kota dengan bandara terdekat dari Solo, perusahaan patut mencurigai pola interaksi seperti ini. Bisa jadi penumpang membeli tiket Jogja karena penerbangan Solo lebih terbatas atau lebih mahal. Perusahaan penerbangan dapat memanfaatkan Big Data tersebut untuk kemudian memperbanyak jumlah penerbangan ke Solo atau memberikan harga promo atau bekerja sama dengan travel agent untuk memfasilitasi penumpang dari Jogja ke Solo. Jika perusahaan penerbangan mengetahui data ini ( Big Data aktivitas penumpang di website ), mereka mungkin bisa mengambil keputusan yang lebih tepat, dengan membuat rute yang lebih atraktif karena mengetahui market yang potensial.

    1. Industri Perbankan

    Pada saat nasabah melakukan transaksi melalui mesin atm, Bank mungkin hanya menyimpan data transaksi banking, seperti nominal penarikan uang. Di luar itu, Bank dapat melihat data interaksi para nasabah di depan mesin atm. Bank dapat mengetahui berapa lama waktu yang dibutuhkan nasabah untuk memasukkan pin dan menekan jumlah nominal penarikan uang. Lebih dari itu Bank juga dapat menganalisa kebiasaan seorang nasabah dalam menarik uang di atm. Jika kita tahu kebiasaan seorang nasabah mengambil uang 500 ribu, kenapa tidak ketika nasabah memasukkan kartu, kemudaian memencet pin, langsung menawarkan pilihan 500ribu. Hal tersebut dapat menjadi nilai tambah bagi Bank di mata para nasabah agar nasabah tetap setia dan menambah saldo rekeningnya.

    1. Industri Otomotif

    Penggunaan Big Data di industri otomotif, dapat digunakan untuk menghindari fraud atau penipuan/kecurangan. Di negara lain misalnya, Big Data dimanfaatkan untuk mendeteksi adanya fraud yang dilakukan dealer mobil untuk mengklaim spare parts mobil baru yang masih bergaransi. Jika sebuah dealer mengklaim suatu spare parts dalam jumlah jauh lebih besar dibanding dealer lain di daerah yang sama, produsen mobil dapat mencurigai hal ini. Cara yang paling sederhana untuk mendeteksi fraud, dapat dilakukan melalui data geografis. Jika memang karena faktor cuaca atau jalan rusak mengeluhkan rem rusak dan aus, seharusnya keluhan tersebut tersebar, tapi ada dealer yang klaim parts yang lebih tinggi di banding dealer-dealer di daerah yang sama. Dapat disimpulkan bahwa Big Data itu bukan semata-berbicara datadalam ukuran besar, Big Data itu muncul ketika orang mulai sadar bahwa ada data - data baru yang sebelumnya belum dianalisa. (Nur Choliq)

    PT. Prawathiya Karsa Pradiptha didirikan pada bulan Februari 2008.Bisnis kami berfokus pada Enterprise Business Solution, IT Professional Service, IT Managed Service, Mobile Application, dan Call Center Service. PT. Prawathiya Karsa Pradiptha telah bekerja sama dengan berbagai perusahaan dalam membantu mereka menanggapi dinamika lingkungan dan memilih keputusan yang tepat dengan menggabungkan dan menerapkan teknologi dan layanan terkini.