Mengenal Lebih Jauh Lagi Tentang Big Data – Terdapat banyak sekali macam definisi Big Data, salah satunya berdasarkan Thomas Davenport, seorang akademisi yang dianggap sebagai bapak Big Data, yaitu data yang terlalu besar untuk diproses dalam sebuah server, terlalu cepat berubah kalau disimpan dalam data warehouse, dan terlalu acak (unstructured) apabila disimpan dalam suatu database (RDBMS).
Menurut perusahaan Oracle, Big Data yaitu data yang mengandung banyak sekali macam tipe (Variety), berjumlah sangat besar (Volume), dan bergerak cepat (Velocity), dan dengan adanya 3V tersebut, pelaku bisnis sanggup menjawab permasalahan bisnisnya dengan Data Analytics.
Dari kedua klarifikasi Big Data di atas, terdapat beberapa kesamaan dasar tumbuhnya Big Data yaitu, pertama, pertumbuhan data yang semakin pesat dan ukuran penyimpanan data yang semakin meningkat, kedua, pemrosesan structured dan unstructured data, serta terakhir pedoman pemrosesan data.
Pertumbuhan dan Penyimpanan Data
Pertumbuhan dan penyimpanan data berkembang secara pesat semenjak kita memasuki zaman digital. Dimulai dari perkembangan analog storage menyerupai tape atau film, menuju digital storage menyerupai harddisk, flash drive, atau bluray, pertumbuhan dan penyimpanan data meningkat berbanding lurus antara keduanya.
Pada pertumbuhan data, kita sanggup melihat sendiri perkembangan kualitas data dan semakin banyaknya sumber data. Sebagai contoh, digital movie yang sebelumnya memakai resolusi Video Graphics Array (VGA) dengan ukuran lebar 640 pixel dan tinggi 480 pixel, kini pada umumnya memakai resolusi 4K High Definition dengan ukuran lebar 3840 pixel dan tinggi 2160 pixel.
Contoh lain yaitu dengan adanya Internet of Things, semakin besar data yang dikumpulkan menyerupai teladan Fitness Band yang selalu menyimpan data-data ketika kita sedang beraktivitas maupun tertidur dan sensor-sensor yang selalu menyimpan perubahan data untuk dilakukan analisis kemudian.
Pada penyimpanan data, kita juga menyaksikan perkembangan media penyimpanan data yang semakin besar kapasitasnya dan semakin cepat performanya. Sebagai teladan pada gambar 2, storage server dengan ukuran yang sama pada tahun 1991 mempunyai kapasitas 2 GB, dan pada tahun 2013 mempunyai kapasitas 720 TB. Contoh yang lain yaitu throughput sebuah harddisk pada tahun 1991 yaitu 9.
Dengan pertumbuhan data yang semakin cepat dan penyimpanan data yang semakin besar, maka diharapkan suatu teknologi yang sanggup memakai data tersebut untuk memperlihatkan solusi permasalahan bisnis yang dihadapi, yaitu Big Data.
Structured dan Unstructured Data
Fungsi utama dari Sistem Informasi yaitu melaksanakan administrasi informasi berupa data terstruktur dan tidak terstruktur. Structured data yaitu kumpulan informasi yang mempunyai kamus data tetap dalam sebuah rekaman basis data. Kumpulan informasi tersebut ditampung dalam sebuah Relational Database Management System (RDBMS). Sebagai teladan yaitu data cuti pegawai dalam sebuah tabel Cuti Pegawai pada basis data Sistem Kepegawaian memakai RDBMS SQL Server.
Sedangkan unstructured data yaitu kebalikannya, yaitu kumpulan informasi yang tidak mempunyai data model dan tidak terorganisir sehingga sulit untuk dimengerti oleh bahasa pemrograman pada umumnya. Sebagai teladan yaitu informasi yang tersimpan pada dokumen pdf, word, maupun video dan audio.
Pada tahun 1998, Merrill Lynch, sebuah perusahaan investasi ternama di negara Amerika Serikat menyampaikan bahwa 80-90% informasi bisnis yang berpotensi untuk dipakai mendapat laba berasal dari unstructured data. Hal ini terbukti dengan semakin banyaknya perusahaan yang tumbuh alasannya mempunyai banyak data mengenai pelanggannya, baik itu dalam bentuk structured maupun unstructured data. Sebagai teladan yaitu Google yang selalu mencatat informasi kita ketika kita melaksanakan apapun dalam ekosistemnya dan mengubahnya menjadi informasi bisnis bagi para advertisers. Oleh alasannya itu, solusi Big Data pada umumnya yaitu untuk mendapat informasi bisnis baik dari data terstruktur maupun tidak terstruktur.
Aliran Proses Data
Serupa dengan konsep Data Flow Diagram pada aplikasi, bahwa pedoman data dimulai dari inputan oleh pengguna, disimpan pada basis data, hingga dengan diproses oleh aplikasi. Untuk memperlihatkan pemahaman mengenai the value chain of data maka perlu dijelaskan terlebih dahulu mengenai konsep data generation and acquisition.
Value chain dari Big Data terdiri empat fase yaitu: data generation, data acquisition, data storage, dan data analysis. Data generation dan data acquisition merupakan proses produksi dan eksploitasi data, sedangkan data storage yaitu proses penyimpanan data, dan data analysis yaitu sebuah proses menganalisa data menjadi sebuah informasi. Semua alur value chain dari pemrosesan data ini bertujuan untuk sanggup mengubah raw material (data) yang dihasilkan sistem ketika data generation yang kemudian disimpan sebagai data source menjadi sebuah nilai yang bermanfaat yakni hasil keluaran dari tahapan data analysis.
Data generation yaitu langkah awal dari implementasi Big Data untuk memproduksi data. Data yang dihasilkan dari data generation ini ada dua jenis yaitu data yang dihasilkan dari sistem internal dan data yang dihasilkan dari internet, data internet contohnya keywords google, data postingan forum, rekaman chatting digital, microblog, dan sebagainya. Data internet tersebut seringkali berkaitan dengan acara sehari-hari dan biasanya bersifat individual, namun kalau diakumulasi dan dipetakan secara benar, data tersebut sanggup menghasilkan informasi yang mempunyai nilai manfaat menyerupai identifikasi kebiasaan pengguna, prediksi sikap masyarakat maupun sentimen masyarakat terhadap sebuah info tertentu. Contohnya ketika Kementerian Keuangan ingin melihat respons masyarakat terhadap sebuah kebijakan maupun acara yang sedang dicanangkan maka data-data dari media umum merupakan salah satu data source utama yang menyimpan informasi potensial. Karena data media umum real time sanggup mencerminkan sentimen masyarakat terhadap kebijakan pemerintah tersebut.
Data acquisition yaitu langkah selanjutnya dari pedoman data, yaitu untuk mengambil dan mengolah data untuk ditempatkan pada Data Warehouse atau Data Mart. Data storage yaitu langkah untuk menampung data hasil pengolahan pada proses data acquisition. Umumnya, hasil pemrosesan data ini ditampung pada data warehouse untuk dipakai sebagai materi analisis prediksi, pemodelan, maupun machine learning. Terakhir, data analysis yaitu langkah terakhir untuk memanfaatkan data untuk mengatasi permasalahan bisnis dan mencari peluang baru.
Sumber http://info-menarik.nett