Video: APA ITU BIG DATA? 2024
Analisis data yang besar telah banyak mendapat hype baru-baru ini, dan untuk alasan yang bagus. Anda perlu mengetahui karakteristik analisis data yang besar jika Anda ingin menjadi bagian dari gerakan ini. Perusahaan tahu ada sesuatu di luar sana, tapi sampai saat ini, belum bisa menambangnya. Ini mendorong amplop pada analisis merupakan aspek menarik dari pergerakan analisis data yang besar.
Perusahaan sangat antusias untuk dapat mengakses dan menganalisis data yang telah mereka kumpulkan atau ingin mendapatkan wawasan, namun belum dapat mengelola atau menganalisis secara efektif. Ini mungkin melibatkan visualisasi sejumlah besar data yang berbeda, atau mungkin melibatkan analisis lanjutan yang streaming pada Anda secara real time. Ini bersifat evolusioner dalam beberapa hal dan revolusioner pada orang lain.
Jadi, apa bedanya ketika perusahaan Anda mendorong amplop dengan analisis data yang besar? Infrastruktur yang mendukung analisis data yang besar berbeda dan algoritma telah berubah menjadi infrastruktur yang sadar.
Analisis data yang besar harus dilihat dari dua perspektif:
-
Berpikir berorientasi
-
Berorientasi pada tindakan
Analisis berorientasi keputusan lebih mirip dengan kecerdasan bisnis tradisional. Lihatlah subset selektif dan representasi sumber data yang lebih besar dan cobalah menerapkan hasilnya pada proses pembuatan keputusan bisnis. Tentunya keputusan ini bisa menghasilkan semacam tindakan atau perubahan proses, namun tujuan analisisnya adalah untuk menambah pengambilan keputusan.
Analisis berorientasi aksi digunakan untuk respon cepat, ketika sebuah pola muncul atau jenis data tertentu terdeteksi dan tindakan diperlukan. Mengambil keuntungan dari data besar melalui analisis dan menyebabkan perubahan perilaku proaktif atau reaktif menawarkan potensi besar bagi pengguna awal.
Menemukan dan memanfaatkan data besar dengan membuat aplikasi analisis dapat menahan kunci untuk mengekstrak nilai lebih cepat daripada nanti. Untuk menyelesaikan tugas ini, lebih efektif untuk membangun aplikasi khusus ini dari nol atau dengan memanfaatkan platform dan / atau komponen.
Pertama, lihat beberapa karakteristik tambahan dari analisis data besar yang membedakannya dari jenis analisis tradisional selain dari tiga Vs volume, kecepatan, dan variasi:
-
Bisa jadi program. Salah satu perubahan analisis terbesar adalah bahwa di masa lalu Anda berurusan dengan kumpulan data yang dapat dimuat secara manual ke dalam aplikasi dan eksplorasi. Dengan analisis data yang besar, Anda mungkin dihadapkan pada situasi di mana Anda bisa memulai dengan data mentah yang sering perlu ditangani secara terencana untuk melakukan eksplorasi apa pun karena skala data. Dapat data digerakkan.
-
Sementara banyak ilmuwan data menggunakan pendekatan berbasis hipotesis untuk analisis data (mengembangkan premis dan mengumpulkan data untuk melihat apakah premis itu benar), Anda juga dapat menggunakan data tersebut untuk mendorong analisis - terutama jika Anda mengumpulkan banyak jumlah itu Misalnya, Anda dapat menggunakan algoritma pembelajaran mesin untuk melakukan analisis bebas-hipotesis semacam ini. Ini bisa menggunakan banyak atribut .
-
Di masa lalu, Anda mungkin telah berurusan dengan ratusan atribut atau karakteristik dari sumber data tersebut. Sekarang Anda mungkin berurusan dengan ratusan gigabyte data yang terdiri dari ribuan atribut dan jutaan pengamatan. Semuanya sekarang terjadi dalam skala yang lebih besar. Bisa jadi iteratif.
-
Lebih menghitung daya berarti Anda dapat melakukan iterasi pada model Anda sampai Anda mengerti bagaimana Anda menginginkannya. Inilah contohnya. Asumsikan Anda membangun model yang mencoba menemukan prediktor untuk perilaku pelanggan tertentu yang terkait. Anda mungkin mulai mengeluarkan sampel data yang masuk akal atau menghubungkan ke tempat data berada. Anda bisa membuat model untuk menguji hipotesis. Padahal di masa lalu Anda mungkin tidak memiliki banyak memori untuk membuat model Anda bekerja dengan efektif, Anda memerlukan sejumlah besar memori fisik untuk melewati iterasi yang diperlukan untuk melatih algoritma. Mungkin juga perlu menggunakan teknik komputasi tingkat lanjut seperti pemrosesan bahasa alami atau jaringan syaraf tiruan yang secara otomatis mengembangkan model berdasarkan pembelajaran karena lebih banyak data ditambahkan. Anda bisa menggunakan siklus perhitungan yang Anda butuhkan dengan memanfaatkan Infrastruktur berbasis awan sebagai Layanan.
Dengan platform Infrastruktur sebagai Layanan (IaaS) seperti Amazon Cloud Services (ACS), Anda dapat dengan cepat menyediakan sekumpulan mesin untuk menelan kumpulan data yang besar dan menganalisisnya dengan cepat.
-