Video: Amazon, Jeff Bezos and collecting data | DW Documentary 2024
Banyak kombinasi model penyebaran dan pengiriman ada untuk data besar di awan. Misalnya, Anda bisa memanfaatkan awan publik IaaS atau awan privat IaaS. Jadi, apa artinya ini untuk data besar dan mengapa awan itu cocok untuk itu? Nah, data besar membutuhkan cluster power hit yang terdistribusi, begitulah awan diapit.
Sebenarnya, sejumlah karakteristik awan menjadikannya bagian penting dari ekosistem data besar:
Skalabilitas berkaitan dengan perangkat keras mengacu pada kemampuan untuk beralih dari kecil ke jumlah besar daya pemrosesan dengan arsitektur yang sama. Berkenaan dengan perangkat lunak, ini mengacu pada konsistensi kinerja per unit daya saat sumber daya perangkat keras meningkat. Awan bisa naik ke volume data yang besar. Komputasi terdistribusi, bagian integral dari model awan, benar-benar bekerja pada rencana "bagi dan menaklukkan". Jadi jika Anda memiliki data dalam jumlah besar, mereka dapat dipartisi di server awan. Karakteristik penting dari IaaS adalah bahwa ia dapat secara dinamis berskala. Ini berarti bahwa jika Anda menghabiskan lebih banyak sumber daya daripada yang diharapkan, Anda bisa mendapatkannya. Ini terkait dengan konsep elastisitas.
Penyatuan sumber daya:
Arsitektur awan memungkinkan penciptaan kelompok sumber daya bersama secara efisien yang membuat awan layak secara ekonomi.
Self-service: Dengan swalayan, pengguna sumber daya awan dapat menggunakan browser atau portal untuk mendapatkan sumber daya yang dibutuhkan, katakanlah, untuk menjalankan prediksi yang besar model. Ini sangat berbeda dari pada bagaimana Anda bisa mendapatkan sumber daya dari pusat data, di mana Anda harus meminta sumber daya dari operasi TI.
Seringkali biaya di muka rendah:Jika Anda menggunakan penyedia awan, biaya di muka seringkali dapat dikurangi karena Anda tidak membeli perangkat keras dalam jumlah besar atau menyewa tempat baru untuk menangani data besar Anda. Dengan memanfaatkan skala ekonomi yang terkait dengan lingkungan awan, awan bisa terlihat menarik. Bayar saat Anda pergi:
Pilihan penagihan biasa untuk penyedia awan adalah Pay as You Go, yang berarti Anda ditagih untuk sumber daya yang digunakan berdasarkan harga sebenarnya.Ini bisa berguna jika Anda tidak yakin dengan sumber daya yang Anda butuhkan untuk proyek data besar Anda. Toleransi kesalahan:
Penyedia layanan awan harus memiliki toleransi kesalahan yang terpasang pada arsitektur mereka, memberikan layanan tanpa gangguan meskipun terjadi kegagalan satu atau lebih komponen sistem. Jelas, sifat dasar awan menjadikannya lingkungan komputasi ideal untuk data besar. Jadi bagaimana Anda bisa menggunakan data besar bersama dengan cloud? Berikut adalah beberapa contohnya:
IaaS di awan publik: Dalam skenario ini, Anda akan menggunakan infrastruktur penyedia awan publik untuk layanan data besar Anda karena Anda tidak ingin menggunakan infrastruktur fisik Anda sendiri. IaaS dapat menyediakan penciptaan mesin virtual dengan penyimpanan yang hampir tak terbatas dan menghitung daya. Anda dapat memilih sistem operasi yang Anda inginkan, dan Anda memiliki fleksibilitas untuk menyesuaikan lingkungan secara dinamis untuk memenuhi kebutuhan Anda.
PaaS di awan pribadi:
-
PaaS adalah keseluruhan paket infrastruktur sehingga bisa digunakan untuk merancang, menerapkan, dan menerapkan aplikasi dan layanan di lingkungan awan publik atau swasta. PaaS memungkinkan sebuah organisasi untuk memanfaatkan layanan middleware utama tanpa harus berurusan dengan kompleksitas pengelolaan elemen perangkat keras dan perangkat lunak individual. Vendor PaaS mulai menggabungkan teknologi data besar seperti Hadoop dan MapReduce ke dalam penawaran PaaS mereka. Misalnya, Anda mungkin ingin membuat aplikasi khusus untuk menganalisis sejumlah besar data medis. Aplikasi ini akan memanfaatkan data real-time maupun non-real-time. Ini akan membutuhkan Hadoop dan MapReduce untuk penyimpanan dan pemrosesan.
-
SaaS di awan hibrida: Disini Anda mungkin ingin menganalisis data "suara pelanggan" dari beberapa saluran. Banyak perusahaan menyadari bahwa salah satu sumber data terpenting adalah apa yang dipikirkan dan dikatakan pelanggan tentang perusahaan mereka. Mendapatkan akses ke suara data pelanggan dapat memberikan wawasan yang tak ternilai tentang perilaku dan tindakan. Semakin banyak, pelanggan "menyuarakan" di situs publik.
Nilai masukan pelanggan dapat ditingkatkan dengan menggabungkan data publik ini ke dalam analisis Anda.
-