Video: Accelerating Data Warehouse Modernization with OLAP on Hadoop 2024
Gudang data sekarang sedang dalam tekanan, mencoba untuk mengatasi meningkatnya tuntutan atas sumber daya mereka yang terbatas. Hadoop dapat memberikan kelegaan yang signifikan dalam situasi gudang data ini.
Kenaikan pesat jumlah data yang dihasilkan di dunia juga mempengaruhi data warehouse karena volume data yang mereka kelola meningkat - sebagian karena data terstruktur , jenis data yang diketik dengan kuat dan ditempatkan dalam barisan dan kolom - dihasilkan tetapi juga karena Anda sering harus menghadapi persyaratan peraturan yang dirancang untuk mempertahankan akses queryable terhadap data historis.
mart (subset terpisah dari gudang data) untuk aplikasi analisis tertentu. Selain itu, kebutuhan tersebut meningkat bagi analis untuk mengeluarkan pertanyaan baru terhadap data terstruktur yang tersimpan di gudang, dan kueri ad hoc ini sering kali menggunakan sumber data yang signifikan. Terkadang laporan satu kali mungkin cukup, dan terkadang analisis eksploratif diperlukan untuk menemukan pertanyaan yang belum diajukan namun dapat menghasilkan nilai bisnis yang signifikan.
Angka tersebut menunjukkan, dengan menggunakan arsitektur tingkat tinggi, bagaimana Hadoop dapat hidup berdampingan dengan gudang data dan memenuhi beberapa tujuan yang tidak mereka rancang.
Hadoop adalah gudang
pembantu, bukan pengganti gudang. Hadoop dapat memodernisasi ekosistem data pergudangan dalam empat cara; Inilah ringkasannya:
-
Batalkan data untuk menyediakan arsip data dingin yang dapat diklasifikasikan.
-
Mensfaatkan efisiensi pemrosesan batch berskala besar Hadoop ke preprocess dan mentransformasikan data untuk gudang.
-
Aktifkan lingkungan untuk penemuan data ad hoc.