Video: Moving Data to the Cloud - Data Warehouse vs Data Lake. What is Best? 2024
Gudang data mutakhir sekarang tampak seperti gudang data yang rumit. Data warehouse besok, meskipun - data warehouse tertinggi - akan terlihat sangat berbeda. Ada beberapa perusahaan yang telah berkelana ke arah ini, walaupun karena biaya dan kapabilitas keseluruhan, masih jarang ditemukan banyak data warehouse.
Jumlah bidang studi di gudang data tertinggi tidak terbatas karena data warehouse bersifat virtual; tidak semua terkandung dalam database tunggal atau bahkan dalam beberapa database yang Anda bebankan dan pertahankan secara pribadi.
Sebagai gantinya, hanya sebagian dari gudang Anda (mungkin sebagian kecil) secara fisik terletak di beberapa server data warehouse; Sisanya berada di luar sana di dunia maya di suatu tempat, dapat diakses melalui kemampuan jaringan seolah-olah itu adalah bagian dari beberapa gudang data yang secara fisik terpusat. Dengan gudang data yang paling tinggi, pengguna gudang Anda memiliki jumlah kemungkinan subjek-area yang tak terbatas - apapun yang mungkin menarik bagi mereka.
Pikirkan bagaimana Anda menggunakan Internet saat ini untuk mengakses situs Web di seluruh dunia - situs yang dibuat dan dikelola orang lain. Sekarang, bayangkan masing-masing situs tersebut berisi informasi tentang beberapa area tertentu yang menarik bagi Anda - bukan iklan, iklan pekerjaan, etalase elektronik, dan apa pun yang Anda habiskan untuk berselancar di Internet yang berusaha Anda temukan.
Juga bayangkan bahwa Anda dapat melakukan kueri dan menjalankan laporan dengan menggunakan konten satu atau beberapa situs ini sebagai masukan Anda. Itulah model data warehouse tertinggi: membuka kemungkinan jumlah pengguna yang tidak terbatas.
Perusahaan terdepan mulai mengejar dan memberikan konvergensi yang mulus dari berbagai jenis data: dokumen naratif, video, gambar, dan data biasa (seperti nomor dan informasi karakter). Data warehouse tertinggi memiliki semua ini - semua jenis data yang Anda butuhkan untuk mendukung pengambilan keputusan bisnis yang lebih baik.
Dari segi kapasitas total, gudang data tertinggi sangat besar; Ini melampaui batas hari ini. Distribusi informasi di banyak platform yang berbeda, infrastruktur jaringan yang jauh lebih cepat dan berkinerja lebih tinggi, dan semakin "lebih pintar" sistem manajemen basis data - selain tentu saja, kapasitas penyimpanan disk yang terus meningkat meningkatkan tingkat ekspansi kapasitas ini.