Video: Week 4 2024
Data warehouse, layer 4 dari kumpulan data yang besar, dan data pendampingnya, telah lama menjadi teknik utama yang digunakan organisasi untuk mengoptimalkan data guna membantu pengambil keputusan. Biasanya, data warehouse dan mart berisi data normal yang dikumpulkan dari berbagai sumber dan dirakit untuk memudahkan analisis bisnis.
Gudang data dan data bank menyederhanakan pembuatan laporan dan visualisasi item data yang berbeda. Mereka umumnya dibuat dari database relasional, database multidimensi, file flat, dan database objek - yang pada dasarnya adalah arsitektur penyimpanan. Dalam lingkungan tradisional, di mana kinerja mungkin bukan prioritas tertinggi, pilihan teknologi yang mendasari didorong oleh persyaratan untuk analisis, pelaporan, dan visualisasi data perusahaan.
Ini tidak berarti bahwa Anda tidak akan menciptakan dan memberi makan gudang data analitis atau data mart dengan proses batch. Sebaliknya, Anda mungkin akhirnya memiliki banyak gudang data atau data mart, dan kinerja dan skala akan mencerminkan persyaratan waktu analis dan pengambil keputusan.
Aliran data tradisional (dari transaksi, aplikasi, dan sebagainya) dapat menghasilkan banyak data yang berbeda.
-
Puluhan sumber data baru juga ada, masing-masing memerlukan beberapa tingkat manipulasi sebelum bisa tepat waktu dan berguna bagi bisnis.
-
-
Secara historis, isi gudang data dan data mart disusun dan disampaikan kepada pemimpin bisnis yang bertanggung jawab atas strategi dan perencanaan. Dengan data yang besar, tim baru memanfaatkan data untuk pengambilan keputusan.
Banyak implementasi data yang besar memberikan kemampuan real-time, sehingga bisnis harus dapat mengirimkan konten untuk memungkinkan individu dengan peran operasional menangani masalah seperti dukungan pelanggan, peluang penjualan, dan pemadaman layanan dalam waktu dekat.Dengan cara ini, data besar membantu memindahkan tindakan dari back office ke front office.
Alat dan teknik analisis yang ada akan sangat membantu dalam memahami data yang besar. Namun, ada tangkapan. Algoritma yang merupakan bagian dari alat ini harus dapat bekerja dengan sejumlah besar data real-time dan berbeda yang berpotensi. Infrastruktur perlu ada untuk mendukung hal ini.
Dan, vendor yang menyediakan alat analisis juga perlu memastikan bahwa algoritme mereka bekerja di seluruh implementasi terdistribusi. Karena kompleksitas ini, perkirakan kelas alat baru bisa membantu memahami data besar.
Ada tiga kelas alat di lapisan arsitektur referensi ini. Mereka dapat digunakan secara independen atau kolektif oleh pengambil keputusan untuk membantu mengarahkan bisnis. Tiga kelas alat adalah sebagai berikut:
Pelaporan dan dasbor:
-
Alat ini menyediakan & ldquo; user-friendly & rdquo; representasi informasi dari berbagai sumber. Meski menjadi andalan di dunia data tradisional, kawasan ini masih terus berkembang untuk data besar. Beberapa alat yang digunakan adalah perangkat tradisional yang sekarang dapat mengakses jenis database baru yang secara kolektif disebut NoSQL (Bukan Saja SQL). Visualisasi:
-
Alat ini adalah langkah selanjutnya dalam evolusi pelaporan. Outputnya cenderung bersifat sangat interaktif dan dinamis. Perbedaan penting lainnya antara laporan dan output yang divisualisasikan adalah animasi. Pengguna bisnis dapat melihat perubahan dalam data yang memanfaatkan berbagai teknik visualisasi yang berbeda, termasuk peta pikiran, peta panas, infografis, dan diagram koneksi. Pelaporan dan visualisasi terjadi pada akhir kegiatan usaha. Analytics dan analisis lanjutan:
-
Alat ini menjangkau data warehouse dan memproses data untuk konsumsi manusia. Analisis lanjutan harus menjelaskan tren atau peristiwa yang transformatif, unik, atau revolusioner terhadap praktik bisnis yang ada. Analisis prediktif dan analisis sentimen adalah contoh bagus dari sains ini.