Rumah Keuangan Pribadi Analisis Data Besar dan Data Warehouse - dummies

Analisis Data Besar dan Data Warehouse - dummies

Daftar Isi:

Video: Integrasi Data Warehouse - Tugas Besar Basis Data Kelompok 9 2024

Video: Integrasi Data Warehouse - Tugas Besar Basis Data Kelompok 9 2024
Anonim

Anda akan menemukan nilai dalam membawa kemampuan data warehouse dan lingkungan data yang besar bersama-sama. Anda perlu menciptakan lingkungan hibrida dimana data besar dapat bekerja bergandengan tangan dengan data warehouse.

Pertama, penting untuk mengenali bahwa data warehouse seperti yang dirancang hari ini tidak akan berubah dalam jangka pendek.

Oleh karena itu, lebih pragmatis untuk menggunakan gudang data untuk apa yang telah dirancangnya - memberikan versi kebenaran yang benar tentang topik yang ingin dianalisis oleh bisnis. Gudang itu mungkin mencakup informasi tentang lini produk perusahaan tertentu, pelanggannya, pemasoknya, dan rincian transaksi satu tahun.

Informasi yang dikelola di gudang data atau data mart departemen telah dibangun dengan hati-hati sehingga metadata akurat. Dengan berkembangnya informasi berbasis web baru, praktis dan sering diperlukan untuk menganalisis sejumlah besar data ini dalam konteks dengan data historis. Di sinilah model hibrida masuk.

Aspek tertentu untuk menikahi data warehouse dengan data yang besar bisa jadi relatif mudah. Misalnya, banyak sumber data besar berasal dari sumber yang menyertakan metadata mereka sendiri yang dirancang dengan baik. Situs e-commerce yang kompleks mencakup elemen data yang terdefinisi dengan baik. Oleh karena itu, ketika melakukan analisis antara gudang dan sumber data yang besar, organisasi manajemen informasi bekerja dengan dua kumpulan data dengan model metadata yang dirancang dengan cermat yang harus dirasionalisasi.

Tentu saja, dalam beberapa situasi, sumber informasi tidak memiliki metadata yang jelas. Sebelum seorang analis dapat menggabungkan data transaksional historis dengan data yang kurang terstruktur, pekerjaan harus dilakukan. Biasanya, analisis awal petabyte data akan mengungkapkan pola menarik yang dapat membantu memprediksi perubahan halus dalam bisnis atau solusi potensial terhadap diagnosis pasien.

Analisis awal dapat diselesaikan dengan memanfaatkan tool seperti MapReduce dengan kerangka sistem file Hadoop yang terdistribusi. Pada titik ini, Anda bisa mulai mengerti apakah mampu membantu mengevaluasi masalah yang sedang ditangani.

Dalam proses analisis, sama pentingnya menghilangkan data yang tidak perlu karena mengidentifikasi data yang relevan dengan konteks bisnis. Bila fase ini selesai, data yang tersisa perlu ditransformasikan sehingga definisi metadata tepat. Dengan cara ini, bila data besar digabungkan dengan data historis tradisional dari gudang, hasilnya akan akurat dan bermakna.

Integrasi data besar lynchpin

Proses ini memerlukan strategi integrasi data yang terdefinisi dengan baik. Sementara integrasi data merupakan elemen penting dalam mengelola data besar, sama pentingnya saat membuat analisis hibrida dengan data warehouse. Sebenarnya, proses penggalian data dan transformasi di lingkungan hibrida sangat mirip dengan bagaimana proses ini dijalankan dalam gudang data tradisional.

Di gudang data, data diekstraksi dari sistem sumber tradisional seperti sistem CRM atau ERP. Sangat penting bahwa elemen dari berbagai sistem ini benar-benar cocok.

Memikirkan ulang ekstraksi, transformasi, dan beban untuk gudang data

Di gudang data, Anda sering menemukan kombinasi tabel database relasional, file flat, dan sumber nonrelasional. Sebuah gudang data yang dibangun dengan baik akan diarsipkan sehingga data diubah menjadi format umum, sehingga query dapat diproses secara akurat dan konsisten. File yang diekstraksi harus diubah agar sesuai dengan peraturan dan proses bisnis dari area subjek yang dirancang untuk dianalisis data warehouse.

Dengan kata lain, data harus diambil dari sumber data yang besar sehingga sumber ini dapat bekerja dengan aman dan menghasilkan hasil yang berarti. Selain itu, sumbernya harus ditransformasikan sehingga sangat membantu dalam menganalisis hubungan antara data historis dan data yang lebih dinamis dan real-time yang berasal dari sumber data yang besar.

Memuat informasi dalam model data besar akan berbeda dari yang Anda harapkan di gudang data tradisional. Dengan gudang data, setelah data dikodifikasi, tidak pernah ada perubahan. Data warehouse yang khas akan menyediakan data snapshot bisnis berdasarkan kebutuhan untuk menganalisis masalah bisnis tertentu yang memerlukan pemantauan, seperti persediaan atau penjualan.

Struktur terdistribusi dari data besar akan sering mengarahkan organisasi untuk memasukkan data pertama ke dalam rangkaian node dan kemudian melakukan ekstraksi dan transformasi. Saat membuat hibrida dari gudang data tradisional dan lingkungan data yang besar, sifat terdistribusi dari lingkungan data yang besar dapat secara dramatis mengubah kemampuan organisasi untuk menganalisis sejumlah besar data dalam konteks bisnis.

Analisis Data Besar dan Data Warehouse - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...