Rumah Keuangan Pribadi Zona Pendaratan Berbasis Hadoop - dummies

Zona Pendaratan Berbasis Hadoop - dummies

Video: Technology Stacks - Computer Science for Business Leaders 2016 2024

Video: Technology Stacks - Computer Science for Business Leaders 2016 2024
Anonim

Saat Anda mencoba memecahkan masalah lingkungan analisis Mungkin akan terlihat seperti di masa depan, Anda menemukan pola zona pendaratan berbasis Hadoop berkali-kali. Sebenarnya, ini bukan lagi diskusi yang berorientasi pada masa depan karena zona pendaratan telah menjadi cara yang tepat sehingga perusahaan yang mencari masa depan sekarang mencoba menghemat biaya TI dan menyediakan platform untuk analisis data inovatif. Jadi, apa tepatnya zona pendaratan? Pada tingkat yang paling dasar, zona pendaratan hanya sebagai tempat utama dimana data akan mendarat di perusahaan Anda - ekstraksi data mingguan dari database operasional, misalnya, atau dari sistem yang menghasilkan file log. Hadoop adalah repositori yang berguna untuk data tanah, karena alasan berikut:

Ini bisa menangani semua jenis data. Ini mudah terukur.

harganya murah.
  • Setelah data tanah Anda di Hadoop, Anda memiliki fleksibilitas untuk bertanya, menganalisis, atau memproses data dengan berbagai cara.

  • Diagram ini hanya menunjukkan bagian dari cerita dan sama sekali tidak lengkap. Setelah semua, Anda perlu tahu bagaimana data bergerak dari zona pendaratan ke gudang data, dan seterusnya.

  • Titik awal untuk diskusi mengenai modernisasi data warehouse adalah bagaimana organisasi menggunakan gudang data dan tantangan yang dihadapi departemen TI dengan mereka.

Pada tahun 1980an, begitu organisasi menjadi pandai menyimpan informasi operasional mereka di database relasional (transaksi penjualan, misalnya, atau status rantai pasokan), para pemimpin bisnis mulai menginginkan laporan yang dihasilkan dari data relasional ini. Toko relasional paling awal adalah database operasional dan dirancang untuk Online Transaction Processing (OLTP), sehingga catatan dapat disisipkan, diperbarui, atau dihapus secepat mungkin.

Ini adalah arsitektur yang tidak praktis untuk pelaporan dan analisis skala besar, sehingga database Relational Online Analytical Processing (ROLAP) dikembangkan untuk memenuhi kebutuhan ini. Hal ini menyebabkan evolusi tipe RDBMS yang baru: gudang data

yang merupakan entitas terpisah dan tinggal di samping toko data operasional organisasi.

Ini turun menggunakan alat yang dirancang khusus untuk efisiensi yang lebih besar: Anda memiliki toko data operasional, yang dirancang untuk memproses transaksi secara efisien, dan gudang data, yang dirancang untuk mendukung analisis dan pelaporan berulang. Gudang data mengalami tekanan yang meningkat, karena alasan berikut: Meningkatnya permintaan untuk menyimpan data online yang lebih lama.

Meningkatnya permintaan akan sumber daya pengolahan untuk mentransformasikan data untuk digunakan di gudang lain dan data mart.

Meningkatnya permintaan akan analisis inovatif, yang mengharuskan analis mengajukan pertanyaan pada data gudang, di atas laporan reguler yang sudah selesai dilakukan. Hal ini dapat menimbulkan proses tambahan yang signifikan.

  • Pada gambar tersebut, Anda dapat melihat gudang data yang disajikan sebagai sumber utama untuk berbagai jenis analisis yang tercantum di sisi kanan gambar. Disini Anda juga melihat konsep landing zone yang diwakili, dimana Hadoop akan menyimpan data dari berbagai sumber data yang masuk.

  • Untuk mengaktifkan zona pendaratan Hadoop, Anda harus memastikan bahwa Anda dapat menulis data dari berbagai sumber data ke HDFS. Untuk database relasional, solusi yang bagus adalah menggunakan Sqoop.

  • Tapi pendaratan data hanyalah permulaan.

Bila Anda memindahkan data dari banyak sumber ke zona pendaratan Anda, satu masalah yang pasti akan Anda hadapi adalah kualitas data. Sudah umum bagi perusahaan untuk memiliki banyak basis data operasional yang rincian utamanya berbeda, misalnya, bahwa pelanggan mungkin dikenal sebagai "D. deRoos "dalam satu database, dan" Dirk deRoos "di tempat lain.

Masalah kualitas lainnya terletak pada sistem di mana ada ketergantungan yang tinggi pada entri data manual, baik dari pelanggan atau staf - di sini, tidak biasa menemukan nama depan dan nama belakang diaktifkan atau informasi salah lainnya di bidang data.

Masalah kualitas data adalah masalah besar untuk lingkungan data warehouse, dan oleh karena itu banyak usaha menuju tahap pembersihan dan validasi karena data dari sistem lain diproses karena dimuat ke gudang. Semuanya turun ke

kepercayaan

: jika data yang Anda ajukan bertentangan adalah kotor, Anda tidak dapat mempercayai jawaban dalam laporan Anda.

Jadi, sementara ada potensi besar untuk memiliki akses ke berbagai kumpulan data dari berbagai sumber di zona pendaratan Hadoop Anda, Anda harus mempertimbangkan kualitas data dan seberapa besar Anda dapat mempercayai data.

Zona Pendaratan Berbasis Hadoop - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...