Rumah Keuangan Pribadi Hadoop sebagai Data Tujuan Arsip - dummies

Hadoop sebagai Data Tujuan Arsip - dummies

Video: GCP-How to Install Cloudera Manager on Google Cloud Cluster 2024

Video: GCP-How to Install Cloudera Manager on Google Cloud Cluster 2024
Anonim

Biaya penyimpanan yang murah untuk Hadoop ditambah kemampuan untuk mengurutkan data Hadoop dengan SQL menjadikan Hadoop sebagai tujuan utama untuk data arsip. Kasus penggunaan ini berdampak rendah pada organisasi Anda karena Anda dapat mulai membangun keahlian Hadoop Anda pada data yang tidak tersimpan dalam sistem mission-critical.

Terlebih lagi, Anda tidak harus bekerja keras untuk mendapatkan data. (Karena data yang diarsipkan biasanya disimpan pada sistem yang memiliki penggunaan rendah, lebih mudah untuk mendapatkan daripada data yang ada di "pusat perhatian" pada sistem mission-critical kinerja, seperti gudang data.) Jika Anda sudah menggunakan Hadoop sebagai pendaratan zona, Anda memiliki dasar untuk arsip Anda! Anda hanya menyimpan apa yang ingin Anda arsipkan dan hapus apa yang tidak Anda inginkan.

Jika Anda memikirkan zona pendaratan Hadoop, arsip queryable, yang ditunjukkan pada gambar, memperluas nilai Hadoop dan mulai mengintegrasikan potongan yang mungkin sudah ada di perusahaan Anda. Ini adalah contoh bagus untuk menemukan peluang skala ekonomi dan peluang take-out dengan menggunakan Hadoop.

Di sini, komponen arsip menghubungkan zona pendaratan dan gudang data. Data yang diarsipkan berasal dari gudang dan kemudian disimpan di cluster Hadoop, yang juga menyediakan zona pendaratan. Singkatnya, Anda dapat menggunakan cluster Hadoop yang sama untuk mengarsipkan data dan bertindak sebagai zona pendaratan Anda.

Teknologi kunci Hadoop yang akan Anda gunakan untuk melakukan pengarsipan adalah Sqoop, yang dapat memindahkan data yang akan diarsipkan dari gudang data ke dalam Hadoop. Anda perlu mempertimbangkan bentuk yang Anda inginkan agar data diambil di cluster Hadoop Anda. Secara umum, file Hive yang dikompres adalah pilihan yang tepat.

Anda dapat, tentu saja, mengubah data dari struktur gudang menjadi bentuk lain (misalnya, bentuk yang dinormalisasi untuk mengurangi redundansi), namun ini umumnya bukan ide bagus. Menjaga data dalam struktur yang sama seperti apa yang ada di gudang akan mempermudah pencarian kueri data lengkap di data arsip di Hadoop dan data aktif yang ada di gudang.

Konsep query baik kumpulan data yang aktif dan arsip membawa pertimbangan lain: berapa banyak data yang harus Anda arsipkan? Sebenarnya ada dua pilihan umum: mengarsipkan semuanya sebagai data yang ditambahkan dan diubah di gudang data, atau hanya mengarsipkan data yang Anda anggap kedinginan.

Mengarsipkan semuanya bermanfaat untuk memungkinkan Anda dengan mudah mengeluarkan kueri dari satu antarmuka tunggal di seluruh kumpulan data - tanpa arsip lengkap, Anda harus mencari solusi kueri federasi di mana Anda harus menyatukan hasil dari arsip dan gudang data aktif.

Tapi downside di sini adalah bahwa update reguler data data gudang data Anda akan menyebabkan sakit kepala untuk arsip berbasis Hadoop. Ini karena setiap perubahan pada data pada masing-masing baris dan kolom akan memerlukan penghapusan grosir dan pengatalogan ulang kumpulan data yang ada.

Sekarang data arsip disimpan di zona pendaratan berbasis Hadoop Anda (dengan asumsi Anda menggunakan opsi seperti file Hive yang dikompres yang disebutkan sebelumnya), Anda dapat mengisinya. Di sinilah solusi SQL on Hadoop bisa menjadi menarik.

Contoh yang bagus tentang apa yang mungkin adalah alat analisis (di sebelah kanan gambar) untuk langsung menjalankan laporan atau analisis pada data arsip yang tersimpan di Hadoop. Ini bukan untuk mengganti gudang data - bagaimanapun juga, Hadoop tidak akan dapat mencocokkan karakteristik kinerja gudang karena mendukung ratusan pengguna yang mengajukan pertanyaan yang rumit.

Intinya di sini adalah Anda dapat menggunakan alat pelaporan melawan Hadoop untuk bereksperimen dan mengajukan pertanyaan baru untuk dijawab di gudang atau mart khusus.

Saat memulai proyek berbasis Hadoop pertama untuk pengarsipan data gudang, jangan hentikan proses yang ada sampai Anda benar-benar mengujinya pada solusi Hadoop baru Anda. Dengan kata lain, jika strategi pergudangan Anda saat ini adalah arsip ke tape, simpan proses itu di tempat, dan arsipkan data ke dalam Hadoop dan tape sampai Anda benar-benar menguji skenario (yang biasanya mencakup pemulihan data gudang dalam kasus dari kegagalan gudang).

Meskipun Anda mempertahankan (dalam jangka pendek) dua repositori arsip, Anda akan memiliki infrastruktur yang kuat dan diuji sebelum Anda membatalkan proses yang benar dan benar. Proses ini dapat memastikan Anda tetap bekerja - dengan atasan Anda saat ini.

Kasus penggunaan ini sederhana karena tidak ada perubahan pada gudang yang ada. Tujuan bisnisnya tetap sama: biaya penyimpanan dan perizinan yang lebih murah dengan cara memigrasi data yang jarang digunakan ke arsip. Perbedaan dalam kasus ini adalah teknologi di balik arsip tersebut adalah Hadoop daripada penyimpanan offline, seperti tape.

Selain itu, berbagai vendor arsip telah mulai memasukkan Hadoop ke dalam solusi mereka (misalnya, membiarkan arsip arsip milik mereka berada pada HDFS), sehingga diharapkan kemampuan di area ini segera berkembang.

Saat Anda mengembangkan keterampilan Hadoop (seperti bertukar data antara database Hadoop dan relasional dan data kueri di HDFS), Anda dapat menggunakannya untuk mengatasi masalah yang lebih besar, seperti proyek analisis, yang dapat memberikan nilai tambah bagi investasi Hadoop organisasi Anda.

Hadoop sebagai Data Tujuan Arsip - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...