Rumah Keuangan Pribadi Hadoop sebagai mesin pemroses data - dummies

Hadoop sebagai mesin pemroses data - dummies

Video: Hadoop Processing Frameworks 2025

Video: Hadoop Processing Frameworks 2025
Anonim

Salah satu kasus penggunaan paling awal untuk Hadoop di perusahaan adalah sebagai mesin transformasi program yang digunakan untuk data preprocessing yang terikat untuk gudang data. Pada dasarnya, kasus penggunaan ini memanfaatkan kekuatan ekosistem Hadoop untuk memanipulasi dan menerapkan transformasi ke data sebelum dimuat ke gudang data.

Meskipun mesin transformasi sebenarnya masih baru (ini adalah Hadoop, jadi transformasi dan arus data dikodekan dalam Pig atau MapReduce, di antara bahasa-bahasa lain), pendekatan itu sendiri telah digunakan sesekali dengan proses Extract, Transform, Load (ETL).

Pikirkan evolusi database OLTP dan ROLAP. Banyak organisasi dengan database operasional juga mengerahkan data warehouse. Jadi bagaimana departemen TI mendapatkan data dari database operasional mereka ke gudang data mereka? (Ingatlah bahwa data operasional biasanya tidak dalam bentuk yang sesuai dengan analisisnya.)

Jawabannya di sini adalah ETL, dan karena gudang data meningkat dalam penggunaan dan kepentingan, langkah-langkah dalam proses menjadi sangat dipahami dan praktik terbaik adalah dikembangkan. Selain itu, sejumlah perusahaan perangkat lunak mulai menawarkan solusi ETL yang menarik sehingga departemen TI dapat meminimalkan pengembangan kode kustom mereka sendiri.

Proses ETL dasar cukup mudah: Anda E xtract data dari database operasional, T ransform ke dalam bentuk yang Anda butuhkan untuk analisis dan alat pelaporan, dan kemudian Anda L memasukkan data ini ke gudang data Anda.

Salah satu variasi yang umum terjadi pada ETL adalah ELT - Extract, Load, and Transform. Dalam proses ELT, Anda melakukan transformasi (berlawanan dengan ETL) setelah memuat data ke dalam repositori target. Pendekatan ini sering digunakan ketika transformasi benar-benar bermanfaat dari mesin pemrosesan SQL yang sangat cepat pada data terstruktur. (Database relasional mungkin tidak unggul dalam memproses data tidak terstruktur, namun mereka melakukan pemrosesan dengan sangat cepat - tebak apa? - data terstruktur.)

Jika data yang Anda transformasi ditakdirkan untuk gudang data, dan banyak dari transformasi tersebut dapat dilakukan di SQL, Anda dapat memilih untuk menjalankan transformasi di gudang data itu sendiri. ELT sangat menarik jika sebagian besar keahlian Anda terletak pada perkakas berbasis SQL.

Dengan Hadoop sekarang bisa memproses query SQL, baik beban kerja ETL maupun ELT dapat di-host di Hadoop. Angka tersebut menunjukkan layanan ETL ditambahkan ke arsitektur referensi.

Jika Anda telah menggunakan zona pendaratan berbasis Hadoop, Anda memiliki hampir semua yang Anda butuhkan untuk menggunakan Hadoop sebagai mesin transformasi.Anda sudah menyiapkan data dari sistem operasional Anda ke Hadoop menggunakan Sqoop, yang mencakup langkah ekstraksi. Pada titik ini Anda harus menerapkan logika transformasi Anda ke aplikasi MapReduce atau Pig. Setelah data ditransformasikan, Anda bisa memasukkan data ke dalam gudang data menggunakan Sqoop.

Menggunakan Hadoop sebagai mesin transformasi data juga memunculkan kemungkinan. Jika gudang data Anda tidak mengubah datanya (hanya untuk pelaporan), Anda bisa menyimpan data yang Anda hasilkan dengan proses transformasi. Dalam model ini, data hanya mengalir dari kiri ke kanan pada gambar, dimana data diambil dari database operasional, ditransformasikan di zona pendaratan, dan kemudian dimasukkan ke dalam gudang data.

Dengan semua data yang telah berubah yang sudah ada di zona pendaratan, Anda tidak perlu menyalinnya kembali ke Hadoop - kecuali, tentu saja, data akan dimodifikasi di gudang.

Hadoop sebagai mesin pemroses data - dummies

Pilihan Editor

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Sementara ada cara baru untuk membuat tabel di Office 2011 untuk Mac, Anda masih bisa menggunakan teknik stand-by. Menu yang familiar masih bekerja di Office 2011 untuk Mac, dan inilah buktinya. Dialog meja semuanya masih ada di sana: Di Word, pilih Table → Insert → Table; Sebagai alternatif, pada tab Tabel Ribbon, di Tabel Pilihan ...

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Apakah Anda menggunakan Office 2011 untuk Mac atau Produk Microsoft Office lainnya, toolbar Anda bisa sangat berantakan. Setiap kali Anda merasa perlu untuk men-tweak antarmuka aplikasi Microsoft Office, Anda perlu memanggil dialog Customize Toolbars and Menus. Ini adalah dialog super kuat di Word, Excel, dan PowerPoint yang memungkinkan Anda ...

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Setelah Anda menyesuaikan Office 2011 Anda bilah alat dan antarmuka, Anda dapat berbagi penyesuaian dengan orang lain. Namun, pastikan bahwa Anda menasihati orang-orang yang telah Anda lakukan sebelum membagikan dokumen Anda dengannya; Jika tidak, mereka mungkin akan terkejut saat mereka membuka dokumen Anda dan melihat susunan toolbar atau menu yang berbeda dari pada apa ...

Pilihan Editor

Penting Office 2007 Commands - dummies

Penting Office 2007 Commands - dummies

Anda dapat membuat program Office 2007 lebih mudah jika Anda menggunakan pintasan sederhana ini. Perintah-perintah ini, seperti mengurungkan kesalahan dan memperbesar dan memperkecil akan membantu Anda menghemat waktu. Memasuki simbol: Untuk memasukkan simbol atau karakter asing yang tidak ada pada keyboard Anda, masuk ke tab Insert dan klik Symbol ...

Menyesuaikan Perintah Menu di Office 2003 - dummies

Menyesuaikan Perintah Menu di Office 2003 - dummies

Office 2003 menyediakan dua teknik untuk menyesuaikan menu dan perintah menu. Anda bisa memulai dari kotak dialog Rearrange Commands atau menggunakan metode drag-and-drop. Teruslah membaca. Menangani perintah menu di kotak dialog Rearrange Commands Teknik tombol Options Toolbar untuk menangani tombol toolbar bagus dan keren, tapi bagaimana jika Anda ingin ...

Pilihan Editor

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Ketika Anda menjawab Argument Analysis Pertanyaan di GRE, argumen mungkin tampak logis dan adil di permukaan tapi sebenarnya keliru (keliru, cacat). Alasan melingkar, penalaran sebab-akibat yang keliru, dan generalisasi sweeping adalah tiga tanda argumen lemah. Dengan melihat beberapa kesalahan logis yang lebih umum, Anda dapat mengidentifikasi kelemahan dalam argumen dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Meskipun pertanyaan matematika biasanya hanya memiliki satu jawaban yang benar, ini tidak selalu terjadi. Akibatnya, beberapa pertanyaan pilihan ganda pada tes GRE Math akan memberi Anda daftar jawaban dan meminta Anda untuk memilih lebih dari satu. Pertanyaan praktik berikut meminta Anda untuk menemukan nilai kemungkinan yang berbeda secara berurutan dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pada tes GRE Verbal, beberapa pertanyaan pilihan ganda akan memiliki lebih dari satu jawaban yang benar. Untuk pertanyaan ini, Anda akan diminta untuk melihat-lihat pilihan jawaban dan memilih semua yang menurut Anda benar. Dalam pertanyaan praktik berikut, Anda diminta untuk membaca bagian yang disertakan, dan kemudian ...