Rumah Keuangan Pribadi Apa itu Hadoop? - dummies

Apa itu Hadoop? - dummies

Video: Aditya Riaddy - Apa itu Apache Spark dan Penggunaanya untuk Big Data Analytics | BukaTalks 2024

Video: Aditya Riaddy - Apa itu Apache Spark dan Penggunaanya untuk Big Data Analytics | BukaTalks 2024
Anonim

Hadoop adalah alat pengolahan data open source yang dikembangkan oleh Apache Software Foundation. Hadoop saat ini merupakan program go-to untuk menangani volume dan variasi data yang besar karena dirancang untuk membuat komputasi berskala besar lebih terjangkau dan fleksibel. Dengan kedatangan Hadoop, pemrosesan data massal telah diperkenalkan kepada lebih banyak orang dan lebih banyak organisasi.

Hadoop dapat menawarkan solusi terbaik untuk menangani, memproses, dan mengelompokkan aliran massal data terstruktur, semi terstruktur, dan tidak terstruktur. Dengan mengatur dan menerapkan Hadoop, Anda mendapatkan cara yang relatif terjangkau untuk mulai menggunakan dan menggambar wawasan dari semua data organisasi Anda, bukan hanya terus bergantung hanya pada kumpulan data transaksional yang Anda miliki di gudang data lama di suatu tempat.

Hadoop adalah salah satu program terpopuler yang tersedia untuk kebutuhan komputasi berskala besar. Hadoop menyediakan lapisan peta dan-pengurangan yang mampu menangani persyaratan pemrosesan data dari sebagian besar proyek data besar.

Terkadang data menjadi terlalu besar dan cepat bahkan untuk ditangani oleh Hadoop. Dalam kasus ini, organisasi beralih ke penerapan MapReduce alternatif yang lebih disesuaikan.

Hadoop menggunakan kumpulan perangkat keras komoditas untuk menyimpan data. Perangkat keras di setiap cluster terhubung, dan perangkat keras ini terdiri dari komoditas server - server generik dengan biaya rendah dan berkinerja rendah yang menawarkan kemampuan komputasi yang kuat saat dijalankan sejajar di cluster bersama. Server komoditas ini juga disebut node . Komputasi komoditi secara dramatis menurunkan biaya yang diperlukan untuk menangani dan menyimpan data yang besar.

Hadoop terdiri dari dua komponen berikut:

  • Kerangka proses terdistribusi: Hadoop menggunakan Hadoop MapReduce sebagai kerangka pemrosesan terdistribusinya. Sekali lagi, kerangka pemrosesan terdistribusi adalah kerangka kerja yang kuat dimana tugas pemrosesan didistribusikan melintasi sekelompok node sehingga volume data yang besar dapat diproses dengan sangat cepat di seluruh sistem secara keseluruhan.

  • Sistem berkas terdistribusi: Hadoop menggunakan Hadoop Distributed File System (HDFS) sebagai sistem berkas terdistribusinya.

Beban kerja aplikasi yang berjalan di Hadoop dibagi di antara node cluster Hadoop, dan kemudian hasilnya disimpan di HDFS. Cluster Hadoop dapat terdiri dari ribuan node. Untuk menjaga agar biaya proses input / output (I / O) rendah, pekerjaan Hadoop MapReduce dilakukan sedekat mungkin dengan data.

Ini berarti bahwa pengurangan tugas prosesor diposisikan sedekat mungkin dengan data tugas peta keluar yang perlu diolah. Desain ini memfasilitasi pembagian persyaratan komputasi dalam pemrosesan data yang besar.

Hadoop juga mendukung organisasi hierarkis. Beberapa nodanya diklasifikasikan sebagai node induk, dan yang lainnya dikategorikan sebagai budak. Layanan master, yang dikenal sebagai JobTracker , dirancang untuk mengendalikan beberapa layanan budak. Layanan slave (juga disebut TaskTrackers ) didistribusikan satu ke setiap node. JobTracker mengendalikan TaskTracker dan memberikan tugas kepada Hadoop MapReduce kepada mereka.

Dalam versi yang lebih baru dari Hadoop, yang dikenal sebagai Hadoop 2, seorang manajer sumber daya yang disebut Hadoop YARN ditambahkan. Sehubungan dengan MapReduce di Hadoop, YARN bertindak sebagai sistem terpadu yang melakukan fungsi pengelolaan dan penjadwalan sumber daya.

Hadoop memproses data secara batch. Akibatnya, jika Anda bekerja dengan data streaming real-time, Anda tidak dapat menggunakan Hadoop untuk menangani masalah data besar Anda. Ini mengatakan, ini sangat berguna untuk memecahkan banyak jenis masalah data besar lainnya.

Apa itu Hadoop? - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...