Rumah Keuangan Pribadi Master Nodes di Hadoop Cluster - dummies

Master Nodes di Hadoop Cluster - dummies

Daftar Isi:

Video: How to install hadoop cluster/multi node on ubuntu server 18.04 2024

Video: How to install hadoop cluster/multi node on ubuntu server 18.04 2024
Anonim

Simpul master dalam kelompok Hadoop terdistribusi menyelenggarakan berbagai layanan pengelolaan penyimpanan dan pemrosesan, yang dijelaskan dalam daftar ini, untuk keseluruhan cluster Hadoop. Redundansi sangat penting dalam menghindari satu titik kegagalan, jadi Anda melihat dua sakelar dan tiga simpul master.

  • NameNode: Mengatur penyimpanan HDFS. Untuk memastikan ketersediaan tinggi, Anda memiliki NameNode yang aktif dan NameNode standby. Masing-masing berjalan dengan sendirinya, simpul master yang berdedikasi.

  • Simpul pos pemeriksaan (atau simpul cadangan): Menyediakan checkpointing layanan untuk NameNode. Ini melibatkan membaca log edit NameNode untuk mengubah file di file HDFS (baru, dihapus, dan ditambahkan) sejak pos pemeriksaan terakhir, dan menerapkannya ke file induk NameNode yang memetakan file ke blok data.

    Selain itu, Node Cadangan menyimpan salinan namespace sistem berkas di memori dan menyimpannya selaras dengan status NameNode. Untuk penyebaran ketersediaan tinggi, jangan gunakan node pos pemeriksaan atau node cadangan - gunakan Standby NameNode. Selain menjadi siaga aktif untuk NameNode, Standby NameNode mempertahankan layanan pemeriksaan dan menyimpan salinan up-to-date dari namespace sistem berkas di memori.

  • JournalNode: Menerima modifikasi edit log yang menunjukkan perubahan pada file dalam HDFS dari NameNode. Setidaknya tiga layanan JournalNode (dan itu selalu angka ganjil) harus berjalan dalam sebuah cluster, dan mereka cukup ringan sehingga bisa colocation dengan layanan lain pada node master.

  • Resource Manager: Mengawasi penjadwalan tugas aplikasi dan pengelolaan sumber daya cluster Hadoop. Layanan ini adalah jantung dari BENANG.

  • JobTracker: Untuk server Hadoop 1, menangani pengelolaan sumber daya cluster dan penjadwalan. Dengan YARN, JobTracker sudah usang dan tidak digunakan. Sejumlah penyebaran Hadoop masih belum bermigrasi ke Hadoop 2 dan YARN.

  • HMaster: Memantau server wilayah HBase dan menangani semua perubahan metadata. Untuk memastikan ketersediaan tinggi, pastikan untuk menggunakan contoh HMaster kedua. Layanan HMaster cukup ringan untuk colocated dengan layanan lain pada node master. Dalam Hadoop 1, contoh layanan HMaster dijalankan pada node induk. Dalam Hadoop 2, dengan Hoya (HBase on Benang), HMaster berjalan dalam wadah pada node budak.

  • Zookeeper: Koordinat komponen terdistribusi dan berikan mekanisme untuk membuatnya tetap sinkron. Zookeeper digunakan untuk mendeteksi kegagalan NameNode dan memilih NameNode baru.Ini juga digunakan dengan HBase untuk mengelola negara bagian HMaster dan RegionServer.

    Seperti halnya dengan JournalNode, Anda memerlukan setidaknya tiga contoh simpul Zookeeper (dan selalu angka ganjil), dan warnanya cukup ringan untuk dihubungkan dengan layanan lain pada node induk.

Di sini, Anda memiliki tiga node utama (dengan perangkat keras yang sama), di mana layanan utama Active NameNode, Standby NameNode, dan Resource Manager masing-masing memiliki server sendiri. Ada layanan JournalNode dan Zookeeper yang berjalan di setiap server juga, tapi ini ringan dan tidak akan menjadi sumber pertengkaran sumber daya dengan layanan NameNode dan Resource Manager.

Prinsipnya sama untuk Hadoop 1, di mana Anda memerlukan simpul master khusus untuk layanan NameNode, Secondary NameNode, dan JobTracker.

Jika Anda berencana menggunakan HBase dengan Hoya di Hadoop 2, Anda tidak memerlukan layanan tambahan. Untuk pemasangan Hadoop 1 menggunakan HBase, periksa gambar berikut untuk penyebaran layanan di cluster master Hadoop cluster. Ada dua perbedaan saat membandingkan server master ini dengan server master Hadoop 1 tanpa dukungan HBase: di sini Anda memerlukan dua layanan HMaster (satu untuk mengkoordinasikan HBase, dan satu untuk bertindak sebagai siaga) dan layanan penjaga rumah di ketiga node utama untuk menangani failover

Jika Anda berniat menggunakan cluster Hadoop 1 hanya untuk HBase, Anda dapat melakukannya tanpa layanan JobTracker, karena HBase tidak bergantung pada infrastruktur Hadoop 1 MapReduce.

Ketika orang membicarakan perangkat keras untuk Hadoop, mereka umumnya menekankan penggunaan komponen

komoditas - yang murah. Karena Anda harus memilah-milah hanya beberapa node master (biasanya, tiga atau empat), Anda tidak terpukul dengan mengalikan biaya jika, misalnya, Anda memutuskan untuk menggunakan hard disk drive mahal. Ingatlah bahwa, tanpa node utama, tidak ada cluster Hadoop. Master nodes melayani fungsi mission-critical, dan meskipun Anda membutuhkan redundansi, Anda harus merancangnya dengan ketersediaan dan ketahanan tinggi.

Penyimpanan yang disarankan

Untuk node master Hadoop, berapa pun jumlah node slave atau penggunaan cluster, karakteristik penyimpanannya konsisten. Gunakan empat drive SAS 900GB, bersama dengan pengendali RAID HDD yang dikonfigurasi untuk RAID 1 + 0. Drive SAS lebih mahal daripada drive SATA, dan memiliki kapasitas penyimpanan lebih rendah, namun lebih cepat dan jauh lebih dapat diandalkan.

Menyebarkan drive SAS Anda sebagai array RAID memastikan bahwa layanan manajemen Hadoop memiliki toko yang berlebihan untuk data mission-critical mereka. Ini memberi Anda penyimpanan yang cukup stabil, cepat, dan berlebihan untuk mendukung pengelolaan cluster Hadoop Anda.

Recommended processors

Pada saat penulisan ini, kebanyakan arsitektur referensi merekomendasikan penggunaan motherboard dengan dua soket CPU, masing-masing memiliki enam atau delapan inti. Arsitektur Intel Ivy Bridge biasa digunakan.

Memori yang disarankan

Kebutuhan memori sangat bervariasi tergantung pada skala cluster Hadoop.Memori merupakan faktor penting bagi node master Hadoop karena server NameNode yang aktif dan siaga sangat bergantung pada RAM untuk mengelola HDFS. Dengan demikian, gunakan error-correcting memory (ECC) untuk node master Hadoop. Biasanya, node master membutuhkan RAM antara 64GB dan 128GB.

Kebutuhan memori NameNode adalah fungsi langsung dari jumlah blok file yang tersimpan dalam HDFS. Sebagai aturan, NameNode menggunakan sekitar 1GB RAM per juta blok HDFS. (Ingatlah bahwa file dipecah menjadi blok individual dan direplikasi sehingga Anda memiliki tiga salinan dari setiap blok.)

Permintaan memori server Resource Manager, HMaster, Zookeeper, dan JournalNode kurang dari server NameNode. Namun, praktik yang baik untuk mengukur simpul master dengan cara yang konsisten sehingga bisa dipertukarkan apabila terjadi kegagalan perangkat keras.

Komunikasi yang disarankan

Komunikasi yang cepat sangat penting untuk layanan pada node induk, jadi sebaiknya gunakan sepasang koneksi 10GbE berikat. Pasangan berikat ini menyediakan redundansi, tapi juga melipatgandakan throughput menjadi 20GbE. Untuk cluster yang lebih kecil (misalnya, kurang dari 50 node) Anda bisa lolos dengan menggunakan konektor 1 GbE.

Master Nodes di Hadoop Cluster - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...