Rumah Keuangan Pribadi Slave Nodes dalam Hadoop Distributed File System (HDFS) - dummies

Slave Nodes dalam Hadoop Distributed File System (HDFS) - dummies

Daftar Isi:

Video: How to install hadoop cluster/multi node on ubuntu server 18.04 2024

Video: How to install hadoop cluster/multi node on ubuntu server 18.04 2024
Anonim

Dalam sebuah cluster Hadoop, setiap node data (juga dikenal sebagai slave node ) menjalankan sebuah Proses background bernama DataNode. Proses latar belakang ini (juga dikenal sebagai daemon ) melacak irisan data yang disimpan sistem di komputernya. Ini secara teratur berbicara dengan server master untuk HDFS (dikenal sebagai NameNode) untuk melaporkan status kesehatan dan status data yang tersimpan secara lokal.

Blok data disimpan sebagai file mentah dalam sistem file lokal. Dari perspektif pengguna Hadoop, Anda tidak tahu dari simpul budak mana yang memiliki potongan file yang perlu Anda proses. Dari dalam Hadoop, Anda tidak melihat blok data atau bagaimana distribusi di seluruh cluster - yang Anda lihat hanyalah daftar file di HDFS.

Kompleksitas bagaimana blok file didistribusikan ke seluruh cluster tersembunyi dari Anda - Anda tidak tahu betapa rumitnya semuanya, dan Anda tidak membutuhkan untuk tahu. Sebenarnya, simpul budak sendiri bahkan tidak tahu apa yang ada di dalam blok data yang mereka simpan. Ini adalah server NameNode yang mengetahui pemetaan blok data yang menyusun file yang tersimpan dalam HDFS.

Hidup yang lebih baik melalui redundansi

Bila Anda memilih opsi penyimpanan, pertimbangkan dampak penggunaan drive komoditas daripada drive berkualitas tinggi perusahaan. Bayangkan bahwa Anda memiliki cluster 750-node, di mana setiap node memiliki 12 hard disk drive yang didedikasikan untuk penyimpanan HDFS.

Berdasarkan tingkat kegagalan tahunan (AFR) sebesar 4 persen untuk disk drive komoditas (hard disk drive yang diberikan memiliki kemungkinan 4 persen gagal pada tahun tertentu, dengan kata lain), cluster Anda kemungkinan akan mengalami hard disk kegagalan setiap hari dalam setahun

Karena bisa jadi banyak simpul budak, kegagalan mereka juga merupakan kejadian biasa dalam kelompok yang lebih besar dengan ratusan atau lebih simpul. Dengan informasi ini, HDFS telah direkayasa dengan asumsi bahwa

semua komponen perangkat keras, bahkan pada tingkat node slave, tidak dapat diandalkan. HDFS mengatasi ketidakmampuan komponen perangkat keras individual dengan cara redundansi: Itulah gagasan di balik ketiga salinan dari setiap file yang tersimpan dalam HDFS, didistribusikan ke seluruh sistem.Lebih khusus lagi, setiap blok file yang tersimpan dalam HDFS memiliki total tiga replika. Jika satu sistem rusak dengan blok file tertentu yang Anda butuhkan, Anda bisa beralih ke dua file lainnya.

Buat sketsa desain server node slave

Untuk menyeimbangkan faktor penting seperti total biaya kepemilikan, kapasitas penyimpanan, dan kinerja, Anda perlu merencanakan secara hati-hati desain simpul budak Anda.

Anda biasanya melihat simpul budak sekarang dimana masing-masing node memiliki antara 12 dan 16 drive hard disk 3TB yang terpasang secara lokal. Simpul budak menggunakan CPU dual-socket yang cukup cepat dengan enam sampai delapan inti masing-masing - tidak ada kecepatan setan, dengan kata lain. Ini diiringi RAM 48GB. Singkatnya, server ini dioptimalkan untuk penyimpanan padat.

Karena HDFS adalah sistem file tingkat pengguna, sangat penting untuk mengoptimalkan sistem file lokal pada node budak agar bisa bekerja dengan HDFS. Dalam hal ini, satu keputusan berdampak tinggi saat menyiapkan server Anda adalah memilih sistem file untuk instalasi Linux pada node budak.

Ext3 adalah sistem berkas yang paling sering digunakan karena telah menjadi pilihan paling stabil selama beberapa tahun. Lihatlah Ext4, namun. Ini adalah versi Ext3 yang berikutnya, dan sudah tersedia cukup lama untuk dianggap stabil dan dapat diandalkan secara luas.

Yang lebih penting lagi untuk tujuan kita, ia memiliki sejumlah pengoptimalan untuk menangani file berukuran besar, yang menjadikannya pilihan ideal untuk server node budak HDFS.

Jangan gunakan Linux Logical Volume Manager (LVM) - ini merupakan lapisan tambahan antara sistem file Linux dan HDFS, yang mencegah Hadoop mengoptimalkan kinerjanya. Secara khusus, kumpulan disk LVM, yang menghambat pengelolaan sumber daya yang dilakukan oleh HDFS dan YARN, berdasarkan bagaimana file didistribusikan ke drive fisik.

Slave Nodes dalam Hadoop Distributed File System (HDFS) - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...