Rumah Keuangan Pribadi Lacak Data Blok dengan NameNode di HDFS - dummies

Lacak Data Blok dengan NameNode di HDFS - dummies

Daftar Isi:

Video: Cara Melacak Pemilik Nomor Hp Seseorang Serta Lacak Posisinya 2024

Video: Cara Melacak Pemilik Nomor Hp Seseorang Serta Lacak Posisinya 2024
Anonim

NameNode bertindak sebagai buku alamat untuk Hadoop Distributed File System (HDFS) karena ia tidak tahu hanya blok yang membentuk file individual tapi juga di mana masing-masing blok dan replika mereka disimpan. Ketika pengguna menyimpan file di HDFS, file dibagi menjadi blok data, dan tiga salinan blok data ini disimpan di simpul budak di seluruh cluster Hadoop.

Itu banyak blok data untuk dilacak. Seperti yang Anda duga, mengetahui di mana mayat dikuburkan membuat NameNode menjadi komponen penting dalam kelompok Hadoop. Jika NameNode tidak tersedia, aplikasi tidak dapat mengakses data apa pun yang tersimpan dalam HDFS.

Jika Anda melihat gambar berikut, Anda dapat melihat daemon NameNode yang berjalan pada server master node. Semua informasi pemetaan yang berhubungan dengan blok data dan file yang sesuai disimpan dalam sebuah file bernama.

HDFS adalah sistem berkas journaling, yang berarti bahwa setiap perubahan data dicatat dalam jurnal edit yang melacak kejadian sejak pos terakhir

- terakhir saat log edit digabungkan. Di HDFS, jurnal edit disimpan dalam file bernama yang tersimpan di NameNode.

Pembuatan dan pengoperasian NameNode

Untuk memahami bagaimana cara kerja NameNode, ada baiknya untuk melihat bagaimana cara kerjanya. Karena tujuan dari NameNode adalah menginformasikan aplikasi tentang berapa banyak blok data yang mereka butuhkan untuk diproses dan untuk melacak lokasi yang tepat dimana mereka disimpan, diperlukan semua lokasi blok dan pemetaan block-to-file yang tersedia di RAM.

Inilah langkah-langkah yang dibutuhkan NameNode. Untuk memuat semua informasi yang dibutuhkan NameNode setelah dijalankan, berikut ini akan terjadi:

NameNode memuat file ke dalam memori.
  1. NameNode memuat file dan memutar ulang perubahan jurnal untuk memperbarui metadata blok yang sudah ada di memori.

  2. daemon DataNode mengirim laporan blok NameNode.

  3. Untuk setiap simpul budak, ada laporan blok yang mencantumkan semua blok data yang tersimpan di sana dan menggambarkan kesehatan masing-masing.

    Setelah proses startup selesai, NameNode memiliki gambaran lengkap tentang semua data yang tersimpan dalam HDFS, dan siap untuk menerima permintaan aplikasi dari klien Hadoop.

Saat file data ditambahkan dan dihapus berdasarkan permintaan klien, perubahan tersebut ditulis ke volume disk slave node, pembaruan jurnal dibuat ke file, dan perubahannya tercermin di lokasi blok dan metadata yang tersimpan dalam memori NameNode..

Sepanjang kehidupan cluster, daemon DataNode mengirim detak jantung NameNode (sinyal cepat) setiap tiga detik, menunjukkan bahwa mereka aktif.(Nilai default ini bisa dikonfigurasi.) Setiap enam jam (sekali lagi, sebuah konfigurasi yang dapat dikonfigurasi), DataNodes mengirimkan laporan blok NameNode yang menguraikan blok file mana yang berada di simpul mereka. Dengan cara ini, NameNode selalu memiliki pandangan terkini tentang sumber daya yang ada di cluster.

Menulis data

Untuk membuat file baru di HDFS, proses berikut harus dilakukan:

Klien mengirim permintaan ke NameNode untuk membuat file baru.

  1. NameNode menentukan berapa banyak blok yang dibutuhkan, dan klien diberi

    lease untuk membuat blok berkas baru ini di cluster. Sebagai bagian dari sewa ini, klien memiliki batas waktu untuk menyelesaikan tugas pembuatannya. (Batas waktu ini memastikan bahwa ruang penyimpanan tidak diambil oleh aplikasi klien yang gagal.) Klien kemudian menulis salinan pertama dari blok file ke node budak dengan menggunakan kode yang diberi nama NameNode.

  2. NameNode menangani permintaan menulis dan menentukan di mana blok file dan replika mereka perlu ditulis, menyeimbangkan ketersediaan dan kinerja. Salinan pertama dari sebuah blok file ditulis dalam satu rak, dan salinan kedua dan ketiga ditulis di rak yang berbeda dari pada salinan pertama, namun di dalam node budak yang berbeda di rak yang sama. Pengaturan ini meminimalkan lalu lintas jaringan sambil memastikan bahwa tidak ada blok data yang berada pada titik kegagalan yang sama.

    Karena setiap blok ditulis ke HDFS, sebuah proses khusus menulis replika yang tersisa ke node budak lainnya yang diidentifikasi oleh NameNode.

  3. Setelah daemon DataNode mengetahui replika blokir file telah dibuat, aplikasi klien akan menutup file dan memberitahukan NameNode, yang kemudian menutup sewa terbuka.

  4. Membaca Data

Untuk membaca file dari HDFS, proses berikut harus dilakukan:

Klien mengirimkan permintaan ke NameNode untuk sebuah file.

  1. NameNode menentukan blok mana yang terlibat dan dipilih, berdasarkan jarak keseluruhan blok satu sama lain dan ke klien, jalur akses yang paling efisien.

    Klien kemudian mengakses blok menggunakan alamat yang diberikan oleh NameNode.

  2. Menyeimbangkan data dalam cluster Hadoop

Seiring berjalannya waktu, dengan kombinasi pola penyebaran data yang tidak merata (di mana beberapa node budak mungkin memiliki lebih banyak data yang ditulis untuk mereka) atau kegagalan node, data kemungkinan akan didistribusikan secara tidak merata di rak dan simpul budak di cluster Hadoop Anda.

Distribusi yang tidak merata ini dapat berdampak buruk pada kinerja karena permintaan pada node budak individu akan menjadi tidak seimbang; Simpul dengan sedikit data tidak akan sepenuhnya digunakan; dan node dengan banyak blok akan digunakan secara berlebihan. (Catatan: Penggunaan berlebihan dan penggunaan dasar didasarkan pada aktivitas disk, tidak pada CPU atau RAM. HDFS menyertakan utilitas penyeimbang untuk mendistribusikan kembali blok dari node budak yang terlalu banyak ke yang kurang berfungsi sambil mempertahankan kebijakan untuk meletakkan blok pada node budak dan rak yang berbeda. Administrator Hadoop harus secara teratur memeriksa kesehatan HDFS, dan jika data didistribusikan secara tidak merata, mereka harus memanggil utilitas penyeimbang.

Desain server induk NameNode

Karena sifat misinya yang kritis, server master yang menjalankan daemon NameNode membutuhkan persyaratan perangkat keras yang berbeda dari yang ada pada node slave. Yang paling penting, komponen tingkat perusahaan perlu digunakan untuk meminimalkan kemungkinan pemadaman listrik. Selain itu, Anda memerlukan cukup RAM untuk memuat ke memori semua data metadata dan lokasi tentang semua blok data yang tersimpan dalam HDFS.

Lacak Data Blok dengan NameNode di HDFS - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...