Rumah Keuangan Pribadi Tahap Shuffle dari Aliran Aplikasi MapReduce Hadoop - dummies

Tahap Shuffle dari Aliran Aplikasi MapReduce Hadoop - dummies

Video: 2018-2019 Raptor Whipple Stage 1 Performance Kit Review & Dyno Test 2024

Video: 2018-2019 Raptor Whipple Stage 1 Performance Kit Review & Dyno Test 2024
Anonim

Setelah fase Peta dan sebelum awal fase Mengurangi adalah proses handoff, yang dikenal sebagai shuffle dan urutkan . Di sini, data dari tugas mapper disiapkan dan dipindahkan ke node dimana tugas reducer akan dijalankan. Ketika tugas mapper selesai, hasilnya diurutkan berdasarkan kunci, dipartisi jika ada banyak reducer, dan kemudian ditulis ke disk.

Anda dapat melihat konsep ini pada gambar berikut, yang menunjukkan aliran pengolahan data MapReduce dan interaksinya dengan komponen fisik cluster Hadoop. (Satu catatan cepat: Data dalam memori diwakili oleh kotak putih, dan data yang disimpan ke disk diwakili oleh kotak abu-abu.)

Untuk mempercepat proses MapReduce secara keseluruhan, data segera dipindahkan ke node tugas peredam, untuk menghindari banjir aktivitas jaringan saat tugas pemeriksa akhir menyelesaikan pekerjaannya. Transfer ini terjadi saat tugas mapper berjalan, karena output untuk setiap record - ingat - disimpan dalam memori tugas reducer yang menunggu. (Anda dapat mengkonfigurasi apakah ini terjadi - atau tidak terjadi - dan juga jumlah benang yang terlibat.)

Ingatlah bahwa meskipun tugas peredam mungkin sebagian besar dari keluaran tugas pengumpul, pemrosesan tugas dikurangi tidak dapat dimulai sampai semua tugas pengeta selesai.

Untuk menghindari skenario dimana kinerja pekerjaan MapReduce terhambat oleh satu tugas mapper yang acak yang berjalan pada simpul budak yang berkinerja buruk, kerangka MapReduce menggunakan konsep yang disebut eksekusi spekulatif .

Jika beberapa tugas mapper berjalan lebih lambat dari yang dianggap masuk akal, Master Aplikasi akan menelurkan tugas duplikat (di Hadoop 1, JobTracker melakukan ini). Apapun tugas yang diselesaikan pertama - duplikat atau yang asli - hasilnya disimpan ke disk, dan tugas lainnya terbunuh. Jika Anda memantau pekerjaan Anda dengan cermat dan bertanya-tanya mengapa ada lebih banyak tugas pengatur berjalan daripada yang Anda harapkan, ini adalah alasan yang mungkin.

Keluaran dari tugas mapper tidak ditulis ke HDFS, melainkan ke disk lokal pada node budak tempat tugas pengemudi dijalankan. Dengan demikian, ini tidak direplikasi di cluster Hadoop.

Selain mengompres output, Anda berpotensi meningkatkan kinerja dengan menjalankan tugas penggabung. Taktik sederhana ini, yang ditunjukkan di sini, melibatkan pengurangan keluaran lokal untuk tugas pemeta individual.

Pada sebagian besar kasus, tidak ada pemrograman tambahan yang diperlukan, karena Anda dapat memberitahu sistem untuk menggunakan fungsi peredam. Jika Anda tidak menggunakan fungsi peredam Anda, Anda perlu memastikan bahwa keluaran fungsi penggabung sama dengan fungsi peredam.

Terserah pada kerangka MapReduce apakah fungsi penggabung perlu dijalankan sekali, beberapa kali, atau tidak sama sekali, jadi penting bahwa kode penggabung memastikan bahwa hasil akhir tidak terpengaruh oleh beberapa putaran. Menjalankan penggabung dapat menghasilkan keuntungan kinerja dengan mengurangi jumlah data perantara yang jika tidak perlu ditransfer melalui jaringan.

Ini juga menurunkan jumlah pemrosesan yang harus dilakukan peredam reducer. Anda menjalankan tugas ekstra di sini, jadi ada kemungkinan keuntungan kinerja apapun dapat diabaikan atau bahkan menghasilkan kinerja keseluruhan yang buruk. Jarak tempuh Anda mungkin berbeda, jadi uji ini dengan hati-hati.

Setelah semua hasil tugas mapper disalin ke node tugas reducer, file-file ini digabungkan dan diurutkan.

Tahap Shuffle dari Aliran Aplikasi MapReduce Hadoop - dummies

Pilihan Editor

Mengedit gambar di Dreamweaver MX 2004 - dummies

Mengedit gambar di Dreamweaver MX 2004 - dummies

Fitur baru di Dreamweaver memungkinkan Anda membuat pengeditan gambar kecil di dalam Dreamweaver, tanpa membuka Fireworks atau program editing grafis lainnya. Alat ini tersedia dari inspektur Properti, saat gambar dipilih. Anda juga menemukan dua tombol yang memungkinkan Anda menggunakan Macromedia Fireworks untuk mengedit gambar. Tombol Edit meluncurkan Fireworks dan ...

Hyperlink eksternal di Adobe CS5 Dreamweaver - dummies

Hyperlink eksternal di Adobe CS5 Dreamweaver - dummies

Anda dapat menautkan halaman Dreamweaver Adobe Creative Suite 5 Anda (Adobe CS5) dimanapun, di situs Anda atau di luar situs Anda. Dreamweaver juga memiliki alat untuk memverifikasi dan memperbaiki tautan rusak eksternal. Saat mengarahkan orang ke laman kontak yang diposkan di situs lain, Anda memiliki tautan yang terlihat seperti ini: http: // www. aku. com / kontak Dengan mengetikkan ...

Menjelajahi Antarmuka New Dreamweaver MX 2004 - dummies

Menjelajahi Antarmuka New Dreamweaver MX 2004 - dummies

Dengan Dreamweaver MX, Macromedia integrated ColdFusion dan HomeSite menjadi satu single , antarmuka yang kuat, meskipun Anda memiliki pilihan untuk bekerja dengan antarmuka baru tersebut atau dengan antarmuka Dreamweaver 4 yang lama (atau, dalam bahasa Macromedia, ruang kerja). Dengan Dreamweaver MX 2004, Macromedia menurunkan ruang kerja Dreamweaver 4 dan memungkinkan Anda memilih hanya dua versi ...

Pilihan Editor

Bagaimana cara melawan dengan adil dalam pernikahan - dummies

Bagaimana cara melawan dengan adil dalam pernikahan - dummies

Menerima bahwa Anda dan pasangan Anda akan berdebat dapat membantu memperkuat pernikahan , tapi hanya jika Anda memiliki kemampuan untuk bertarung dengan adil. Jika muncul perkawinan, gunakan alat ini untuk membantu menyelesaikan konflik secara adil dan konstruktif: Jelaskan dengan jelas apa yang Anda inginkan. Tetap berpegang pada masalah yang ada. Do ...

Bagaimana mengatasi perbedaan uang perkawinan - dummies

Bagaimana mengatasi perbedaan uang perkawinan - dummies

Uang adalah penyebab reguler masalah perkawinan. Kenali bagaimana sikap Anda tentang uang mempengaruhi pernikahan Anda dan gunakan tip berikut untuk membantu mengatasi perbedaan uang Anda: Duduklah bersama pasangan Anda dan bicarakan bagaimana masing-masing keluarga asal Anda berurusan dengan uang. Bicara tentang efek yang mungkin dialami oleh masa lalu ...

Pilihan Editor

Yang Harus Anda Ketahui tentang Ukuran Kode Java Anda - dummies

Yang Harus Anda Ketahui tentang Ukuran Kode Java Anda - dummies

Saat Anda sedang coding Di Jawa, Anda ingin mempertimbangkan ukuran sebenarnya dari kode Anda. Mari kita lihat sebuah contoh. Tapi pertama-tama. Inilah kata kosa kata baru hari ini: foregift (fore-gift) n. Premi yang diberikan lessee kepada lessor saat mengambil sewa. sebelum ini (di sini-di-depan) adv. Pada bagian sebelumnya ...

Kelas matematika dan kelas NumberFormat - kelas induk

Kelas matematika dan kelas NumberFormat - kelas induk

Meletakkan fondasi untuk program Anda. Kelas Java Math dan NumberFormat memungkinkan Anda memprogram nilai nilai, serta format angka dan mata uang. Metode Kelas Matematika Deskripsi num abs (num y); Nilai absolut y (num bisa berupa tipe data numerik) num max (num y, num z); Maksimum y dan z ...

Membuat Dokumentasi API API - dummies

Membuat Dokumentasi API API - dummies

Kadang-kadang, orang menilai bahasa pemrograman (termasuk Jawa) semata-mata dengan fitur gramatikal mereka. Apakah pernyataan jika melakukan apa yang Anda harapkan? Apakah pernyataan perulangan mudah digunakan? Apakah metode diterapkan secara efisien? Saat ini, situasinya sedikit berbeda. Java memiliki keseluruhan koleksi fitur gramatikal, tapi Java lebih banyak lagi ...