Rumah Keuangan Pribadi Selain Optimalkan MapReduce Tasks - dummies

Selain Optimalkan MapReduce Tasks - dummies

Daftar Isi:

Video: Cara Optimalkan setting Open Camera 2024

Video: Cara Optimalkan setting Open Camera 2024
Anonim

Selain mengoptimalkan kode aplikasi aktual dengan MapReduce untuk proyek data besar, Anda dapat menggunakan beberapa teknik optimasi untuk meningkatkan kehandalan dan kinerja. Mereka terbagi dalam tiga kategori: topologi hardware / jaringan, sinkronisasi, dan sistem file.

Perangkat keras / data topologi perangkat keras yang besar

Independen aplikasi, perangkat keras dan jaringan tercepat kemungkinan akan menghasilkan waktu tercepat untuk perangkat lunak Anda. Keuntungan yang berbeda dari MapReduce adalah kemampuan untuk berjalan dalam kelompok perangkat keras dan jaringan standar yang murah. Jika Anda tidak memperhatikan di mana server Anda diatur secara fisik, Anda tidak akan mendapatkan kinerja terbaik dan tingkat toleransi kesalahan yang tinggi yang diperlukan untuk mendukung tugas data yang besar.

Perangkat keras komoditi sering disimpan di rak di pusat data. Kedekatan perangkat keras di dalam rak menawarkan keuntungan kinerja dibandingkan dengan memindahkan data dan / atau kode dari rak ke rak. Selama implementasi, Anda dapat mengkonfigurasi mesin MapReduce untuk mengetahui dan memanfaatkan kedekatan ini.

Menjaga data dan kode bersama adalah salah satu pengoptimalan terbaik untuk kinerja MapReduce. Intinya, semakin dekat elemen pemrosesan perangkat keras satu sama lain, semakin sedikit latency yang harus Anda hadapi.

Sinkronisasi data yang besar

Karena tidak efisien menahan semua hasil pemetaan Anda di dalam node, mekanisme sinkronisasi akan menyalin hasil pemetaan ke nodus pengurang segera setelah selesai pengolahan bisa dimulai segera. Semua nilai dari kunci yang sama dikirim ke peredam sama, lagi memastikan kinerja lebih tinggi dan efisiensi yang lebih baik.

Keluaran reduksi ditulis langsung ke sistem file, jadi harus dirancang dan disetel untuk hasil terbaik.

Sistem file data besar

Implementasi MapReduce Anda didukung oleh sistem file terdistribusi. Perbedaan utama antara sistem file lokal dan terdistribusi adalah kapasitas. Untuk menangani sejumlah besar informasi di dunia data yang besar, sistem berkas perlu disebarkan ke beberapa mesin atau node dalam jaringan.

Implementasi MapReduce bergantung pada gaya distribusi master-slave, dimana simpul induk menyimpan semua metadata, hak akses, pemetaan dan lokasi file dan blok, dan seterusnya. Budak adalah simpul dimana data sebenarnya disimpan. Semua permintaan pergi ke master dan kemudian ditangani oleh node budak yang sesuai.Saat Anda merenungkan desain sistem file, Anda harus mempertimbangkan hal berikut:

  • Jaga agar tetap hangat: Seperti yang Anda duga, simpul master bisa bekerja terlalu keras karena semuanya dimulai di sana. Selain itu, jika node utama gagal, keseluruhan sistem file tidak dapat diakses sampai master dipulihkan. Pengoptimalan yang sangat penting adalah membuat simpul induk "warm standby" yang bisa beralih ke layanan jika ada masalah dengan master online.

  • Semakin besar semakin baik: Ukuran file juga merupakan pertimbangan penting. Banyak file kecil (kurang dari 100MB) harus dihindari. Sistem file terdistribusi yang mendukung mesin MapReduce bekerja paling baik bila dihuni dengan sejumlah kecil file berukuran besar.

  • Pandangan panjang: Karena beban kerja dikelola dalam jumlah banyak, bandwidth jaringan yang sangat tinggi lebih penting daripada waktu eksekusi cepat pemotong atau pereduksi. Pendekatan yang optimal adalah kode untuk mengalirkan banyak data saat sedang membaca dan lagi saat sudah waktunya menulis ke sistem file.

  • Jaga agar tetap aman: Tapi jangan terlalu parah. Menambahkan lapisan keamanan pada sistem file terdistribusi akan menurunkan kinerjanya. Izin file ada untuk menjaga konsekuensi yang tidak diinginkan, bukan perilaku jahat. Pendekatan terbaik adalah memastikan bahwa hanya pengguna yang berwenang yang memiliki akses ke lingkungan data center dan menjaga agar sistem file terdistribusi terlindungi dari luar.

Selain Optimalkan MapReduce Tasks - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...