Video: Building Hadoop Pipelines using Apache Crunch 2024
Untuk membantu Anda memulai dengan Hadoop, berikut adalah petunjuk cara mendownload dan menyiapkan Hadoop di komputer laptop Anda dengan cepat.. Cluster Anda akan berjalan dalam mode pseudo-distributed pada mesin virtual, jadi Anda tidak memerlukan perangkat keras khusus.
Mesin virtual (VM) adalah komputer simulasi yang dapat Anda jalankan di komputer sungguhan. Misalnya, Anda bisa menjalankan program di laptop Anda yang "memainkan" VM, yang membuka jendela yang sepertinya sedang menjalankan komputer lain. Akibatnya, komputer berpura-pura berjalan di dalam komputer sebenarnya.
Anda akan mendownload VM, dan saat menjalankannya, Anda akan menginstal Hadoop.
Apache Bigtop adalah alternatif yang bagus jika Anda ingin merakit komponen Hadoop Anda sendiri. Bigtop mengumpulkan komponen inti Hadoop untuk Anda dan memastikan konfigurasi Anda bekerja. Apache Bigtop adalah distribusi open source 100 persen.
Tujuan utama Bigtop - itu sendiri merupakan proyek Apache, seperti Hadoop - adalah untuk membangun komunitas seputar pengemasan, penyebaran, dan integrasi proyek di ekosistem Apache Hadoop. Fokusnya adalah pada sistem secara keseluruhan daripada pada proyek individual.
Menggunakan Bigtop, Anda dapat dengan mudah menginstal dan menggunakan komponen Hadoop tanpa harus melacaknya dalam distribusi tertentu dan mencocokkannya dengan versi Hadoop yang spesifik. Sebagai versi baru komponen Hadoop dilepaskan, terkadang mereka tidak bekerja dengan rilis terbaru dari proyek lain. Jika Anda sendiri, pengujian signifikan diperlukan.
Dengan Bigtop (atau rilis Hadoop komersial), Anda dapat mempercayai bahwa ahli Hadoop telah melakukan pengujian ini untuk Anda. Untuk memberi gambaran tentang bagaimana Bigtop ekspansif didapat, lihat daftar semua komponen berikut yang termasuk dalam Bigtop:
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache
Apache Apache Babi
Apache Solr
Apache Sqoop
Apache Whirr
Apache Zookeeper
Cloudera Hue LinkedIn DataFu Kumpulan proyek ekosistem Hadoop ini sama luasnya dengan yang ada karena keduanya proyek besar dan kecil disertakan. Apache Bigtop terus berkembang.