Rumah Keuangan Pribadi Arsitektur Apache Hive - dummies

Arsitektur Apache Hive - dummies

Video: Apache Spark Tutorial | Spark Tutorial for Beginners | Apache Spark Training | Edureka 2024

Video: Apache Spark Tutorial | Spark Tutorial for Beginners | Apache Spark Training | Edureka 2024
Anonim

Saat Anda memeriksa elemen Apache Hive yang ditunjukkan, Anda dapat melihat di bagian bawah bahwa Sarang duduk di atas Sistem Berkas Terdistribusi Hadoop (HDFS) dan sistem MapReduce.

Dalam kasus MapReduce, gambar menunjukkan komponen Hadoop 1 dan Hadoop 2. Dengan Hadoop 1, query Hive dikonversi menjadi kode MapReduce dan dieksekusi menggunakan infrastruktur MapReduce v1 (MRv1), seperti JobTracker dan TaskTracker.

Dengan Hadoop 2, YARN telah memisahkan manajemen sumber daya dan penjadwalan dari kerangka MapReduce. Pertanyaan sarang tetap dapat dikonversi ke kode MapReduce dan dieksekusi, sekarang dengan MapReduce v2 (MRv2) dan infrastruktur BENAR.

Ada kerangka baru yang sedang dikembangkan yang disebut Apache Tez, yang dirancang untuk meningkatkan kinerja siku untuk kueri gaya batch dan mendukung kueri interaktif (juga dikenal sebagai real-time ). Pada saat penulisan, proyek Apache Tez masih dalam inkubasi, dan belum memiliki rilis siap produksi.

Jika ini membantu Anda memvisualisasikan bagaimana semua bagian sesuai, pikirkan sistem HDFS dan MapReduce sebagai bagian dari sistem operasi Apache Hadoop, dengan komponen Hive - serta komponen lainnya, seperti HBase - sebagai fungsi tingkat tinggi atau aplikasi. (Anda dapat melihat tema yang umum muncul: HDFS menyediakan penyimpanan, dan MapReduce menyediakan kemampuan pemrosesan paralel untuk fungsi tingkat lebih tinggi dalam ekosistem Hadoop.)

Memindahkan diagram, Anda menemukan Driver Hive, yang mengkompilasi, mengoptimalkan, dan menjalankan HiveQL. The Hive Driver dapat memilih untuk mengeksekusi pernyataan dan perintah HiveQL secara lokal atau menelurkan pekerjaan MapReduce, tergantung pada tugas yang ada. The Hive Driver menyimpan metadata tabel di metastore dan database-nya.

Anda mungkin memiliki beberapa keakraban dengan SQL dan model database relasional dari dunia RDBMS. A tabel atau relasi terdiri dari kolom vertikal dan baris horizontal. Sel disimpan dimana baris dan kolom berpotongan. Jika Anda tidak terbiasa dengan SQL dan model basis data relasional, Anda dapat menemukan sumber belajar yang berguna dengan menggunakan mesin pencari favorit Anda.

Secara default, Hive menyertakan Apache Derby RDBMS yang dikonfigurasi dengan metastore dalam mode embedded yang disebut. Mode Tertanam berarti bahwa Driver Hive, metastore, dan Apache Derby semuanya berjalan dalam satu Java Virtual Machine (JVM).

Konfigurasi ini baik untuk tujuan pembelajaran, namun mode tertanam hanya dapat mendukung satu sesi Sarang tunggal, sehingga biasanya tidak digunakan dalam lingkungan produksi multi pengguna.Dua mode lainnya ada - local dan remote - yang dapat mendukung lebih banyak sesi sarang lebah di lingkungan produksi. Selain itu, Anda dapat mengkonfigurasi RDBMS yang sesuai dengan paket Antarmuka Pemrograman Aplikasi Java Database Connectivity (JDBC). (Contoh di sini termasuk MySQL dan DB2.)

Kunci dukungan aplikasi adalah Hive Thrift Server, yang memungkinkan satu set klien kaya untuk mengakses subsistem Hive. Klien SQuirreL SQL open source disertakan sebagai contoh. Intinya adalah bahwa aplikasi yang sesuai dengan JDBC dapat mengakses Hive melalui driver JDBC yang dibundel.

Pernyataan yang sama berlaku untuk klien yang sesuai dengan Open Database Connectivity (ODBC) - misalnya, unixODBC dan utilitas isql, yang biasanya digabungkan dengan Linux, memungkinkan akses ke Hive dari klien Linux jauh.

Selain itu, jika Anda menggunakan Microsoft Excel, Anda akan senang mengetahui bahwa Anda dapat mengakses Hive setelah menginstal driver Microsoft ODBC di sistem klien Anda. Akhirnya, jika Anda perlu mengakses Hive dari bahasa pemrograman selain Java (PHP atau Python, misalnya), Apache Thrift adalah jawabannya. Klien Apache Thrift terhubung ke Hive melalui Hive Thrift Server, seperti yang dilakukan klien JDBC dan ODBC.

Untuk melanjutkan gambar arsitektur Hive, perhatikan bahwa Hive menyertakan Command Line Interface (CLI), di mana Anda dapat menggunakan jendela terminal Linux untuk mengeluarkan kueri dan perintah administratif langsung ke Driver Sengaja. Jika pendekatan grafis lebih mempercepat Anda, ada juga antarmuka web yang praktis sehingga Anda dapat mengakses tabel dan data sarang-dikelola melalui browser favorit Anda.

Ada teknologi peramban web lain yang dikenal dengan nama Hue yang menyediakan antarmuka pengguna grafis (GUI) ke Apache Hive. Beberapa pengguna Hadoop suka memiliki GUI yang mereka inginkan, bukan hanya antarmuka baris perintah (CLI). Seiring dengan Hive, Hue mendukung teknologi kunci Hadoop lainnya serta HDFS, MapReduce / YARN, HBase, Zookeeper, Oozie, Pig, dan Sqoop. Anda akan menyukai nama untuk GUI Apache Hive Hue - ini disebut Beeswax.

Arsitektur Apache Hive - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...