Rumah Keuangan Pribadi Windowing di HiveQL - dummies

Windowing di HiveQL - dummies

Video: Hive and Spark Integration Tutorial | Hadoop Tutorial for Beginners 2018 | Hadoop Training Videos #1 2024

Video: Hive and Spark Integration Tutorial | Hadoop Tutorial for Beginners 2018 | Hadoop Training Videos #1 2024
Anonim

Konsep windowing, diperkenalkan pada standar SQL: 2003, memungkinkan pemrogram SQL membuat bingkai dari data yang dengannya fungsi agregat dan jendela lainnya dapat beroperasi. HiveQL sekarang mendukung windowing sesuai standar SQL. Contohnya cukup membantu saat menjelaskan fungsi windowing dan aggregate.

Penundaan keberangkatan datang dengan wilayah saat terbang adalah mode perjalanan yang Anda pilih. Tidak mengherankan bila data penerbangan RITA-compiled mencakup informasi ini. & ldquo; Apa sebenarnya penundaan penerbangan rata-rata per hari & rdquo; ? Permintaan dalam daftar berikut menghasilkan penundaan keberangkatan rata-rata per hari di tahun 2008.

(A) hive (flightdata)> CREATE VIEW avgdepdelay AS> SELECT DayOfWeek, AVG (DepDelay) DARI GROUP FlightInfo2008 BY DayOfWeek; OK Waktu yang dibutuhkan: 0. 121 detik (B) sarang (flightdata)> SELECT * FROM avgdepdelay; … OK 1 10. 269990244459473 2 8. 97689712068735 3 8. 289761053658728 4 9. 772897177836702 5 12. 158036387869656 6 8. 645680904903614 7 11. 568973392595312 Waktu yang dibutuhkan: 18. 6 detik, Diambil: 7 baris

TGIF, atau & ldquo; Alhamdulillah hari Jumat, & rdquo; tidak berlaku untuk semua orang Seharusnya tidak mengherankan bahwa Jumat - Hari ke 5 di bawah hasil di Langkah (B) - memiliki jumlah penundaan tertinggi.

Bagaimanapun, tentang query di Langkah (A): Hive's Data Definition Language (DDL) juga mencakup pernyataan CREATE VIEW, yang bisa sangat berguna. Pada Hive, tampilan memungkinkan kueri disimpan namun data tidak disimpan seperti pada tabel Create Table as Select (CTAS).

Bila sebuah pandangan dirujuk dalam HiveQL, Hive mengeksekusi query dan kemudian menggunakan hasilnya, yang bisa menjadi bagian dari query yang lebih besar. Ini bisa sangat berguna untuk menyederhanakan pertanyaan kompleks dan memecahnya menjadi komponen logis. Selain itu, perhatikan klausa GROUP BY, yang mengumpulkan semua hari per minggu dan memungkinkan fungsi agregat AVG memberikan jawaban konsolidasi per hari.

Informasi ini berguna, tentu saja, tapi bagaimana jika Anda ingin melihat beberapa nomor individu per hari? Mengkonsolidasikan data dengan GROUP BY, dan Anda memiliki jawaban yang Anda cari, meskipun Anda juga kehilangan informasi. Memecahkan masalah kehilangan informasi ini adalah dimana windowing menjadi sangat berguna.

Berikut adalah pertanyaan lain tentang data penerbangan RITA 2008 yang bisa menjawab Apache Hive: & ldquo; Berapakah penerbangan pertama antara Bandara X dan Y & rdquo; ? Anggaplah bahwa selain informasi ini, Anda ingin tahu tentang penerbangan berikutnya, kalau-kalau Anda bukan seorang & ldquo; orang pagi.& rdquo; Nah, ini adalah pekerjaan untuk windowing di HiveQL! Daftar berikut memberi Anda pertanyaan yang menjawab pertanyaan-pertanyaan ini.

(A) sarang (flightdata)> pilih f08. Bulan, f08. DayOfMonth, cr. deskripsi, f08 Asal, f08. Dest, f08. FlightNum, f08. DepTime, MIN (f08. DepTime) OVER (PARTISI OLEH f08. DayOfMonth ORDER BY f08. DepTime) FROM flightinfo2008 f08 JOIN Carriers cr ON f08. UniqueCarrier = cr. kode WHERE f08 Asal = 'JFK' DAN f08. Dest = 'ORD' DAN f08. Bulan = 1 DAN f08. DepTime! = 0; … OK 1 1 JetBlue Airways JFK ORD 903 641 641 1 1 American Airlines Inc. JFK ORD 1323 833 641 1 1 JetBlue Airways JFK ORD 907 929 641 1 1 Comair Inc. JFK ORD 5083 945 641 1 1 Comair Inc. JFK ORD 5634 1215 641 1 1 JetBlue Airways JFK ORD 915 1352 641 1 1 American Airlines Inc. JFK ORD 1323 833 641 1 1 JetBlue Airways JFK ORD 907 929 641 1 1 Comair Inc. JFK ORD 5083 945 641 1 1 Comair Inc. JFK ORD 5634 1215 641 1 1 JetBlue Airways JFK ORD 915 1352 641 1 1 American Airlines Inc. JFK ORD 1815 1610 641 1 JetBlue Airways JFK ORD 917 1735 641 1 1 Comair Inc. JFK ORD 5469 1749 641 1 1 Comair Inc. JFK ORD 5492 2000 641 1 1 JetBlue Airways JFK ORD 919 2102 641 1 31 JetBlue Airways JFK ORD 919 48 48 1 31 JetBlue Airways JFK ORD 903 635 48 1 31 Comair Inc. JFK ORD 5447 650 48 1 31 American Airlines Inc. JFK ORD 1323 840 48 1 31 JetBlue Airways JFK ORD 907 921 48 1 31 JetBlue Airways JFK ORD 917 1859 48

Pada Langkah (A), klausa GROUP BY diganti dengan klausa OVER dimana Anda menentukan PARTITION atau jendela di mana Anda ingin fungsi agregat MIN beroperasi. Juga termasuk klausa ORDER BY sehingga Anda dapat melihat penerbangan berikutnya setelah yang pertama.

Seperti yang dapat Anda lihat dari daftar, pada tanggal 31 Januari, JetBlue memiliki penerbangan awal yang bagus pada pukul 12: 48 a. m. - Untuk yang lebih baru, at 6:35 a. m. Isu-isu di awal terbit, perhatikan bahwa Anda telah menyimpan informasi tersebut dalam keluaran kueri yang akan hilang jika Anda memilih untuk menggunakan klausa GROUP BY lagi.

Kemampuan ini sendiri membuat windowing fitur yang kuat, dan masih ada lagi. Seiring dengan windowing dalam rilis Hive 0. 11, masyarakat menyediakan beberapa fungsi analisis yang dapat Anda gunakan bersamaan dengan windowing. Yang juga Anda inginkan adalah fungsi ini: RANK, ROW_NUMBER, DENSE_RANK, CUME_DIST, PERCENT_RANK, dan NTILE.

Akhirnya, jangan lewatkan gunanya JOIN: Ini adalah contoh praktis dari join batin dimana Anda bergabung dengan tabel FlightInfo2008 dengan tabel Carriers untuk mendapatkan nama maskapai penerbangan - bukan daripada kode samar yang ditemukan di tabel FlightInfo2008.

Windowing di HiveQL - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...