Video: Pig Tutorial | Apache Pig Script | Hadoop Pig Tutorial | Edureka 2024
Hadoop adalah ekosistem yang kaya dan cepat berkembang dengan serangkaian aplikasi baru yang semakin meningkat. Daripada mencoba mengikuti semua persyaratan untuk kemampuan baru, Pig dirancang agar dapat diperluas melalui fungsi yang ditetapkan pengguna , juga dikenal sebagai UDF.
UDF dapat ditulis dalam sejumlah bahasa pemrograman, termasuk Java, Python, dan JavaScript. Pengembang juga memposting dan berbagi koleksi online UDF yang sedang berkembang. (Carilah Piggy Bank dan DataFu, untuk memberi nama hanya dua contoh koleksi online semacam itu.) Beberapa UDF Babi yang merupakan bagian dari repositori ini adalah fungsi LOAD / STORE (XML, misalnya), fungsi tanggal, teks, matematika, dan fungsi statistik.
Babi juga dapat disematkan dalam bahasa inang seperti Java, Python, dan JavaScript, yang memungkinkan Anda mengintegrasikan Babi dengan aplikasi yang ada. Ini juga membantu mengatasi keterbatasan bahasa Babi. Salah satu keterbatasan yang paling sering diacu adalah Pig tidak mendukung pernyataan arus kontrol: jika / else, while loop, for loop, and condition statements.
Babi secara native mendukung aliran data, namun perlu disisipkan dalam bahasa lain untuk menyediakan aliran kontrol. Ada timbal balik, namun menanamkan Babi dalam bahasa aliran kontrol. Misalnya, jika pernyataan Babi disematkan dalam satu lingkaran, setiap kali loop iterates dan menjalankan pernyataan Pig, ini menyebabkan tugas MapReduce terpisah berjalan.