Video: Pengertian, Sejarah Perkembangan dan Teknologi Wide Area Network ( WAN ) 2024
Mengorganisir layanan data dan peralatan , lapisan 3 tumpukan data besar, menangkap, memvalidasi, dan mengumpulkan berbagai elemen data yang besar menjadi relevan secara kontekstual. koleksi. Karena data yang besar sangat besar, teknik telah berevolusi untuk mengolah data secara efisien dan mulus. MapReduce adalah salah satu teknik yang sangat banyak digunakan. Cukuplah dikatakan di sini bahwa banyak dari layanan data pengorganisasian ini adalah mesin MapReduce, yang dirancang khusus untuk mengoptimalkan pengorganisasian arus data yang besar.
Mengorganisir layanan data, pada kenyataannya, adalah ekosistem alat dan teknologi yang dapat digunakan untuk mengumpulkan dan mengumpulkan data dalam persiapan pemrosesan lebih lanjut. Dengan demikian, alat perlu menyediakan integrasi, terjemahan, normalisasi, dan skala. Teknologi dalam lapisan ini meliputi:
-
Sistem berkas terdistribusi: Diperlukan untuk mengakomodasi penguraian aliran data dan untuk memberi skala dan kapasitas penyimpanan
-
Layanan serialisasi: Diperlukan untuk penyimpanan data persisten dan multilanguage remote procedure calls (RPCs)
-
Layanan koordinasi: Diperlukan untuk membangun aplikasi terdistribusi (penguncian dan sebagainya) > Extract, transform, and load (ETL) tools:
-
Diperlukan untuk pemuatan dan konversi data terstruktur dan tidak terstruktur ke dalam Hadoop Layanan alur kerja:
-
Diperlukan untuk menjadwalkan pekerjaan dan menyediakan struktur untuk menyinkronkan elemen proses di seluruh lapisan