Video: Day 2 Keynote (GDD Europe '17) 2024
Persyaratan keamanan dan privasi, lapisan 1 tumpukan data yang besar, serupa untuk persyaratan untuk lingkungan data konvensional. Persyaratan keamanan harus disesuaikan dengan kebutuhan bisnis yang spesifik. Beberapa tantangan unik muncul saat data besar menjadi bagian dari strategi:
-
Akses data: Akses pengguna ke data besar mentah atau yang dihitung memiliki tingkat persyaratan teknis yang sama seperti implementasi data non-besar. Data harus tersedia hanya bagi mereka yang memiliki kebutuhan bisnis yang sah untuk memeriksa atau berinteraksi dengannya. Sebagian besar platform penyimpanan data inti memiliki skema keamanan yang ketat dan diperkuat dengan kemampuan identitas federasi, memberikan akses yang sesuai ke banyak lapisan arsitektur.
-
Akses aplikasi: Akses aplikasi ke data juga relatif mudah dari segi teknis. Sebagian besar antarmuka pemrograman aplikasi (API) menawarkan perlindungan dari penggunaan atau akses yang tidak sah. Tingkat perlindungan ini mungkin memadai untuk implementasi data yang paling besar.
-
Enkripsi data: Enkripsi data adalah aspek keamanan yang paling menantang di lingkungan data yang besar. Di lingkungan tradisional, mengenkripsi dan mendekripsi data benar-benar menekankan sumber daya sistem. Masalah ini diperburuk dengan data yang besar. Pendekatan yang paling sederhana adalah memberikan kemampuan komputasi yang lebih dan lebih cepat. Pendekatan yang lebih moderat adalah mengidentifikasi elemen data yang membutuhkan tingkat keamanan ini dan hanya mengenkripsi item yang diperlukan.
-
Pencantuman perangkat bergerak dan jaringan sosial secara eksponensial meningkatkan jumlah data dan peluang untuk ancaman keamanan. Oleh karena itu penting bagi organisasi untuk melakukan pendekatan multiperimeter terhadap keamanan. Jadi, infrastruktur fisik memungkinkan semuanya dan infrastruktur keamanan melindungi semua elemen di lingkungan data Anda yang besar. Tingkat berikutnya di stack adalah antarmuka yang memberikan akses dua arah ke semua komponen tumpukan - dari aplikasi perusahaan hingga umpan data dari Internet.
Selama beberapa dekade, pemrogram telah menggunakan API untuk menyediakan akses ke dan dari implementasi perangkat lunak. Alat dan penyedia teknologi akan berusaha keras untuk memastikan bahwa ini adalah tugas yang relatif mudah untuk membuat aplikasi baru dengan menggunakan produk mereka.Meski sangat membantu, terkadang diperlukan profesional TI untuk membuat API khusus atau eksklusif yang eksklusif bagi perusahaan.
Anda mungkin perlu melakukan ini untuk keunggulan kompetitif, kebutuhan unik untuk organisasi Anda, atau permintaan bisnis lainnya, dan ini bukan tugas yang sederhana. API harus didokumentasikan dengan baik dan dipelihara untuk mempertahankan nilai bisnis. Untuk alasan ini, beberapa perusahaan memilih untuk menggunakan toolkit API untuk memulai aktivitas penting ini.
Toolkit API memiliki beberapa keunggulan dibandingkan API yang dikembangkan secara internal. Yang pertama adalah bahwa toolkit API adalah produk yang dibuat, dikelola, dan dipelihara oleh pihak ketiga yang independen. Kedua, mereka dirancang untuk memecahkan persyaratan teknis tertentu.
Tantangan data yang besar memerlukan pendekatan yang sedikit berbeda terhadap pengembangan atau adopsi API. Karena sebagian besar data tidak terstruktur dan dihasilkan di luar kendali bisnis Anda, teknik baru, yang disebut Natural Language Processing (NLP), muncul sebagai metode yang disukai untuk berinteraksi antara data besar dan program aplikasi Anda.
NLP memungkinkan Anda merumuskan pertanyaan dengan sintaks bahasa alami dan bukan bahasa permintaan formal seperti SQL. Bagi sebagian besar pengguna data besar, akan lebih mudah untuk bertanya "Cantumkan semua konsumen pria yang sudah menikah berusia antara 30 dan 40 tahun yang tinggal di Amerika Serikat bagian tenggara dan menjadi penggemar NASCAR" daripada menulis kueri 30 baris untuk jawaban.
Karena kebanyakan pengumpulan dan pengarsipan data memiliki karakteristik yang sangat mirip, Anda dapat merancang seperangkat layanan untuk mengumpulkan, membersihkan, mengubah, menormalisasi, dan menyimpan barang data besar dalam sistem penyimpanan pilihan Anda.
Untuk menciptakan fleksibilitas sebanyak yang diperlukan, pabrik dapat didorong dengan deskripsi antarmuka yang ditulis dalam Extensible Markup Language (XML). Tingkat abstraksi ini memungkinkan antarmuka spesifik dibuat dengan mudah dan cepat tanpa perlu membangun layanan khusus untuk setiap sumber data.
Dalam prakteknya, Anda bisa membuat deskripsi antarmuka aplikasi SAP atau Oracle menggunakan sesuatu seperti XML. Setiap antarmuka akan menggunakan perangkat lunak dasar yang sama untuk memigrasikan data antara lingkungan data yang besar dan lingkungan aplikasi produksi yang tidak bergantung pada spesifikasi SAP atau Oracle. Jika Anda perlu mengumpulkan data dari situs sosial di Internet, praktiknya akan sama.
Jelaskan antarmuka ke situs dalam XML, lalu libatkan layanan untuk memindahkan data bolak-balik. Biasanya, antarmuka ini didokumentasikan untuk digunakan oleh teknologi internal dan eksternal.