Video: Model Drivers Data Quality Seminar 2024
Pemodelan risiko adalah kasus penggunaan utama lainnya yang diberi energi oleh Hadoop. Anda akan menemukan bahwa ini sangat sesuai dengan kasus penggunaan deteksi kecurangan karena ini adalah disiplin berbasis model. Semakin banyak data yang Anda miliki dan semakin Anda dapat "menghubungkan titik-titik itu", semakin sering hasilnya akan menghasilkan model prediksi risiko yang lebih baik.
Kata yang mencakup semua berisiko dapat mengambil banyak makna. Misalnya, prediksi churn pelanggan adalah risiko klien berpindah ke pesaing; risiko buku pinjaman berhubungan dengan risiko kegagalan; Risiko dalam perawatan kesehatan mencakup keseluruhan dari penahanan wabah sampai keamanan pangan hingga kemungkinan infeksi ulang dan banyak lagi.
Sektor jasa keuangan (FSS) sekarang banyak berinvestasi dalam pemodelan risiko berbasis Hadoop. Sektor ini berupaya meningkatkan otomasi dan akurasi penilaian risiko dan pemodelan eksposur.
Hadoop menawarkan peserta kesempatan untuk memperpanjang kumpulan data yang digunakan dalam model risikonya untuk memasukkan sumber yang kurang dimanfaatkan (atau sumber yang tidak pernah digunakan), seperti e-mail, pesan instan, media sosial, dan interaksi dengan layanan pelanggan perwakilan, di antara sumber data lainnya.
Model risiko di FSS muncul di mana-mana. Mereka digunakan untuk pencegahan pencurian pelanggan, manipulasi manipulasi perdagangan, risiko perusahaan dan analisis eksposur, dan banyak lagi.
Ketika sebuah perusahaan mengeluarkan polis asuransi terhadap bencana alam di rumah, satu tantangan adalah dengan jelas melihat berapa banyak uang yang berpotensi berisiko. Jika perusahaan asuransi gagal mencadangkan uang untuk kemungkinan pembayaran, regulator akan melakukan intervensi (perusahaan asuransi tidak menginginkan hal itu); jika perusahaan asuransi menempatkan terlalu banyak uang ke dalam cadangannya untuk membayar klaim kebijakan masa depan, mereka kemudian tidak dapat menginvestasikan uang premi Anda dan mendapatkan keuntungan (perusahaan asuransi juga tidak menginginkannya).
Cukup sederhana, perusahaan-perusahaan ini mengalami kesulitan dalam menguji model risiko mereka. Kemampuan untuk melipat lebih banyak data - misalnya, pola cuaca atau distribusi sosioekonomi yang selalu berubah dari basis klien mereka - memberi mereka lebih banyak wawasan dan kemampuan dalam mencapai model risiko yang lebih baik.Model risiko bangunan dan stress-testing seperti yang baru saja dijelaskan adalah tugas ideal untuk Hadoop. Operasi ini sering dihitung secara mahal dan, ketika Anda membangun model risiko, mungkin tidak praktis untuk berjalan melawan gudang data, karena alasan berikut:
Gudang mungkin tidak dioptimalkan untuk jenis pertanyaan yang dikeluarkan oleh model risiko.(Hadoop tidak terikat oleh model data yang digunakan di gudang data).
-
Pekerjaan batch ad hoc yang besar seperti model risiko yang berkembang akan menambah beban ke gudang, yang mempengaruhi aplikasi analitik yang ada. (Hadoop dapat mengasumsikan beban kerja ini, membebaskan gudang untuk pelaporan bisnis reguler.
-
Model risiko lanjutan lainnya mungkin perlu memasukkan data yang tidak terstruktur, seperti teks mentah. (Hadoop dapat menangani tugas itu secara efisien.)