Rumah Keuangan Pribadi Fraud Detection with Hadoop - dummies

Fraud Detection with Hadoop - dummies

Video: GRAPHS IN FINANCE AND FRAUD DETECTION by Jim Webber at Big Data Spain 2015 2024

Video: GRAPHS IN FINANCE AND FRAUD DETECTION by Jim Webber at Big Data Spain 2015 2024
Anonim

Volume transaksi yang sebenarnya membuat lebih sulit untuk menemukan kecurangan karena volume data, ironisnya, tantangan yang sama dapat membantu menciptakan model prediksi prediktif yang lebih baik - area di mana Hadoop bersinar.

Di dunia yang saling terkait saat ini, volume transaksi dan kompleksitas transaksi membuat lebih sulit daripada sebelumnya untuk menemukan kecurangan. Apa yang biasa disebut "menemukan jarum di tumpukan jerami" telah menjadi tugas "menemukan jarum tertentu di tumpukan jarum. "

Jadi bagaimana deteksi kecurangan dilakukan sekarang? Karena keterbatasan teknologi tradisional, model kecurangan dibuat dengan cara sampling data dan menggunakan sampel untuk membangun seperangkat model prediksi dan prediksi kecurangan. Bila Anda membandingkan model ini dengan departemen kecurangan Hadoop-anchored yang menggunakan kumpulan data lengkap - tidak ada sampling - untuk membangun model, Anda dapat melihat perbedaannya.

Tema berulang yang paling umum yang Anda lihat di sebagian besar kasus penggunaan Hadoop adalah membantu bisnis menembus langit-langit kaca pada volume dan variasi data yang dapat digabungkan ke dalam analisis keputusan. Semakin banyak data yang Anda miliki (dan semakin banyak sejarah yang Anda simpan), semakin baik model Anda.

Mencampur bentuk nontradisional data dengan kumpulan transaksi historis Anda dapat membuat model kecurangan Anda menjadi lebih kuat. Misalnya, jika seorang pekerja membuat klaim kompensasi pekerja untuk mendapatkan hasil buruk dari insiden terjatuh dan terjatuh, memiliki jutaan kasus hasil pasien yang detail perawatan dan lama pemulihan membantu menciptakan pola deteksi kecurangan.

Sebagai contoh bagaimana model ini dapat bekerja, bayangkan mencoba untuk mengetahui apakah pasien di daerah pedesaan pulih lebih lambat daripada di daerah perkotaan. Anda bisa mulai dengan memeriksa kedekatannya dengan layanan fisioterapi. Adakah korelasi pola antara waktu pemulihan dan lokasi geografis?

Jika departemen kecurangan Anda menentukan bahwa cedera tertentu memerlukan waktu tiga minggu pemulihan, namun seorang petani dengan diagnosis yang sama tinggal satu jam dari seorang fisioterapis dan pekerja kantor memiliki seorang praktisi di kantornya, itu adalah variabel lain untuk ditambahkan ke penipuan. -deteksi pola.

Saat Anda mengumpulkan data jaringan sosial untuk penggugat dan menemukan pasien yang mengaku menderita whiplash membual tentang menyelesaikan rangkaian kejadian ketahanan kasar yang dikenal dengan Tough Mudder, ini adalah contoh untuk mencampur jenis data baru dengan formulir data tradisional untuk melihat kecurangan

Jika Anda ingin menendang upaya deteksi kecurangan Anda ke alat yang lebih tinggi, organisasi Anda dapat bekerja untuk beralih dari pemodelan segmen pasar dan bergerak menuju pemodelan tingkat transaksi atau di tempat.

Cukup sederhana, membuat perkiraan berdasarkan segmen sangat membantu, namun membuat keputusan berdasarkan informasi tertentu tentang transaksi individual adalah (jelas) lebih baik. Untuk melakukan ini, Anda menyusun kumpulan data yang lebih besar daripada yang mungkin terjadi dalam pendekatan tradisional. Hanya (maksimal) 30 persen dari informasi yang tersedia yang mungkin berguna untuk pemodelan kecurangan sedang digunakan.

Untuk membuat model deteksi kecurangan, Hadoop cocok untuk

Menangani volume:

  • Itu berarti memproses kumpulan data lengkap - tidak ada pengambilan sampel data. Mengelola varietas data baru:

  • Contohnya adalah masuknya kedekatan ke layanan perawatan dan lingkaran sosial untuk menghiasi model kecurangan. Menjaga lingkungan yang tangkas:

  • Aktifkan berbagai jenis analisis dan perubahan pada model yang ada. Pemodel penipuan dapat menambahkan dan menguji variabel baru ke model tanpa harus mengajukan proposal ke tim administrator database Anda dan kemudian menunggu beberapa minggu untuk menyetujui perubahan skema dan memasukkannya ke lingkungan mereka.

Proses ini sangat penting untuk deteksi kecurangan karena lingkungan dinamis umumnya memiliki pola kecurangan siklis yang datang dan pergi berjam-jam, hari, atau minggu. Jika data yang digunakan untuk mengidentifikasi atau mendukung model deteksi kecurangan baru tidak tersedia dalam waktu singkat, pada saat Anda menemukan pola baru ini, mungkin sudah terlambat untuk mencegah kerusakan.

Evaluasi keuntungan bisnis Anda tidak hanya membangun model yang lebih komprehensif dengan lebih banyak jenis data tetapi juga dapat menyegarkan dan meningkatkan model tersebut lebih cepat dari sebelumnya. Perusahaan yang dapat menyegarkan dan meningkatkan model setiap hari akan lebih baik daripada yang melakukannya setiap tiga bulan.

Anda mungkin percaya bahwa masalah ini memiliki jawaban yang sederhana - tanyakan persetujuan CIO untuk pengeluaran operasional (OPEX) dan capital expenditure (CAPEX) untuk mengakomodasi lebih banyak data guna membuat model yang lebih baik dan memuat 70 persen data lainnya ke dalam model keputusan

Anda bahkan mungkin percaya bahwa investasi ini akan membayar sendiri dengan deteksi kecurangan yang lebih baik; Namun, masalah dengan pendekatan ini adalah biaya di muka yang tinggi yang perlu ditenggelamkan ke data

tidak diketahui , di mana Anda tidak tahu apakah itu berisi wawasan yang benar-benar berharga. Tentu, tiga kali lipat ukuran gudang data Anda, misalnya, akan memberi Anda lebih banyak akses ke data historis terstruktur untuk menyempurnakan model Anda, namun tidak dapat mengakomodasi ledakan media sosial. Teknologi tradisional juga tidak lincah. Hadoop mempermudah mengenalkan variabel baru ke dalam model, dan jika ternyata tidak menghasilkan perbaikan pada model, Anda cukup membuang data dan melanjutkan.

Fraud Detection with Hadoop - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...