Daftar Isi:
- Bagaimana menggambarkan keterbatasan model analisis prediktif
- Bagaimana cara menguji dan mengevaluasi model analisis prediktif Anda
- Bagaimana cara menghindari model analisis prediktif yang tidak terukur
Video: TensorFlow Dev Summit 2019 Keynote 2024
Pemodelan prediktif semakin populer sebagai alat untuk mengelola banyak aspek bisnis. Memastikan bahwa analisis data dilakukan dengan benar akan meningkatkan kepercayaan pada model yang digunakan - yang, pada gilirannya, dapat menghasilkan pembelian yang dibutuhkan untuk analisis prediktif untuk menjadi bagian dari toolkit standar organisasi Anda.
Mungkin popularitas yang meningkat ini berasal dari cara di mana proyek analisis prediktif dapat mendukung pengambilan keputusan dengan membuat model yang menggambarkan kumpulan data, menemukan kemungkinan pola dan tren baru (seperti yang ditunjukkan oleh data), dan memprediksi hasil dengan keandalan yang lebih besar.
Untuk mencapai tujuan ini, proyek analisis prediktif harus memberikan model yang paling sesuai dengan data dengan memilih variabel keputusan dengan benar dan efisien. Beberapa pertanyaan penting harus dijawab dalam perjalanan menuju tujuan itu:
-
Apa asumsi minimum dan variabel keputusan yang memungkinkan model paling sesuai dengan data?
-
Bagaimana model yang sedang dibangun dibandingkan dengan model lain yang berlaku?
-
Kriteria apa yang terbaik untuk mengevaluasi dan mencetak model ini?
Sekali lagi, Anda dapat memanggil suara pengalaman untuk menyelamatkannya: Pakar pengetahuan domain dapat mendiskusikan pertanyaan ini, menafsirkan hasil yang menunjukkan pola tersembunyi pada data, dan membantu memverifikasi dan memvalidasi keluaran model.
Bagaimana menggambarkan keterbatasan model analisis prediktif
Model analitik prediktif memiliki batasan tertentu berdasarkan algoritma yang dipakainya dan dataset yang dijalankannya. Anda harus menyadari keterbatasan itu dan membuat mereka bekerja untuk keuntungan Anda; yang terkait dengan algoritme mencakup
-
Apakah data memiliki pola nonlinier (tidak membentuk garis)
-
Seberapa berkorelasi variabelnya (hubungan statistik antar fitur)
-
Apakah variabelnya independen (tidak ada hubungan antara fitur)
-
Apakah cakupan data sampel membuat model cenderung overfitting
Untuk mengatasi keterbatasan model Anda, gunakan teknik validasi cross-validation untuk menguji model Anda. Mulailah dengan membagi data Anda ke dalam kumpulan data pelatihan dan pengujian, dan jalankan model terhadap masing-masing kumpulan data tersebut secara terpisah untuk mengevaluasi dan mencetak prediksi model.
Bagaimana cara menguji dan mengevaluasi model analisis prediktif Anda
Tidak ada model yang dapat menghasilkan perkiraan akurat 100 persen; Setiap model memiliki potensi untuk menghasilkan hasil yang tidak akurat. Berhati-hatilah untuk variasi yang signifikan antara prakiraan model Anda menghasilkan dan data yang diamati - terutama jika output model bertentangan dengan akal sehat.Jika terlihat terlalu bagus, buruk, atau ekstrem menjadi kenyataan, maka itu mungkin tidak benar (untuk kenyataan sih).
Dalam proses evaluasi, teliti hasil keluaran model yang sedang Anda uji dan bandingkan dengan variabel masukan. Kemampuan perkiraan model Anda harus menjawab semua tujuan bisnis yang dinyatakan yang mendorong penciptaannya di tempat pertama.
Jika kesalahan atau bias muncul dalam keluaran model Anda, cobalah menelusuri kembali ke
-
Data validitas, reliabilitas, dan musiman data
-
Asumsi yang digunakan dalam model
-
Variabel yang disertakan atau dikecualikan dalam analisis
Bekerja dengan pengguna bisnis untuk mengevaluasi setiap langkah proses model Anda; pastikan bahwa keluaran model dapat dengan mudah ditafsirkan dan digunakan dalam situasi bisnis dunia nyata. Saldo keakuratan dan keandalan model dengan seberapa mudah keluaran model dapat ditafsirkan dan digunakan secara praktis.
Bagaimana cara menghindari model analisis prediktif yang tidak terukur
Saat membangun model, selalu perhatikan skalabilitasnya. Selalu periksa kinerja, akurasi, dan reliabilitas model pada berbagai skala. Model Anda harus bisa mengubah skalanya - dan meningkatkannya sebesar yang diperlukan - tanpa berantakan atau mengeluarkan prediksi buruk.
Skalabilitas cukup menantang di masa lalu. Model prediktif butuh waktu lama untuk membangun dan berlari. Dataset model berjalan pada kecil, dan datanya mahal untuk dikumpulkan, disimpan, dan dicari. Tapi itu semua ada di era "pra-data besar".
Saat ini data besar murah, banyak, dan terus bertambah. Sebenarnya, masalah potensial lain muncul: Volume data yang hebat yang ada saat ini dapat berdampak negatif terhadap model dan menurunkan kinerjanya, ketinggalan model dalam waktu yang relatif singkat. Diimplementasikan dengan benar, skalabilitas dapat membantu "membuktikan masa depan" model Anda.
Masa depan bukanlah satu-satunya ancaman. Bahkan di era online sekarang, data streaming bisa membanjiri model - terutama jika arus data meningkat menjadi banjir.
Volume data saja dapat menyebabkan variabel keputusan dan faktor prediksi tumbuh ke bilangan raksasa yang memerlukan pembaharuan terus menerus terhadap model. Jadi ya, model Anda lebih baik terukur - dengan cepat terukur.