Video: The 7 Steps of Machine Learning (AI Adventures) 2024
Terlepas dari semua hal yang telah Anda ketahui tentang asumsi yang menyebabkan masalah, beberapa asumsi tetap menjadi inti dari model analisis prediktif. Asumsi tersebut muncul dalam variabel yang dipilih dan dipertimbangkan dalam analisis - dan variabel tersebut secara langsung mempengaruhi keakuratan keluaran model akhir.
Oleh karena itu, tindakan pencegahan paling bijak Anda pada awalnya adalah mengidentifikasi asumsi mana yang paling penting bagi model Anda - dan menjaga agar tetap minimum.
Membuat model prediktif yang bekerja dengan baik di dunia nyata membutuhkan pengetahuan yang mendalam tentang bisnis. Model Anda mulai mengetahui hanya data sampel - secara praktis, hampir tidak ada apa-apa. Jadi mulai kecil dan terus meningkatkan model seperlunya.
Merumuskan kemungkinan pertanyaan dan skenario dapat mengarah pada penemuan kunci dan / atau dapat memberi lebih banyak penerangan pada faktor-faktor yang bermain di dunia nyata. Proses ini dapat mengidentifikasi variabel inti yang dapat mempengaruhi hasil analisis.
Dalam pendekatan sistematis terhadap analisis prediktif, skenario "bagaimana-jika" fase ini - sangat menarik dan bermanfaat. Di sinilah Anda mengubah input model untuk mengukur efek dari satu variabel atau lainnya pada keluaran model; Apa yang sebenarnya Anda uji adalah kemampuan peramalannya.
Meningkatkan asumsi model - dengan menguji bagaimana pengaruhnya terhadap keluaran model, menyelidik untuk melihat seberapa peka modelnya bagi mereka, dan menguranginya sampai minimum - akan membantu Anda membimbing model menuju kemampuan prediksi yang lebih andal. Sebelum Anda dapat mengoptimalkan model Anda, Anda harus mengetahui variabel prediktif - fitur yang memiliki dampak langsung pada hasilnya.
Anda bisa mendapatkan variabel keputusan tersebut dengan menjalankan beberapa simulasi model Anda - sambil mengubah beberapa parameter dengan setiap run - dan mencatat hasilnya, terutama keakuratan perkiraan model. Biasanya Anda bisa melacak variasi ketepatan kembali ke parameter spesifik yang Anda ubah.
Pada titik ini, abad kedua puluh satu dapat beralih ke pertolongan keempat belas untuk meminta pertolongan. William dari Ockham, seorang biarawan Fransiskan Inggris dan filsuf skolastik yang tinggal di tahun 1300an, mengembangkan prinsip penelitian yang dikenal dengan nama Occam's Razor: Anda harus mengurangi asumsi yang tidak perlu sampai teori Anda sesedikit mungkin. Maka kemungkinan itu benar.
Terlalu banyak asumsi menimbang prakiraan model Anda dengan ketidakpastian dan ketidakakuratan.Menghilangkan variabel yang tidak perlu mengarah pada model yang lebih kuat, namun tidak mudah menentukan variabel mana yang akan disertakan dalam analisis - dan keputusan tersebut secara langsung mempengaruhi kinerja model.
Tapi di sinilah analis bisa mengalami dilema: Termasuk faktor-faktor yang tidak perlu dapat membelokkan atau mendistorsi output model, namun tidak termasuk variabel yang relevan membuat model tidak lengkap.
Jadi, ketika tiba saatnya untuk memilih variabel keputusan yang sangat penting, hubungi pakar pengetahuan domain Anda. Bila Anda memiliki kumpulan variabel keputusan berbasis kenyataan yang akurat, Anda tidak perlu membuat terlalu banyak asumsi - dan hasilnya bisa lebih sedikit kesalahan pada model prediktif Anda.