Video: Partial Least Square 2024
Bagian dari Lembar Analisis Prediktif untuk Kecelakaan Dummies
Proyek analisis prediktif yang berhasil dijalankan selangkah demi selangkah. Sewaktu Anda membenamkan diri Anda dalam rincian proyek, perhatikan tonggak utama ini:
-
Mendefinisikan Tujuan Bisnis
Proyek dimulai dengan menggunakan tujuan bisnis yang jelas. Model ini seharusnya menjawab pertanyaan bisnis. Jelas menyatakan bahwa tujuan akan memungkinkan Anda untuk menentukan ruang lingkup proyek Anda, dan akan memberi Anda tes yang tepat untuk mengukur keberhasilannya.
-
Mempersiapkan Data
Anda akan menggunakan data historis untuk melatih model Anda. Data biasanya tersebar di berbagai sumber dan mungkin memerlukan pembersihan dan persiapan. Data mungkin berisi catatan duplikat dan outlier; tergantung pada analisis dan tujuan bisnis, Anda memutuskan apakah akan menyimpan atau menghapusnya. Juga, data bisa memiliki nilai yang hilang, mungkin perlu menjalani beberapa transformasi, dan dapat digunakan untuk menghasilkan atribut turunan yang memiliki kekuatan prediksi lebih banyak untuk tujuan Anda. Secara keseluruhan, kualitas data menunjukkan kualitas model.
-
Sampling Data Anda
Anda harus membagi data Anda menjadi dua kumpulan: kumpulan data pelatihan dan tes. Anda membangun model menggunakan dataset pelatihan. Anda menggunakan kumpulan data uji untuk memverifikasi keakuratan keluaran model. Melakukannya sangat penting. Jika tidak, Anda berisiko menggunakan model yang melebihi ukuran Anda - melatih model dengan dataset terbatas, sampai-sampai semua fitur (baik sinyal dan noise) yang benar untuk dataset tertentu itu. Model yang terlalu banyak untuk kumpulan data tertentu akan tampil dengan menyedihkan saat Anda menjalankannya di kumpulan data lain. Dataset tes memastikan cara yang valid untuk secara akurat mengukur kinerja model Anda.
-
Terkadang data atau tujuan bisnis sesuai dengan algoritme atau model tertentu. Lain kali pendekatan terbaik tidak begitu jelas. Saat Anda menjelajahi data, jalankan sebanyak mungkin algoritma; bandingkan hasilnya Pangkas pilihan Anda dari model akhir pada keseluruhan hasil. Terkadang Anda lebih baik menjalankan ansambel model secara bersamaan pada data dan memilih model akhir dengan membandingkan keluaran mereka.
Menyebarkan Model
-
Setelah membangun model, Anda harus menyebarkannya untuk mendapatkan manfaatnya. Proses itu mungkin memerlukan koordinasi dengan departemen lain. Bertujuan membangun model deployable. Juga pastikan Anda tahu bagaimana mempresentasikan hasilnya kepada para pemangku kepentingan bisnis dengan cara yang mudah dipahami dan meyakinkan sehingga mereka mengadopsi model Anda.Setelah model digunakan, Anda harus memantau kinerjanya dan terus memperbaikinya. Kebanyakan model membusuk setelah jangka waktu tertentu. Jaga agar model Anda tetap up to date dengan menyegarkannya dengan data yang baru tersedia.