Video: TensorFlow Dev Summit 2019 Keynote 2024
Bila data Anda sudah siap dan Anda akan mulai membangun model prediksi untuk analisis, ini berguna untuk menjelaskan metodologi pengujian dan rancangan rencana uji. Pengujian harus didorong oleh sasaran bisnis yang telah Anda kumpulkan, didokumentasikan, dan mengumpulkan semua data yang diperlukan untuk membantu Anda mencapainya.
Langsung dari kelelawar, Anda harus merancang sebuah metode untuk menguji apakah sebuah tujuan bisnis telah berhasil dicapai. Karena analisis prediktif mengukur kemungkinan hasil yang akan datang - dan satu-satunya cara untuk siap menjalankan tes semacam itu adalah dengan melatih model Anda pada data masa lalu, Anda masih harus melihat apa yang dapat dilakukan bila melawan data masa depan.
Tentu saja, Anda tidak dapat mengambil risiko menjalankan model yang belum dicoba pada data masa depan yang sebenarnya, jadi Anda harus menggunakan data yang ada untuk mensimulasikan data masa depan secara realistis. Untuk melakukannya, Anda harus membagi data yang Anda gunakan untuk melatih dan menguji kumpulan data.
Pastikan Anda memilih dua dataset ini secara acak, dan kedua dataset berisi dan mencakup semua parameter data yang Anda ukur.
Bila Anda membagi data Anda ke dalam kumpulan data pengujian dan pelatihan, Anda secara efektif menghindari masalah yang berlebihan yang dapat timbul akibat overtraining model di seluruh dataset dan memungut semua pola suara atau fitur spesifik yang hanya termasuk dalam kumpulan data sampel. dan tidak berlaku untuk dataset lain.
Memisahkan data Anda ke dalam kumpulan data pelatihan dan pengujian, masing-masing sekitar 70 persen dan 30 persen, memastikan pengukuran kinerja model prediksi analitik yang tepat yang sedang Anda bangun. Anda ingin mengevaluasi model Anda terhadap data uji karena ini adalah cara mudah untuk mengukur apakah prediksi model akurat.