Video: Google Keynote (Google I/O'19) 2024
Baik rata-rata dan sistem pemungutan suara juga dapat bekerja dengan baik saat Anda menggunakan campuran pembelajaran mesin yang berbeda. algoritma. Ini adalah pendekatan rata-rata, dan ini banyak digunakan saat Anda tidak dapat mengurangi varians perkiraan.
Saat Anda mencoba belajar dari data, Anda harus mencoba berbagai solusi, sehingga memodelkan data Anda menggunakan berbagai solusi pembelajaran mesin. Ini adalah praktik yang baik untuk memeriksa apakah Anda dapat memasukkan beberapa dari mereka berhasil menjadi ansambel dengan menggunakan rata-rata prediksi atau dengan menghitung kelas yang diprediksi. Prinsipnya sama seperti dalam mengantongi prediksi yang tidak berkorelasi, ketika model dicampur bersama dapat menghasilkan prediksi yang kurang variance-influence. Untuk mencapai rata-rata yang efektif, Anda harus
- Bagi data Anda ke dalam set pelatihan dan tes.
- Gunakan data pelatihan dengan algoritma pembelajaran mesin yang berbeda.
- Catat prediksi dari masing-masing algoritma dan evaluasi viabilitas hasilnya dengan menggunakan set tes.
- Korelasi semua prediksi yang tersedia satu sama lain.
- Pilihlah prediksi yang paling sedikit berkorelasi dan rata-rata hasilnya. Atau, jika Anda mengklasifikasi, pilihlah kelompok dengan prediksi yang paling tidak berkorelasi dan, untuk setiap contoh, pilihlah prediksi kelas baru kelas yang mayoritas diprediksi.
- Uji prediksi rata-rata atau terpilih-oleh-mayoritas terhadap data uji. Jika berhasil, Anda membuat model akhir dengan merata-ratakan hasil model bagian ansambel yang sukses.
Untuk memahami model mana yang paling sedikit berkorelasi, ambillah prediksi satu per satu, kaitkan masing-masing lawan yang lain, dan rata-rata korelasi untuk mendapatkan korelasi rata-rata. Gunakan korelasi rata-rata untuk menentukan peringkat prediksi terpilih yang paling sesuai untuk rata-rata.