Video: Penjelasan AI ( Artificial Intelligence ) - HD 2024
Bagian dari Mesin Belajar Untuk Lembar Dosis Cheat < Pembelajaran mesin melibatkan penggunaan banyak algoritma yang berbeda. Tabel ini memberi Anda ringkasan singkat tentang kekuatan dan kelemahan berbagai algoritma.
Algoritma
Terbaik di | Kelebihan | Kontra | Hutan Acak |
Apt di hampir semua masalah belajar mesin | Bioinformatika
Dapat bekerja secara paralel |
Seldom overfits > Secara otomatis menangani nilai yang hilang
Tidak perlu mengubah variabel apapun Tidak perlu mengubah parameter Tidak dapat digunakan oleh hampir semua orang dengan hasil bagus Sulit untuk menafsirkan Weaker pada regresi saat memperkirakan nilai di ekstrem distribusi nilai respons |
Bias dalam masalah multikelas ke kelas yang lebih sering
Peningkatan Gradien Apt pada hampir semua masalah belajar mesin |
Mesin pencari (memecahkan masalah belajar memberi peringkat) > Ini kira-kira mendekati fungsi nonlinier | Yang terbaik di kelas prediktor
Secara otomatis menangani nilai yang hilang |
Tidak perlu mengubah variabel apapun
Dapat terlalu banyak jika dijalankan terlalu banyak iterasi Sensitif terhadap data berisik dan outlier Tidak bekerja dengan baik tanpa parameter tuning |
Regresi linier
Prediksi awal t hitung Prediksi ekonometrik |
Pemodelan tanggapan pemasaran | Sederhana untuk memahami dan menjelaskan
jarang sekali Menggunakan regularisasi L1 & L2 efektif dalam pemilihan fitur |
Cepat untuk melatih
Mudah untuk Latih data yang besar berkat versi stokastik Anda harus bekerja keras untuk membuatnya sesuai fungsi nonlinier Dapat menderita outlier Dukungan Mesin Vektor |
Pengenalan karakter
Pengenalan gambar |
Teks Klasifikasi | Pembuatan fitur nonlinier otomatis
Dapat mendekati fungsi nonlinier yang kompleks Sulit untuk menafsirkan saat menerapkan kernel nonlinier |
Menderita terlalu banyak contoh, setelah 10.000 contoh mulai terlalu lama untuk berlatih
K-terdekat Tetangga |
Penglihatan komputer
Penandaan multilabel |
Sistem rekomendasi | Masalah pengecekan ejaan
Latihan cepat dan malas Secara alami dapat menangani masalah multiklass yang ekstrem (seperti teks penandaan) Lambat dan tidak praktis dalam fase prediksi |
Dapat gagal memprediksi koreksi ectly karena kutukan dimensi
Adaboost |
Deteksi wajah
Secara otomatis menangani nilai yang hilang |
Tidak perlu mengubah variabel apapun | Tidak terlalu mudah | Beberapa parameter untuk men-tweak > Dapat memanfaatkan banyak pembelajar lemah yang berbeda
Sensitif terhadap data dan outlier yang bising Jangan pernah prediksi terbaik di kelas Naive Bayes Pengenalan wajah |
Analisis sentimen
Deteksi spam |
Klasifikasi teks | Mudah dan cepat untuk diimplementasikan, tidak memerlukan terlalu banyak memori dan dapat digunakan untuk pembelajaran online
Mudah dimengerti Mempertimbangkan pengetahuan sebelumnya Asumsi independensi fitur yang kuat dan tidak realistis > Gagal memperkirakan kejadian langka |
Menderita dari fitur yang tidak relevan
Neural Networks Pengenalan citra |
Pengenalan dan terjemahan bahasa
Pengenalan ucapan Pengenalan visi |
Dapat mendekati fungsi nonlinier | Kuat terhadap outlier
Bekerja hanya dengan sebagian contoh (vektor pendukung s) Sangat sulit untuk mengatur Sulit untuk menyesuaikan karena terlalu banyak parameter dan Anda juga harus memutuskan arsitektur jaringan |
Sulit untuk menafsirkan
Mudah untuk menerima regresi Logistik |
Memesan hasil dengan probabilitas
Memodelkan tanggapan pemasaran Sederhana untuk memahami dan menjelaskan jarang overfits |
Menggunakan regularisasi L1 & L2 efektif dalam pemilihan fitur | Algoritma terbaik untuk memprediksi probabilitas sebuah event
Cepat untuk melatih |
Mudah untuk melatih data besar berkat versi stochastic
Anda harus bekerja keras untuk membuatnya sesuai fungsi nonlinier Dapat menderita outlier SVD Recommender sistem Dapat merestrukturisasi data dengan cara yang berarti |
Sulit untuk memahami mengapa data telah direstrukturisasi dengan cara tertentu
PCA |
Menghapus collinearity | Mengurangi dimensi kumpulan data | Dapat mengurangi dimensi data | Menerapkan asumsi linier yang kuat (komponen adalah penjumlahan fitur tertimbang) K-means |
Segmentasi | Cepat dalam menemukan kelompok
Dapat mendeteksi outlier dalam berbagai dimensi |
Menderita multikolinearitas | Cluster bersifat bola, tidak dapat mendeteksi kelompok dengan bentuk lain |
tidak stabil solusi, tergantung pada inisialisasi |
|