Video: #02 - Implementasi Projek Machine Learning untuk Pemula (Klasifikasi Iris Flowers) 2024
Mesin vektor pendukung (SVM) adalah algoritma klasifikasi data prediksi prediksi yang memberikan yang baru. elemen data ke salah satu kategori berlabel. SVM adalah, dalam banyak kasus, penggolong biner ; Ini mengasumsikan bahwa data yang dimaksud mengandung dua nilai target yang mungkin.
Versi lain dari algoritma SVM, multiclass SVM, menambah SVM untuk digunakan sebagai pengklasifikasi pada dataset yang berisi lebih dari satu kelas (pengelompokan atau kategori). SVM telah berhasil digunakan di banyak aplikasi seperti pengenalan gambar, diagnosis medis, dan analisis teks.
Misalkan Anda merancang model analisis prediktif yang secara otomatis mengenali dan memprediksi nama objek dalam gambar. Ini adalah masalah pengenal gambar - atau, lebih khusus lagi, pengenalan wajah: Anda ingin penggolong mengenal nama seseorang di foto. Nah, sebelum mengatasi tingkat kompleksitas itu, pertimbangkan versi yang lebih sederhana dari masalah yang sama: Misalkan Anda memiliki gambar potongan buah individual dan Anda ingin penggolong Anda memprediksi jenis buah apa yang muncul dalam gambar. Asumsikan Anda hanya memiliki dua jenis buah: apel dan pir, satu per gambar.
Misalkan Anda memiliki 200 gambar apel yang berbeda, dan 200 gambar pir. Langkah pembelajaran terdiri dari memberi makan gambar-gambar itu ke penggolong sehingga bisa belajar seperti apa apel dan seperti apa pear. Sebelum masuk ke langkah pertama ini, Anda perlu mengubah setiap gambar menjadi matriks data, dengan menggunakan (katakanlah) paket statistik R.
Seperti yang Anda bayangkan, mewakili gambar sebagai matriks angka bukanlah tugas yang mudah. Seluruh area penelitian yang berbeda dikhususkan untuk representasi gambar.
Berikut ini adalah bagaimana mesin vektor pendukung dapat memprediksi kelas buah (memberi label secara matematis seperti
apel atau pear ), berdasarkan pada apa yang telah dipelajari algoritma di masa lalu.. Misalkan Anda telah mengubah semua gambar menjadi matriks data. Kemudian mesin vektor pendukung mengambil dua input utama:
Data sebelumnya (pelatihan): Kumpulan matrik ini sesuai dengan gambar apel dan pir yang sebelumnya terlihat.
-
Data baru (gaib) terdiri dari gambar yang dikonversi ke matriks. Tujuannya adalah untuk memprediksi secara otomatis apa yang ada dalam gambar - sebuah apel atau buah pir.
-
Vektor pendukung menggunakan fungsi matematis, yang sering disebut fungsi kernel
yang merupakan fungsi matematika yang sesuai dengan data baru dengan gambar terbaik dari data pelatihan untuk memprediksi label gambar yang tidak diketahui (apel atau pir). Dibandingkan dengan pengklasifikasi lainnya, mesin vektor pendukung menghasilkan prediksi yang kuat dan akurat, paling tidak terpengaruh oleh data yang berisik, dan kurang rentan terhadap overfitting. Ingat, bagaimanapun, bahwa mesin vektor pendukung paling sesuai untuk klasifikasi biner - bila Anda hanya memiliki dua kategori (seperti apel atau pir).