Rumah Keuangan Pribadi Bagaimana Menjalankan Data Pelatihan dalam Model Pembelajaran yang Diawasi SVM - dummies

Bagaimana Menjalankan Data Pelatihan dalam Model Pembelajaran yang Diawasi SVM - dummies

Video: Penjelasan AI ( Artificial Intelligence ) - HD 2024

Video: Penjelasan AI ( Artificial Intelligence ) - HD 2024
Anonim

Sebelum memberi pengganda Mesin Vektor Pendukung (SVM) dengan data yang dimuat untuk analisis prediktif, Anda harus membagi kumpulan data lengkap ke dalam rangkaian pelatihan dan set tes

Untungnya, scikit-learn telah menerapkan sebuah fungsi yang akan membantu Anda dengan mudah membagi dataset penuh. Fungsi train_test_split mengambil sebagai masukan satu dataset dan nilai persentase. Nilai persentase digunakan untuk menentukan ukuran set tes. Fungsi mengembalikan dua dataset: dataset tes (dengan ukuran yang ditentukan) dan dataset pelatihan (yang menggunakan data yang tersisa).

Biasanya, seseorang dapat mengambil sekitar 70-80 persen data untuk digunakan sebagai rangkaian pelatihan dan menggunakan data yang tersisa sebagai rangkaian tes. Tapi dataset Iris sangat kecil (hanya 150 contoh), jadi Anda bisa mengambil 90 persennya untuk melatih model dan menggunakan 10 persen lainnya sebagai data uji untuk melihat bagaimana model prediktif Anda akan tampil.

Ketik kode berikut untuk membagi dataset Anda: >>>> dari sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris data, target iris, test_size = 0, 10, random_state = 111)

Baris pertama mengimpor perpustakaan validasi silang ke dalam sesi Anda. Baris kedua membuat rangkaian uji dari 10 persen sampel.

x_train akan berisi 135 pengamatan dan fiturnya.

y_train akan berisi 135 label dalam urutan yang sama dengan 135 pengamatan.

x_test akan berisi 15 (atau 10 persen) pengamatan dan fiturnya.

y_test akan berisi 15 label dalam urutan yang sama dengan 15 pengamatan.

Kode berikut memverifikasi bahwa perpecahan adalah apa yang Anda harapkan:

>>>> X_train. bentuk (135, 4) >>> y_train. bentuk (135,) >>> X_test. bentuk (15, 4) >>> y_test. bentuk (15,)

Anda dapat melihat dari hasil bahwa ada 135 pengamatan dengan 4 fitur dan 135 label dalam rangkaian pelatihan. Set tes memiliki 15 pengamatan dengan 4 fitur dan 15 label.
Banyak pemula di bidang analisis prediktif lupa untuk membagi kumpulan data - yang memperkenalkan kelemahan desain yang serius ke dalam proyek. Jika 150 contoh penuh dimasukkan ke dalam mesin sebagai data pelatihan, data tersebut tidak akan meninggalkan data yang tidak terlihat untuk menguji model. Kemudian Anda harus menggunakan kembali beberapa contoh latihan untuk menguji model prediktif.

Anda akan melihat bahwa dalam situasi seperti ini, model selalu memprediksi kelas yang benar - karena Anda menggunakan data persis yang sama dengan yang Anda gunakan untuk melatih model ini.Model sudah pernah melihat pola ini sebelumnya; Tidak akan ada masalah hanya mengulangi apa yang dilihatnya. Model prediksi kerja perlu membuat prediksi untuk data yang belum dilihatnya.

Bila Anda memiliki instance dari classifier SVM, dataset pelatihan, dan dataset tes, Anda siap melatih model ini dengan data pelatihan. Mengetik kode berikut ke dalam penerjemah akan melakukan hal itu: >>>> svmClassifier. fit (X_train, y_train)

Baris kode ini menciptakan model kerja untuk membuat prediksi dari. Secara khusus, model prediktif yang akan memprediksi kelas Iris dataset yang tidak diberi label baru miliknya. Contoh svmClassifier akan memiliki beberapa metode yang dapat Anda panggil untuk melakukan berbagai hal.

Misalnya, setelah memanggil metode kecocokan, metode yang paling berguna untuk dipanggil adalah metode prediksi. Itu metode yang akan Anda berikan pada data baru; Sebagai gantinya, ia memprediksi hasilnya.

Bagaimana Menjalankan Data Pelatihan dalam Model Pembelajaran yang Diawasi SVM - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...