Rumah Keuangan Pribadi Bagaimana Membuat Model Pembelajaran yang Diawasi dengan Regresi Logistik - dummies

Bagaimana Membuat Model Pembelajaran yang Diawasi dengan Regresi Logistik - dummies

Daftar Isi:

Video: A Beginner's Guide to Machine Learning with ml5.js 2024

Video: A Beginner's Guide to Machine Learning with ml5.js 2024
Anonim

Setelah Anda membuat model prediktif klasifikasi pertama untuk analisis data, buat lebih banyak model seperti ini adalah tugas yang sangat mudah dilakukan di scikit. Satu-satunya perbedaan nyata dari satu model ke model berikutnya adalah Anda mungkin harus menyetel parameter dari algoritma ke algoritma.

Cara memuat data Anda

Daftar kode ini akan memuat dataset iris ke dalam sesi Anda: >>>> dari sklearn. dataset import load_iris >>> iris = load_iris ()

Cara membuat instance dari classifier

Dua baris kode berikut membuat sebuah instance dari classifier. Baris pertama mengimpor perpustakaan regresi logistik. Baris kedua menciptakan sebuah instance dari algoritma regresi logistik. >>>> dari sklearn import linear_model >>> logClassifier = linear_model. LogisticRegression (C = 1, random_state = 111)

Perhatikan parameter (parameter regularisasi) pada konstruktor. Parameter regularisasi


digunakan untuk mencegah overfitting. Parameter tidak benar-benar diperlukan (konstruktor akan bekerja dengan baik tanpa itu karena akan default ke C = 1). Membuat classifier regresi logistik menggunakan C = 150 menciptakan plot permukaan keputusan yang lebih baik. Anda bisa melihat kedua plot di bawah ini.

Bagaimana cara menjalankan data pelatihan

Anda harus membagi kumpulan data ke dalam rangkaian pelatihan dan pengujian sebelum membuat instance dari classifier regresi logistik. Kode berikut akan menyelesaikan tugas itu: >>>> dari sklearn import cross_validation >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris data, target iris, test_size = 0, 10, random_state = 111) >>> logClassifier. fit (X_train, y_train)

Line 1 mengimpor perpustakaan yang memungkinkan Anda membagi dataset menjadi dua bagian.

Baris 2 memanggil fungsi dari perpustakaan yang membagi dataset menjadi dua bagian dan menetapkan dataset yang sekarang terbagi menjadi dua pasang variabel.

Baris 3 mengambil instance dari klasifikasi regresi logistik yang baru saja Anda buat dan memanggil metode yang sesuai untuk melatih model dengan dataset pelatihan.

Bagaimana memvisualisasikan classifier

Melihat area permukaan keputusan di plot, sepertinya ada beberapa tuning yang harus dilakukan. Jika Anda melihat ke dekat bagian tengah petak, Anda bisa melihat bahwa banyak titik data milik area tengah (Versicolor) tergeletak di area ke sisi kanan (Virginica).

Gambar ini menunjukkan permukaan keputusan dengan nilai C 150. Secara visual terlihat lebih baik, jadi memilih untuk menggunakan pengaturan ini untuk model regresi logistik Anda tampaknya tepat.

Bagaimana cara menjalankan data uji

Pada kode berikut, baris pertama memberi umpan pada dataset tes ke model dan baris ketiga menampilkan hasilnya: >>>> predict = logClassifier. prediksi (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 2])

Bagaimana cara mengevaluasi model < Anda bisa melakukan cross-reference output dari prediksi terhadap array y_test. Akibatnya, Anda bisa melihat bahwa semua titik uji data dipuji dengan benar. Inilah kodenya: >>>> dari metrik impor sklearn >>> predictedarray ([0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 2]) >>> metrik. accuracy_score (y_test, diprediksi) 1. 0 # 1. 0 adalah akurasi 100 persen >>> prediksi == y_testarray (True, True, True, True, True, True, True, True, True, True, True], dtype = bool)

Jadi bagaimana model regresi logistik dengan parameter C = 150 dibandingkan dengan itu? Nah, Anda tidak bisa mengalahkan 100 persen. Berikut adalah kode untuk membuat dan mengevaluasi classifier logistik dengan C = 150: >>>> logClassifier_2 = linear_model. LogisticRegression (C = 150, random_state = 111) >>> logClassifier_2. fit (X_train, y_train) >>> diprediksi = logClassifier_2. prediksikan (X_test) >>> metrik. accuracy_score (y_test, diprediksi) 0. 93333333333333335 >>> metrik. confusion_matrix (y_test, predict) array ([[5, 0, 0], [0, 2, 0], [0, 1, 7]])

Kita harapkan lebih baik, tapi sebenarnya lebih buruk. Ada satu kesalahan dalam prediksi. Hasilnya sama dengan model Support Vector Machine (SVM).

Berikut adalah daftar lengkap kode untuk membuat dan mengevaluasi model klasifikasi regresi logistik dengan parameter default: >>>> dari sklearn. dataset import load_iris >>> dari sklearn import linear_model >>> dari sklearn import cross_validation >>> dari metrik impor sklearn >>> iris = load_iris () >>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris data, target iris, test_size = 0, 10, random_state = 111) >>> logClassifier = linear_model. LogisticRegression (, random_state = 111) >>> logClassifier. fit (X_train, y_train) >>> predict = logClassifier. prediksikan (X_test) >>> predictedarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 2]) >>> y_testarray ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>> metrik. accuracy_score (y_test, diprediksi) 1. 0 # 1. 0 adalah akurasi 100 persen >>> prediksi == y_testarray (True, True, True, True, True, True, True, True, True, True, True], dtype = bool)
Bagaimana Membuat Model Pembelajaran yang Diawasi dengan Regresi Logistik - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...