Rumah Keuangan Pribadi Bagaimana Membuat Model Pembelajaran yang Diawasi dengan Hutan Acak untuk Analisis Prediktif - dummies

Bagaimana Membuat Model Pembelajaran yang Diawasi dengan Hutan Acak untuk Analisis Prediktif - dummies

Daftar Isi:

Video: Penjelasan AI ( Artificial Intelligence ) - HD 2024

Video: Penjelasan AI ( Artificial Intelligence ) - HD 2024
Anonim

Model hutan acak adalah model ensemble yang dapat digunakan dalam analisis prediktif; dibutuhkan ansambel (seleksi) pohon keputusan untuk membuat modelnya. Idenya adalah untuk mengambil sampel acak dari peserta didik yang lemah (subset acak dari data pelatihan) dan minta mereka memilih untuk memilih model terkuat dan terbaik. Model hutan acak dapat digunakan untuk klasifikasi atau regresi. Dalam contoh berikut, model hutan acak digunakan untuk mengklasifikasikan spesies Iris.

Memuat data Anda

Daftar kode ini akan memuat dataset iris ke sesi Anda: >>>> dari sklearn. dataset import load_iris >>>> iris = load_iris ()

Membuat sebuah instance dari classifier

Dua baris kode berikut membuat sebuah instance dari classifier. Baris pertama mengimpor perpustakaan hutan acak. Baris kedua menciptakan sebuah instance dari algoritma hutan acak:

>>>> dari sklearn. ansambel import RandomForestClassifier >>>> rf = RandomForestClassifier (n_estimators = 15,

random_state = 111)

Parameter

n_estimators

pada konstruktor adalah parameter tuning yang umum digunakan untuk model hutan acak. Nilai tersebut digunakan untuk membangun jumlah pohon di hutan. Ini umumnya antara 10 dan 100 persen dataset, namun bergantung pada data yang Anda gunakan. Di sini, nilainya ditetapkan pada 15, yaitu 10 persen dari data. Nantinya, Anda akan melihat bahwa mengubah nilai parameter menjadi 150 (100 persen) menghasilkan hasil yang sama.

The n _estimators digunakan untuk menyempurnakan kinerja model dan overfitting. Semakin besar nilainya, semakin baik kinerjanya namun dengan biaya overfitting. Semakin kecil nilainya, semakin tinggi kemungkinan tidak overfitting namun dengan biaya kinerja yang lebih rendah. Juga, ada satu titik di mana peningkatan jumlah pada umumnya akan menurunkan akurasi dan mungkin secara dramatis meningkatkan daya komputasi yang dibutuhkan. Parameter default ke 10 jika dihilangkan dalam konstruktor.

Menjalankan data pelatihan

Anda harus membagi kumpulan data ke dalam rangkaian tes dan pelatihan sebelum membuat instance dari penggolong hutan acak. Kode berikut akan menyelesaikan tugas itu: >>>> dari sklearn import cross_validation >>>> X_train, X_test, y_train, y_test = cross_validation. train_test_split (iris data, target iris, test_size = 0, 10, random_state = 111) >>>> rf = rf. fit (X_train, y_train)

Line 1 mengimpor perpustakaan yang memungkinkan Anda membagi dataset menjadi dua bagian.

Baris 2 memanggil fungsi dari perpustakaan yang membagi dataset menjadi dua bagian dan menetapkan kumpulan data yang sekarang terbagi menjadi dua pasang variabel.

Baris 3 mengambil contoh penggolong hutan acak yang baru Anda buat, lalu memanggil metode yang sesuai untuk melatih model dengan dataset pelatihan.

Menjalankan data uji

Pada kode berikut, baris pertama memberi umpan pada dataset tes ke model, maka baris ketiga menampilkan outputnya: >>>> predict = rf. prediksikan (X_test) >>>> prediksi

array ([0, 0, 2, 2, 2, 0, 0, 2, 2, 2]) > Mengevaluasi model

Anda dapat melakukan referensi silang output dari prediksi terhadap array

  • y_test
  • . Akibatnya, Anda dapat melihat bahwa prediksi dua titik data uji salah. Jadi keakuratan model hutan acak adalah 86. 67 persen.
  • Inilah kodenya: >>>> dari metrik impor sklearn >>>> prediksi

array ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 1, 2, 2]) >>>> y_test

array ([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 2, 2, 2]) >>>> metrik. accuracy_score (y_test, diprediksi)

0. 8666666666666767 # 1. 0 adalah akurasi 100 persen >>>> prediksi == y_test

array (Benar, Benar, Benar, Benar, Salah, Benar, Benar

Benar, Benar, Benar, Benar, Benar, Salah, Benar,

Benar], dtype = bool)

Bagaimana model hutan acak tampil jika Anda mengubah parameter n_estimators menjadi 150? Sepertinya tidak akan membuat perbedaan untuk dataset kecil ini. Ini menghasilkan hasil yang sama: >>>> rf = RandomForestClassifier (n_estimators = 150, random_state = 111) >>>> rf = rf. fit (X_train, y_train) >>>> predict = rf. prediksikan (X_test) >>>> prediksi

array ([0, 0, 2, 2, 2, 0, 0, 2, 2, 2]) >

Bagaimana Membuat Model Pembelajaran yang Diawasi dengan Hutan Acak untuk Analisis Prediktif - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...