Video: Hello World - Machine Learning Recipes #1 2024
Untuk analisis prediktif, Anda perlu memuatkan data untuk algoritma Anda gunakan. Memuat dataset Iris di scikit semudah mengeluarkan beberapa baris kode karena scikit telah membuat fungsi untuk memuat dataset.
Panjang Sepal | Lebar Sepal | Panjang Petal | Lintang Petal | Kelas / Label Sasaran |
---|---|---|---|---|
5. 1 | 3. 5 | 1. 4 | 0. 2 | Setosa (0) |
7. 0 | 3. 2 | 4. 7 | 1. 4 | Ayatol (1) |
6. 3 | 3. 3 | 6. 0 | 2. 5 | Virginica (2) |
-
Buka sesi shell interaktif Python yang baru.
Gunakan sesi Python yang baru sehingga tidak ada sisa memori dan Anda memiliki dokumen yang bersih untuk dikerjakan.
-
Masukkan kode berikut di prompt dan amati hasilnya: >>>> dari sklearn. dataset import load_iris >>> iris = load_iris ()
Setelah menjalankan dua pernyataan tersebut, Anda seharusnya tidak melihat pesan dari penerjemah. Variabel iris harus berisi semua data dari iris. file csv
Keluarannya akan menjadi semua konten dari iris. csv file, bersama dengan beberapa informasi lain tentang dataset bahwa fungsi load_iris dimuat ke variabel. Variabelnya adalah struktur data kamus dengan empat sifat utama. Sifat penting iris tercantum di bawah ini.
Nama Properti
Deskripsidata | Berisi semua pengukuran pengamatan. |
---|---|
feature_name | Berisi nama fitur (nama atribut). |
target | Berisi semua target (label) dari pengamatan. |
target_names | Berisi nama kelas. |
Anda dapat mencetak nilai dalam interpreter dengan mengetikkan nama variabel diikuti titik yang diikuti oleh nama properti. Contohnya menggunakan iris. data untuk mengakses milik iris, seperti ini: >>>> iris. data | Ini adalah cara standar untuk mengakses properti dari suatu objek dalam banyak bahasa pemrograman. |
Untuk membuat instance dari classifier SVM, ketik kode berikut di interpreter: >>>> from sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
Baris pertama kode mengimpor perpustakaan SVC Linear ke dalam sesi. Dukungan linier Vector Classifier (SVC) adalah implementasi SVM untuk klasifikasi linier dan memiliki dukungan multi kelas.Dataset agak terpisah linier dan memiliki tiga kelas, jadi akan lebih baik bereksperimen dengan Linear SVC untuk melihat kinerjanya.
Baris kedua menciptakan instance menggunakan variabel svmClassifier. Ini adalah variabel penting untuk diingat. Parameter random_state memungkinkan Anda untuk mereproduksi contoh-contoh ini dan mendapatkan hasil yang sama. Jika Anda tidak memasukkan parameter random_state, hasilnya mungkin berbeda dari yang ditunjukkan di sini.