Video: Cara Mudah Uji Validitas Menggunakan SPSS - Full Tutorial 2024
Tugas lain dalam analisis prediktif adalah untuk mengklasifikasikan data baru dengan memprediksi kelas apa item target data milik, diberikan satu set variabel independen. Anda bisa, misalnya, mengklasifikasikan pelanggan menurut jenisnya - misalnya, sebagai pelanggan bernilai tinggi, pelanggan tetap, atau pelanggan yang siap beralih ke pesaing - dengan menggunakan pohon keputusan.
Untuk melihat beberapa informasi bermanfaat tentang model Klasifikasi R, ketik kode berikut:
Kolom Kelas memberitahu Anda bahwa Anda telah membuat pohon keputusan. Untuk melihat bagaimana perpecahan ditentukan, Anda bisa mengetikkan nama variabel di mana Anda menugaskan modelnya, dalam model kasus ini, seperti ini: >> model Inferensi bersyarat dengan 6 node terminal Respon: InputTipeTipe: luas, keliling, kekompakan, panjang, lebar, asimetri, panjang2 Jumlah observasi: 147 1) luas <= 16. 2; kriteria = 1, statistik = 123. 423 2) luas <= 13. 37; kriteria = 1, statistik = 63. 549 3) panjang2 4. 914 5) * bobot = 45 2) luas> 13. 37 6) panjang2 5. 396 8) * bobot = 8 1) luas> 16. 2 9) length2 5. 877 11) * bobot = 40
Lebih baik lagi, Anda dapat memvisualisasikan model dengan membuat sebidang pohon keputusan dengan kode ini:> plot (model)
Ini adalah representasi grafis dari pohon keputusan. Anda dapat melihat bahwa bentuk keseluruhan meniru pohon sungguhan. Ini terbuat dari
node(lingkaran dan empat persegi panjang) dan link atau tepi (garis penghubung). Simpul pertama (dimulai dari atas) disebut simpul akar [ dan simpul di bagian bawah pohon (empat persegi panjang) disebut simpul terminal
. Ada lima simpul keputusan dan enam simpul terminal.
Pada simpul 2, model bertanya: Apakah daerahnya 13. 37? Jawabannya adalah ya, jadi bergeraklah sepanjang jalan menuju simpul 6. Pada simpul ini model bertanya: Apakah panjangnya <= 5. 396? Ini adalah, dan Anda pindah ke node terminal 7 dan vonisnya adalah bahwa observasi # 2 adalah tipe benih 1. Dan, sebenarnya, tipe benih 1.
Model itu melakukan proses untuk semua pengamatan lain untuk memprediksi kelas.
-
Untuk mengetahui apakah Anda melatih model yang baik, periksa data pelatihannya. Anda dapat melihat hasilnya di tabel dengan kode berikut: >> tabel (prediktor (model), trainSet $ seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44
-
Hasilnya menunjukkan bahwa kesalahan (atau tingkat kesalahan klasifikasi) adalah 11 dari 147, atau 7. 48 persen.
Dengan hasil yang dihitung, langkah selanjutnya adalah membaca tabel.
-
Prediksi yang benar adalah yang menunjukkan kolom dan nomor baris sebagai sama. Hasil tersebut muncul sebagai garis diagonal dari kiri atas ke kanan bawah; misalnya, [1, 1], [2, 2], [3, 3] adalah jumlah prediksi yang benar untuk kelas tersebut.
Jadi untuk jenis benih 1, model tersebut benar memperkirakannya sebanyak 45 kali, sementara salah mengklasifikasikan benih 7 kali (4 kali sebagai jenis benih 2, dan 3 kali sebagai tipe 3). Untuk jenis benih 2, model tersebut memprediksi dengan benar 47 kali, sementara salah mengklasifikasikannya sebanyak 3 kali. Untuk jenis biji 3, model tersebut benar meramalkannya 44 kali, sementara salah mengklasifikasikannya hanya sekali.
Ini menunjukkan bahwa ini adalah model yang bagus. Jadi sekarang anda mengevaluasinya dengan data uji. Berikut adalah kode yang menggunakan data uji untuk memprediksi dan menyimpannya dalam variabel (testPrediction) untuk digunakan nanti: >> testPrediction <- predict (model, newdata = testSet)
-
Untuk mengevaluasi bagaimana model dilakukan dengan uji data, lihat di tabel dan hitung kesalahannya, yang kodenya terlihat seperti ini: >> table (testPrediction, testSet $ seedType) testPrediction 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17