Rumah Keuangan Pribadi Bagaimana Menjelaskan Hasil Klasifikasi R Model Prediktif Analytics - dummies

Bagaimana Menjelaskan Hasil Klasifikasi R Model Prediktif Analytics - dummies

Video: Cara Mudah Uji Validitas Menggunakan SPSS - Full Tutorial 2024

Video: Cara Mudah Uji Validitas Menggunakan SPSS - Full Tutorial 2024
Anonim

Tugas lain dalam analisis prediktif adalah untuk mengklasifikasikan data baru dengan memprediksi kelas apa item target data milik, diberikan satu set variabel independen. Anda bisa, misalnya, mengklasifikasikan pelanggan menurut jenisnya - misalnya, sebagai pelanggan bernilai tinggi, pelanggan tetap, atau pelanggan yang siap beralih ke pesaing - dengan menggunakan pohon keputusan.

Untuk melihat beberapa informasi bermanfaat tentang model Klasifikasi R, ketik kode berikut:

>> summary (model) Mode Kelas Panjang 1 BinaryTree S4
Kolom Kelas memberitahu Anda bahwa Anda telah membuat pohon keputusan. Untuk melihat bagaimana perpecahan ditentukan, Anda bisa mengetikkan nama variabel di mana Anda menugaskan modelnya, dalam model kasus ini, seperti ini: >> model Inferensi bersyarat dengan 6 node terminal Respon: InputTipeTipe: luas, keliling, kekompakan, panjang, lebar, asimetri, panjang2 Jumlah observasi: 147 1) luas <= 16. 2; kriteria = 1, statistik = 123. 423 2) luas <= 13. 37; kriteria = 1, statistik = 63. 549 3) panjang2 4. 914 5) * bobot = 45 2) luas> 13. 37 6) panjang2 5. 396 8) * bobot = 8 1) luas> 16. 2 9) length2 5. 877 11) * bobot = 40

Lebih baik lagi, Anda dapat memvisualisasikan model dengan membuat sebidang pohon keputusan dengan kode ini:> plot (model)


Ini adalah representasi grafis dari pohon keputusan. Anda dapat melihat bahwa bentuk keseluruhan meniru pohon sungguhan. Ini terbuat dari

node

(lingkaran dan empat persegi panjang) dan link atau tepi (garis penghubung). Simpul pertama (dimulai dari atas) disebut simpul akar [ dan simpul di bagian bawah pohon (empat persegi panjang) disebut simpul terminal

. Ada lima simpul keputusan dan enam simpul terminal.

Pada setiap node, model membuat keputusan berdasarkan kriteria di lingkaran dan link, dan memilih cara untuk pergi. Ketika model mencapai node terminal, sebuah keputusan atau keputusan akhir tercapai. Dalam kasus khusus ini, dua atribut, dan, digunakan untuk menentukan apakah jenis benih yang diberikan ada di kelas 1, 2 atau 3. Misalnya, ikuti pengamatan # 2 dari dataset. Ini memiliki 4. 956 dan 14. 14. Anda dapat menggunakan pohon yang baru saja Anda bangun untuk menentukan jenis benih mana yang menjadi tujuan pengamatan ini. Inilah urutan langkah-langkahnya:

Mulai di simpul akar, yaitu simpul 1 (nomor ditampilkan di kotak kecil di bagian atas lingkaran). Tentukan berdasarkan atribut: Apakah observasi # 2 kurang dari atau sama dengan (dilambangkan dengan <=) 16.2? jawabannya adalah ya, jadi bergeraklah sepanjang jalan menuju simpul 2.

Pada simpul 2, model bertanya: Apakah daerahnya 13. 37? Jawabannya adalah ya, jadi bergeraklah sepanjang jalan menuju simpul 6. Pada simpul ini model bertanya: Apakah panjangnya <= 5. 396? Ini adalah, dan Anda pindah ke node terminal 7 dan vonisnya adalah bahwa observasi # 2 adalah tipe benih 1. Dan, sebenarnya, tipe benih 1.

Model itu melakukan proses untuk semua pengamatan lain untuk memprediksi kelas.

  1. Untuk mengetahui apakah Anda melatih model yang baik, periksa data pelatihannya. Anda dapat melihat hasilnya di tabel dengan kode berikut: >> tabel (prediktor (model), trainSet $ ​​seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44

  2. Hasilnya menunjukkan bahwa kesalahan (atau tingkat kesalahan klasifikasi) adalah 11 dari 147, atau 7. 48 persen.

    Dengan hasil yang dihitung, langkah selanjutnya adalah membaca tabel.

  3. Prediksi yang benar adalah yang menunjukkan kolom dan nomor baris sebagai sama. Hasil tersebut muncul sebagai garis diagonal dari kiri atas ke kanan bawah; misalnya, [1, 1], [2, 2], [3, 3] adalah jumlah prediksi yang benar untuk kelas tersebut.

    Jadi untuk jenis benih 1, model tersebut benar memperkirakannya sebanyak 45 kali, sementara salah mengklasifikasikan benih 7 kali (4 kali sebagai jenis benih 2, dan 3 kali sebagai tipe 3). Untuk jenis benih 2, model tersebut memprediksi dengan benar 47 kali, sementara salah mengklasifikasikannya sebanyak 3 kali. Untuk jenis biji 3, model tersebut benar meramalkannya 44 kali, sementara salah mengklasifikasikannya hanya sekali.
    

    Ini menunjukkan bahwa ini adalah model yang bagus. Jadi sekarang anda mengevaluasinya dengan data uji. Berikut adalah kode yang menggunakan data uji untuk memprediksi dan menyimpannya dalam variabel (testPrediction) untuk digunakan nanti: >> testPrediction <- predict (model, newdata = testSet)

  4. Untuk mengevaluasi bagaimana model dilakukan dengan uji data, lihat di tabel dan hitung kesalahannya, yang kodenya terlihat seperti ini: >> table (testPrediction, testSet $ ​​seedType) testPrediction 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17

Bagaimana Menjelaskan Hasil Klasifikasi R Model Prediktif Analytics - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...