Video: Prediksi Kinerja Karyawan dengan Predictive Analytics 2024
Dataset yang kami analisa untuk membuat prediksi adalah kumpulan data Benih, yang dapat ditemukan di repositori mesin UCI. Dataset ini memiliki 210 pengamatan dan 7 atribut plus label. Label adalah hasil yang diharapkan dan digunakan untuk melatih dan mengevaluasi keakuratan model prediksi.
Hasil yang ingin Anda prediksi adalah jenis benih itu (atribut 8), diberi nilai dari tujuh atribut. Tiga nilai yang mungkin untuk jenis benih diberi label 1, 2, dan 3, dan mewakili varietas gandum Kama, Rosa, dan Kanada.
Atribut dalam urutan kolom disediakan:
-
luas
-
perimeter
-
kekompakan
-
panjang kernel
-
lebar kernel
-
koefisien asimetri > panjang alur kernel
-
kelas gandum
-
Untuk mendapatkan dataset dari repositori UCI dan memasukkannya ke dalam memori, ketik perintah berikut ke konsol:
Anda melihat itu dataset dimasukkan ke memori sebagai variabel frame data ,
dengan melihat panel ruang kerja Anda (kanan atas). Klik variabel benih untuk melihat nilai data di sumber pane (kiri atas) Ini adalah bagaimana data terlihat di panel sumber.