Video: Scatter Plot, Korelasi dan Analisis Regresi Sederhana dengan R #BelajarR 2024
Untuk membuat prediksi analitis dengan data baru, Anda cukup menggunakan fungsi tersebut dengan daftar tujuh nilai atribut. Kode berikut melakukan pekerjaan itu: >> newPrediction <- predict (model,
list (cylinders = factor (4), displacement = 370,horsepower = 150, weight = 3904, percepatan = 12, modelYear = faktor (70), origin = factor (1)),
interval = "predict", level =.95)
Ini adalah kode dan keluaran dari nilai prediksi baru:
Setelah mengevaluasi model dengan dataset pengujian, dan Anda puas dengan keakuratannya, Anda dapat yakin bahwa Anda membangun model prediksi yang bagus. Anda harus menunggu hasil bisnis untuk mengukur keefektifan model prediksi Anda.
Mungkin ada pengoptimalan yang dapat Anda lakukan untuk membangun model prediktif yang lebih baik dan lebih efisien. Dengan bereksperimen, Anda mungkin menemukan kombinasi prediktor terbaik untuk menciptakan model yang lebih cepat dan akurat.
Salah satu cara untuk membangun subset fitur adalah menemukan korelasi antara variabel dan menghapus variabel yang sangat berkorelasi. Melepaskan variabel berlebihan yang tidak menambah apa-apa (atau menambahkan informasi yang sangat sedikit) agar sesuai, Anda dapat meningkatkan kecepatan model. Hal ini terutama terjadi saat Anda berhadapan dengan banyak pengamatan (deretan data) di mana kekuatan pemrosesan atau kecepatan mungkin menjadi masalah.
Untuk dataset yang besar, lebih banyak atribut dalam deretan data akan memperlambat pemrosesan. Jadi Anda harus berusaha menghilangkan sebanyak mungkin informasi yang berlebihan.