Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2024
Pada tingkat tonjolan kuningan, klasifikasi data analitik prediktif terdiri dari dua tahap: tahap pembelajaran dan tahap prediksi. Tahap pembelajaran memerlukan pelatihan model klasifikasi dengan menjalankan kumpulan data terakhir yang telah ditentukan melalui classifier. Tujuannya adalah untuk mengajarkan model Anda untuk mengekstrak dan menemukan hubungan dan aturan tersembunyi - aturan klasifikasi dari data historis (pelatihan). Model melakukannya dengan menggunakan algoritma klasifikasi.
Tahap prediksi yang mengikuti tahap pembelajaran terdiri dari model yang memprediksi label kelas baru atau nilai numerik yang mengklasifikasikan data yang belum pernah dilihat sebelumnya (yaitu data uji).
Untuk menggambarkan tahap-tahap ini, misalkan Anda adalah pemilik sebuah toko online yang menjual jam tangan. Anda sudah memiliki toko online cukup lama, dan telah mengumpulkan banyak data transaksional dan data pribadi tentang pelanggan yang membeli jam tangan dari toko Anda. Misalkan Anda telah menangkap data tersebut melalui situs Anda dengan menyediakan formulir web, selain data transaksional yang Anda kumpulkan melalui operasi.
Anda juga dapat membeli data dari pihak ketiga yang memberi Anda informasi tentang pelanggan Anda di luar minat mereka terhadap jam tangan. Itu tidak sesulit kedengarannya; Ada perusahaan yang model bisnisnya melacak pelanggan secara online dan mengumpulkan serta menjual informasi berharga tentang mereka.
Sebagian besar perusahaan pihak ketiga tersebut mengumpulkan data dari situs media sosial dan menerapkan metode penambangan data untuk menemukan hubungan pengguna individual dengan produk. Dalam hal ini, sebagai pemilik toko jam tangan, Anda akan tertarik pada hubungan antara pelanggan dan minat mereka untuk membeli jam tangan.
Anda dapat menyimpulkan jenis informasi ini untuk menganalisis, misalnya, profil jaringan sosial dari pelanggan, atau komentar microblog dari jenis yang Anda temukan di Twitter.
Untuk mengukur tingkat minat seseorang terhadap jam tangan, Anda dapat menggunakan beberapa alat analisis teks yang dapat menemukan korelasi semacam itu dalam teks tertulis seseorang (status jaringan sosial, tweet, posting blog, dan semacamnya) atau aktivitas online seperti interaksi sosial online, upload foto, dan penelusuran).
Setelah mengumpulkan semua data tentang transaksi masa lalu dan minat pelanggan Anda - data pelatihan yang menunjukkan model Anda apa yang harus dicari - Anda harus mengaturnya ke dalam struktur yang membuatnya mudah diakses dan digunakan (seperti database).
Pada titik ini, Anda telah mencapai tahap kedua dari klasifikasi data: tahap prediksi, yang semuanya tentang menguji model Anda dan keakuratan aturan klasifikasi yang dihasilkannya. Untuk itu, Anda memerlukan data pelanggan historis tambahan, disebut data uji (yang berbeda dengan data pelatihan).
Anda memberi umpan pada data uji ini ke model Anda dan mengukur keakuratan prediksi yang dihasilkan. Anda menghitung waktu bahwa model tersebut memprediksi dengan benar perilaku masa depan pelanggan yang ditunjukkan dalam data pengujian Anda. Anda juga menghitung waktu bahwa model tersebut membuat prediksi yang salah.
Pada titik ini, Anda hanya memiliki dua kemungkinan hasil: Anda merasa puas dengan keakuratan model atau tidak:
-
Jika Anda puas, maka Anda dapat mulai membuat model Anda siap untuk dibuat. prediksi sebagai bagian dari sistem produksi.
-
Jika Anda tidak puas dengan prediksi tersebut, Anda harus melatih model Anda dengan dataset pelatihan baru.
Jika data pelatihan asli Anda tidak cukup representatif dari kumpulan pelanggan Anda - atau berisi data bising yang membuang hasil model dengan memperkenalkan sinyal palsu - maka ada lebih banyak pekerjaan yang harus dilakukan agar model Anda berjalan dan berjalan. Entah hasilnya berguna di jalannya.