Rumah Keuangan Pribadi Dasar-dasar Proses Klasifikasi Data Prediktif Analytics - dummies

Dasar-dasar Proses Klasifikasi Data Prediktif Analytics - dummies

Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2024

Video: Age of Deceit (2) - Hive Mind Reptile Eyes Hypnotism Cults World Stage - Multi - Language 2024
Anonim

Pada tingkat tonjolan kuningan, klasifikasi data analitik prediktif terdiri dari dua tahap: tahap pembelajaran dan tahap prediksi. Tahap pembelajaran memerlukan pelatihan model klasifikasi dengan menjalankan kumpulan data terakhir yang telah ditentukan melalui classifier. Tujuannya adalah untuk mengajarkan model Anda untuk mengekstrak dan menemukan hubungan dan aturan tersembunyi - aturan klasifikasi dari data historis (pelatihan). Model melakukannya dengan menggunakan algoritma klasifikasi.

Tahap prediksi yang mengikuti tahap pembelajaran terdiri dari model yang memprediksi label kelas baru atau nilai numerik yang mengklasifikasikan data yang belum pernah dilihat sebelumnya (yaitu data uji).

Untuk menggambarkan tahap-tahap ini, misalkan Anda adalah pemilik sebuah toko online yang menjual jam tangan. Anda sudah memiliki toko online cukup lama, dan telah mengumpulkan banyak data transaksional dan data pribadi tentang pelanggan yang membeli jam tangan dari toko Anda. Misalkan Anda telah menangkap data tersebut melalui situs Anda dengan menyediakan formulir web, selain data transaksional yang Anda kumpulkan melalui operasi.

Anda juga dapat membeli data dari pihak ketiga yang memberi Anda informasi tentang pelanggan Anda di luar minat mereka terhadap jam tangan. Itu tidak sesulit kedengarannya; Ada perusahaan yang model bisnisnya melacak pelanggan secara online dan mengumpulkan serta menjual informasi berharga tentang mereka.

Sebagian besar perusahaan pihak ketiga tersebut mengumpulkan data dari situs media sosial dan menerapkan metode penambangan data untuk menemukan hubungan pengguna individual dengan produk. Dalam hal ini, sebagai pemilik toko jam tangan, Anda akan tertarik pada hubungan antara pelanggan dan minat mereka untuk membeli jam tangan.

Anda dapat menyimpulkan jenis informasi ini untuk menganalisis, misalnya, profil jaringan sosial dari pelanggan, atau komentar microblog dari jenis yang Anda temukan di Twitter.

Untuk mengukur tingkat minat seseorang terhadap jam tangan, Anda dapat menggunakan beberapa alat analisis teks yang dapat menemukan korelasi semacam itu dalam teks tertulis seseorang (status jaringan sosial, tweet, posting blog, dan semacamnya) atau aktivitas online seperti interaksi sosial online, upload foto, dan penelusuran).

Setelah mengumpulkan semua data tentang transaksi masa lalu dan minat pelanggan Anda - data pelatihan yang menunjukkan model Anda apa yang harus dicari - Anda harus mengaturnya ke dalam struktur yang membuatnya mudah diakses dan digunakan (seperti database).

Pada titik ini, Anda telah mencapai tahap kedua dari klasifikasi data: tahap prediksi, yang semuanya tentang menguji model Anda dan keakuratan aturan klasifikasi yang dihasilkannya. Untuk itu, Anda memerlukan data pelanggan historis tambahan, disebut data uji (yang berbeda dengan data pelatihan).

Anda memberi umpan pada data uji ini ke model Anda dan mengukur keakuratan prediksi yang dihasilkan. Anda menghitung waktu bahwa model tersebut memprediksi dengan benar perilaku masa depan pelanggan yang ditunjukkan dalam data pengujian Anda. Anda juga menghitung waktu bahwa model tersebut membuat prediksi yang salah.

Pada titik ini, Anda hanya memiliki dua kemungkinan hasil: Anda merasa puas dengan keakuratan model atau tidak:

  • Jika Anda puas, maka Anda dapat mulai membuat model Anda siap untuk dibuat. prediksi sebagai bagian dari sistem produksi.

  • Jika Anda tidak puas dengan prediksi tersebut, Anda harus melatih model Anda dengan dataset pelatihan baru.

Jika data pelatihan asli Anda tidak cukup representatif dari kumpulan pelanggan Anda - atau berisi data bising yang membuang hasil model dengan memperkenalkan sinyal palsu - maka ada lebih banyak pekerjaan yang harus dilakukan agar model Anda berjalan dan berjalan. Entah hasilnya berguna di jalannya.

Dasar-dasar Proses Klasifikasi Data Prediktif Analytics - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...