Daftar Isi:
- Memvisualisasikan pengelompokan tersembunyi di data Anda
- Visualisasi hasil klasifikasi data
- Visualisasi outlier dalam data Anda
- Visualisasi Pohon Keputusan
- Asumsikan Anda telah menjalankan serangkaian model analisis prediktif, termasuk pohon keputusan, hutan acak, dan algoritma kawanan. Anda dapat menggabungkan semua hasil itu dan menyajikan narasi yang konsisten yang mereka semua dukung. Disini kepercayaan diri adalah persentase numerik yang bisa dihitung dengan menggunakan fungsi matematis. Hasil perhitungan merangkum skor seberapa besar kemungkinan kemungkinan terjadinya.
Video: TensorFlow Dev Summit 2019 Keynote 2024
Seringkali, Anda harus dapat menunjukkan hasil analisis prediktif Anda kepada mereka yang peduli. Berikut adalah beberapa cara untuk menggunakan teknik visualisasi untuk melaporkan hasil model Anda kepada pemangku kepentingan.
Memvisualisasikan pengelompokan tersembunyi di data Anda
Pengelompokkan data adalah proses menemukan kelompok tersembunyi item terkait dalam data Anda. Dalam kebanyakan kasus, kumpulan clustering (pengelompokan) terdiri dari objek data dari jenis yang sama seperti pengguna jaringan sosial, dokumen teks, atau email. Salah satu cara untuk memvisualisasikan hasil model pengelompokkan data ditunjukkan di bawah, di mana grafik tersebut mewakili komunitas sosial (kumpulan) yang ditemukan dalam data yang dikumpulkan dari pengguna jaringan sosial.
Data tentang pelanggan dikumpulkan dalam format tabel; maka algoritma clustering diterapkan pada data, dan tiga kelompok (kelompok) ditemukan: pelanggan setia, pelanggan yang mengembara, dan pelanggan diskon. Asumsikan bahwa sumbu X dan Y mewakili dua komponen utama yang dihasilkan dari data asli. Analisis komponen utama (PCA) adalah teknik reduksi data.
Clustering pelanggan dalam tiga kelompok: loyal, mengembara, dan diskon.Di sini, hubungan visual di antara ketiga kelompok tersebut telah menunjukkan di mana upaya pemasaran yang ditingkatkan dan ditargetkan dapat dilakukan dengan sebaik-baiknya.
Visualisasi hasil klasifikasi data
Model klasifikasi menugaskan kelas tertentu ke setiap titik data baru yang diteliti. Kelas tertentu, dalam kasus ini, bisa jadi kelompok yang dihasilkan dari pekerjaan pengelompokan Anda. Output yang disorot dalam grafik dapat menentukan target set Anda. Untuk setiap pelanggan baru, model klasifikasi prediktif mencoba memprediksi kelompok mana yang akan menjadi pelanggan baru.
Setelah menerapkan algoritma pengelompokan dan menemukan pengelompokan dalam data pelanggan, Anda akan sampai pada saat yang tepat: Inilah pelanggan baru - Anda ingin model memprediksi jenis pelanggan apa dia atau dia akan.
Gambar menunjukkan bagaimana informasi pelanggan baru diumpankan ke model analisis prediktif Anda, yang pada gilirannya memprediksi kelompok pelanggan mana pelanggan baru ini. Pelanggan Baru A, B, dan C akan ditugaskan ke cluster sesuai dengan model klasifikasi. Menerapkan model klasifikasi menghasilkan prediksi bahwa Pelanggan A akan termasuk dalam pelanggan setia, Pelanggan B akan menjadi pengembara, dan Pelanggan C hanya muncul untuk diskon.
Menugaskan Pelanggan A, B, dan C, untuk klasifikasi mereka (cluster).Visualisasi outlier dalam data Anda
Dalam proses pengelompokan atau klasifikasi pelanggan baru, sesekali Anda bertemu dengan outlier (kasus khusus yang tidak sesuai dengan divisi yang ada).
Di bawah ini, Anda melihat beberapa outlier yang tidak sesuai dengan kelompok yang telah ditentukan. Enam pelanggan outlier telah terdeteksi dan divisualisasikan. Mereka berperilaku cukup berbeda sehingga model tidak dapat mengetahui apakah mereka termasuk dalam kategori pelanggan tertentu.
Enam pelanggan outlier menentang kategorisasi hanya dengan menunjukkannya.Visualisasi Pohon Keputusan
Banyak model menggunakan pohon keputusan sebagai keluarannya: Diagram ini menunjukkan hasil yang mungkin dari tindakan alternatif, yang disusun seperti cabang pohon.
Gambar di bawah ini menunjukkan contoh pohon yang digunakan sebagai penggolong: Ini mengklasifikasikan penggemar baseball berdasarkan beberapa kriteria, terutama jumlah yang dikeluarkan untuk tiket dan tanggal pembelian. Dari visualisasi ini, Anda bisa memprediksi jenis kipas yang akan menjadi pembeli tiket baru: casual, loyal, bandwagon, diehard, atau tipe lainnya. Atribut masing-masing kipas disebutkan di setiap tingkat di pohon (jumlah total permainan yang dihadiri, jumlah total yang dikeluarkan, musim); Anda bisa mengikuti jalur dari "akar" tertentu ke "daun" tertentu di pohon, di mana Anda menekan salah satu kelas kipas (c1, c2, c3, c4, c5).
Menemukan kelas di mana penggemar bisbol tertentu berada.
Misalkan Anda ingin menentukan jenis penggemar bisbol, maka pelanggan bisa menentukan jenis iklan pemasaran yang akan dikirim ke pelanggan. Misalkan Anda berhipotesis bahwa penggemar baseball fanatik dan penggemar bandwagon dapat dibujuk untuk membeli mobil baru saat tim mereka berjalan dengan baik dan menuju babak playoff.Anda mungkin ingin mengirim iklan dan diskon pemasaran untuk meyakinkan mereka agar melakukan pembelian. Lebih jauh lagi, anggaplah Anda berhipotesis bahwa penggemar bandwagon dapat dibujuk untuk memilih untuk mendukung isu-isu politik tertentu. Anda dapat mengirimkan iklan pemasaran kepada mereka untuk mendapatkan dukungan tersebut. Jika Anda tahu jenis basis penggemar yang Anda miliki, dengan menggunakan pohon keputusan dapat membantu Anda memutuskan bagaimana cara menghindarinya seperti rentang jenis pelanggan.
Memvisualisasikan prediksi
Asumsikan Anda telah menjalankan serangkaian model analisis prediktif, termasuk pohon keputusan, hutan acak, dan algoritma kawanan. Anda dapat menggabungkan semua hasil itu dan menyajikan narasi yang konsisten yang mereka semua dukung. Disini kepercayaan diri adalah persentase numerik yang bisa dihitung dengan menggunakan fungsi matematis. Hasil perhitungan merangkum skor seberapa besar kemungkinan kemungkinan terjadinya.
Pada sumbu x, bukti pendukung mewakili sumber konten yang dianalisis dengan model analisis isi yang mengidentifikasi hasil yang mungkin. Dalam kebanyakan kasus, model prediktif Anda akan memproses dataset yang besar, menggunakan data dari berbagai sumber, untuk mendapatkan hasil yang mungkin terjadi. Dengan demikian, Anda hanya perlu menunjukkan bukti pendukung terpenting dalam visualisasi Anda.
Hanya menampilkan bukti pendukung terpenting dalam visualisasi.
Di atas, ringkasan hasil yang diperoleh dari penerapan analisis prediktif disajikan sebagai visualisasi yang menggambarkan kemungkinan hasil, disertai dengan skor keyakinan dan bukti pendukung untuk masing-masing. Tiga skenario yang mungkin ditunjukkan:Inventarisasi Item A tidak akan sesuai dengan permintaan jika Anda tidak mengirimkan setidaknya 100 unit mingguan ke Store S. (Nilai Keyakinan: 98 persen.)
- Jumlah penjualan akan meningkat 40 persen jika Anda meningkatkan produksi Item A setidaknya 56 persen. (Skor Keyakinan: 83 persen.)
- Kampanye pemasaran di California akan meningkatkan penjualan Item A dan D tapi bukan Item K. (Nilai Keyakinan: 72 persen.)
- Skor kepercayaan mewakili kemungkinan setiap skenario akan terjadi, sesuai dengan model analisis prediktif Anda. Perhatikan bahwa mereka tercantum di sini dalam urutan kemungkinan yang menurun.
Berikut bukti pendukung yang paling penting terdiri dari bagaimana kutipan dari beberapa sumber konten dipresentasikan di atas sumbu x. Anda bisa merujuk pada mereka jika Anda perlu menjelaskan bagaimana Anda sampai pada skenario tertentu - dan mencari bukti yang mendukungnya.
Kekuatan di balik visualisasi ini adalah kesederhanaannya. Bayangkan, setelah berbulan-bulan menerapkan analisis prediktif pada data Anda, mengerjakan beberapa iterasi, Anda bisa bertemu dengan pengambil keputusan. Anda dipersenjatai dengan satu visualisasi slide dari tiga kemungkinan skenario yang mungkin memiliki dampak besar pada bisnis ini. Visualisasi semacam itu menciptakan diskusi yang efektif dan dapat mengarahkan manajemen ke momen "aha".