Rumah Keuangan Pribadi Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Daftar Isi:

Video: TensorFlow Dev Summit 2019 Keynote 2025

Video: TensorFlow Dev Summit 2019 Keynote 2025
Anonim

Gambar bernilai seribu kata - terutama saat Anda mencoba menangani data analisis prediktif Anda dengan baik. Pada tahap pra-pemrosesan, saat Anda mempersiapkan data Anda, ini adalah praktik umum untuk memvisualisasikan apa yang ada sebelum melanjutkan ke langkah berikutnya.

Anda mulai dengan menggunakan spreadsheet seperti Microsoft Excel untuk membuat matriks data - yang terdiri dari data kandidat fitur (juga disebut atribut ). Beberapa paket perangkat lunak intelijen bisnis (seperti Tableau) dapat memberi Anda gambaran awal tentang data yang akan Anda gunakan untuk analisis.

Cara menggunakan visualisasi tabular untuk analisis prediktif

Tabel adalah representasi bergambar yang paling sederhana dan paling dasar. Tabel (juga dikenal sebagai spreadsheets ) terdiri dari baris dan kolom - yang sesuai, masing-masing, dengan objek dan atributnya yang disebutkan sebelumnya sebagai pembuatan data Anda. Misalnya, perhatikan data jaringan sosial online. Objek data bisa mewakili pengguna. Atribut pengguna (objek data) dapat berupa judul kolom: Gender, Kode Pos, atau Tanggal Lahir.

Sel dalam tabel mewakili nilai. Visualisasi dalam tabel dapat membantu Anda dengan mudah menemukan nilai atribut objek data yang hilang.

Tabel juga dapat memberikan fleksibilitas untuk menambahkan atribut baru yang merupakan kombinasi atribut lainnya. Misalnya, dalam data jaringan sosial, Anda dapat menambahkan kolom lain yang disebut Usia, yang dapat dengan mudah dihitung - sebagai atribut turunan - dari atribut Tanggal Lahir yang ada. Data jaringan sosial tabular menunjukkan kolom baru, Age, dibuat dari kolom lain yang ada (Date of Birth).

Diagram batang digunakan dalam analisis prediktif

Diagram batang dapat digunakan untuk melihat lonjakan atau anomali pada data Anda. Anda dapat menggunakannya untuk masing-masing atribut untuk memotret dengan cepat nilai minimum dan maksimum. Diagram batang juga bisa digunakan untuk memulai diskusi tentang bagaimana menormalkan data Anda.

Normalisasi adalah penyesuaian beberapa atau semua nilai atribut pada skala yang membuat data lebih bermanfaat. Misalnya, Anda dapat dengan mudah melihat ada kesalahan dalam data: Bilah Umur pada satu rekaman adalah negatif. Anomali itu lebih mudah digambarkan oleh diagram batang daripada tabel data.

Dasar-dasar diagram lingkaran untuk analisis prediktif

Bagan pai digunakan terutama untuk menunjukkan persentase. Mereka dapat dengan mudah menggambarkan distribusi beberapa item, dan menyoroti yang paling dominan. Data mentah jaringan sosial diwakili menurut atribut Age.Perhatikan bahwa bagan tersebut menunjukkan tidak hanya distribusi laki-laki dan perempuan yang jelas, namun juga kemungkinan kesalahan: R sebagai nilai jenis kelamin yang mungkin tercipta saat data dikumpulkan.

Bagaimana menggunakan grafik untuk analisis prediktif

Teori grafik menyediakan satu set algoritma kuat yang dapat menganalisis data yang terstruktur dan direpresentasikan sebagai grafik. Dalam ilmu komputer, grafik adalah struktur data, sebuah cara untuk mengatur data yang mewakili hubungan antara pasangan objek data. Grafik terdiri dari dua bagian utama:

  • Verteks, juga dikenal sebagai simpul

  • Tepi, yang menghubungkan pasang simpul

Tepi dapat diarahkan (digambar seperti panah) dan dapat memiliki bobot. Anda dapat memutuskan untuk menempatkan tepi (panah) di antara dua node (lingkaran) - dalam hal ini, anggota jaringan sosial yang terhubung dengan anggota lain sebagai teman:

Arah panah menunjukkan siapa "teman" siapa yang pertama, atau siapa yang memulai interaksi sebagian besar waktu.

Dasar-dasar kata awan untuk analisis prediktif

Pertimbangkan daftar kata atau konsep yang disusun sebagai kata awan - representasi grafis dari semua kata dalam daftar, menunjukkan ukuran masing-masing kata sebagai proporsional ke metrik yang Anda tentukan. Misalnya, jika Anda memiliki spreadsheet kata-kata dan kejadian dan Anda ingin mengidentifikasi kata-kata yang paling penting, cobalah sebuah kata awan.

Kata awan bekerja karena kebanyakan data organisasi adalah teks; Contoh umum adalah penggunaan istilah trending Twitter. Setiap istilah dalam representasi ini memiliki bobot yang mempengaruhi ukurannya sebagai indikator kepentingan relatifnya.

Salah satu cara untuk menentukan berat badan bisa jadi dengan berapa kali sebuah kata muncul dalam pengumpulan data Anda. Semakin sering sebuah kata muncul, bobot yang "lebih berat" - dan semakin besar jumlahnya di awan.

Perilaku berkelompok secara alami adalah sistem pengorganisasian sendiri dimana objek (khususnya, makhluk hidup) cenderung berperilaku sesuai dengan (a) lingkungan tempat tinggal mereka dan (b) tanggapan mereka terhadap objek lain yang ada. Perilaku berkelompok masyarakat alami seperti lebah, lalat, burung, ikan, dan semut - atau, dalam hal ini, orang - juga dikenal sebagai kecerdasan

swarm . Burung mengikuti peraturan alam saat mereka berperilaku seperti kawanan domba.

Flock-mate adalah burung yang terletak dengan jarak tertentu satu sama lain; Burung-burung tersebut dianggap serupa. Setiap burung bergerak sesuai dengan tiga aturan utama yang mengatur perilaku berkelompok. Pemisahan:

  • Flock-mate tidak boleh bertabrakan satu sama lain. Alignment:

  • Flock-mate untuk bergerak dalam arah rata-rata yang sama dengan tetangga mereka. Kohesi:

  • Flock-mates bergerak sesuai dengan posisi rata-rata atau lokasi kawanannya. Memodelkan ketiga aturan tersebut dapat memungkinkan sistem analitik untuk mensimulasikan perilaku berkelompok. Dengan menggunakan perilaku alami burung berkelompok yang mengorganisir diri sendiri, Anda bisa mengubah spreadsheet langsung menjadi visualisasi.Kuncinya adalah mendefinisikan pengertian kesamaan sebagai bagian dari data Anda. Mulailah dengan beberapa pertanyaan:

Apa yang membuat dua objek data dalam data Anda serupa?

  • Atribut mana yang paling bisa mendorong kesamaan antara dua data rekam?

  • Misalnya, dalam data jaringan sosial, catatan data mewakili pengguna individual; atribut yang menggambarkannya dapat mencakup Usia, Kode Pos, Status Hubungan, Daftar Teman, Jumlah Teman, Kebiasaan, Acara

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Pilihan Editor

Bagaimana Mengelola Komentar di WordPress Anda. com Blog - dummies

Bagaimana Mengelola Komentar di WordPress Anda. com Blog - dummies

Buka halaman Komentar dengan mengklik link Komentar di menu navigasi Dashboard WordPress. Halaman Komentar menunjukkan semua komentar di blog Anda sejak hari pertama Anda memulai. Di sini Anda bisa melihat komentar, mengeditnya, menandai mereka sebagai spam, atau flat-out menghapusnya. Jika Anda menetapkan pilihan Komentar Anda jadi ...

Bagaimana Mengelola Pengguna dan Penulis di Blog WordPress Anda - dummies

Bagaimana Mengelola Pengguna dan Penulis di Blog WordPress Anda - dummies

Pengguna WordPress halaman memberitahu Anda tentang semua pengguna di blog Anda. Ini mencantumkan nama pengguna, nama, alamat e-mail, peran di blog Anda, dan jumlah posting yang dibuat ke blog Anda. Untuk mengelola peran pengguna, Anda perlu memahami jenis akses yang diberikan masing-masing peran: Pengikut: Peran default ini ditugaskan untuk ...

Cara Membuat Permalinks WordPress Bekerja dengan Server Anda - dummies

Cara Membuat Permalinks WordPress Bekerja dengan Server Anda - dummies

Setelah Anda mengatur format untuk permalinks untuk situs WordPress Anda dengan menggunakan opsi selain default, WordPress menulis peraturan, atau arahan tertentu ke. htaccess file di server web anda Itu. htaccess file pada gilirannya mengkomunikasikan ke server web Anda bagaimana seharusnya menyajikan permalinks, sesuai dengan permalink ...

Pilihan Editor

Bagaimana cara Log In ke Layanan Cloud - dummies

Bagaimana cara Log In ke Layanan Cloud - dummies

Karena Cloud Service sepenuhnya berbasis di awan, semua Anda benar-benar Kebutuhan untuk mengaksesnya adalah koneksi internet. (Nah, Anda juga memerlukan nama pengguna dan kata sandi.) Anda dapat masuk dari kantor Anda dan kemudian mengambil tempat Anda tinggalkan di hotel saat bepergian di Tokyo. Salesforce memiliki banyak tindakan pengamanan ...

Bagaimana Bergerak di sekitar MYOB - dummies

Bagaimana Bergerak di sekitar MYOB - dummies

Di MYOB, Anda dapat melangkah maju dan mundur melalui setiap jendela pembelajaran saya. untuk mencintai kunci Tab komputer Anda. Ini jauh lebih mudah dan lebih cepat daripada menggunakan mouse anda. Keystrokes Shortcut Result Shift + Tab Bergerak ke belakang ke kolom sebelumnya Enter atau Tab Bergerak ke depan ke kolom berikutnya Alt + F4 Berhenti dan mengemas Esc Membawa ...

Bagaimana Membuka Kasus untuk Pelanggan di Salesforce. Kasus com - dummies

Bagaimana Membuka Kasus untuk Pelanggan di Salesforce. Kasus com - dummies

Adalah dasar Salesforce. com Layanan Cloud. Mereka adalah titik pusat kontak Anda dan apa yang agen hidup dan hirup setiap hari. Kasus adalah catatan penyelidikan layanan atau dukungan untuk pelanggan yang merinci masalah dan semua informasi yang mengelilinginya, seperti yang ditunjukkan. Kasus ...

Pilihan Editor

Menghitung Persen Tujuan di Excel - dummies

Menghitung Persen Tujuan di Excel - dummies

Ketika seseorang meminta Anda untuk menghitung satu persen Tujuannya, dia hanya mengatakan untuk membandingkan kinerja aktual dengan tujuan yang dinyatakan. Matematika yang terlibat dalam perhitungan ini sederhana: Bagilah tujuannya dengan aktual. Ini memberi Anda nilai persentase yang menunjukkan berapa banyak pencapaian yang telah dicapai. Misalnya, jika ...

Menghitung Persentase Varian di Excel - dummies

Menghitung Persentase Varian di Excel - dummies

Varians adalah indikator perbedaan antara satu angka dengan angka lainnya. Untuk memahami hal ini, bayangkan bahwa Anda menjual 120 widget pada suatu hari, dan keesokan harinya, Anda menjual 150. Perbedaan dalam penjualan sebenarnya sangat mudah dilihat; Anda menjual 30 widget lagi. Mengurangkan 120 widget dari 150 widget memberi ...

Menghitung Persentase Varian dengan Nilai Negatif di Excel - dummies

Menghitung Persentase Varian dengan Nilai Negatif di Excel - dummies

Rumus untuk menghitung varian persen dalam Excel bekerja dengan indah dalam banyak kasus. Namun, bila nilai benchmark adalah nilai negatif, rumusnya akan turun. Misalnya, bayangkan Anda memulai bisnis dan berharap bisa kehilangan tahun pertama. Jadi, Anda memberi anggaran sebesar negatif $ 10.000. Sekarang bayangkan itu ...