Rumah Keuangan Pribadi Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Daftar Isi:

Video: TensorFlow Dev Summit 2019 Keynote 2024

Video: TensorFlow Dev Summit 2019 Keynote 2024
Anonim

Gambar bernilai seribu kata - terutama saat Anda mencoba menangani data analisis prediktif Anda dengan baik. Pada tahap pra-pemrosesan, saat Anda mempersiapkan data Anda, ini adalah praktik umum untuk memvisualisasikan apa yang ada sebelum melanjutkan ke langkah berikutnya.

Anda mulai dengan menggunakan spreadsheet seperti Microsoft Excel untuk membuat matriks data - yang terdiri dari data kandidat fitur (juga disebut atribut ). Beberapa paket perangkat lunak intelijen bisnis (seperti Tableau) dapat memberi Anda gambaran awal tentang data yang akan Anda gunakan untuk analisis.

Cara menggunakan visualisasi tabular untuk analisis prediktif

Tabel adalah representasi bergambar yang paling sederhana dan paling dasar. Tabel (juga dikenal sebagai spreadsheets ) terdiri dari baris dan kolom - yang sesuai, masing-masing, dengan objek dan atributnya yang disebutkan sebelumnya sebagai pembuatan data Anda. Misalnya, perhatikan data jaringan sosial online. Objek data bisa mewakili pengguna. Atribut pengguna (objek data) dapat berupa judul kolom: Gender, Kode Pos, atau Tanggal Lahir.

Sel dalam tabel mewakili nilai. Visualisasi dalam tabel dapat membantu Anda dengan mudah menemukan nilai atribut objek data yang hilang.

Tabel juga dapat memberikan fleksibilitas untuk menambahkan atribut baru yang merupakan kombinasi atribut lainnya. Misalnya, dalam data jaringan sosial, Anda dapat menambahkan kolom lain yang disebut Usia, yang dapat dengan mudah dihitung - sebagai atribut turunan - dari atribut Tanggal Lahir yang ada. Data jaringan sosial tabular menunjukkan kolom baru, Age, dibuat dari kolom lain yang ada (Date of Birth).

Diagram batang digunakan dalam analisis prediktif

Diagram batang dapat digunakan untuk melihat lonjakan atau anomali pada data Anda. Anda dapat menggunakannya untuk masing-masing atribut untuk memotret dengan cepat nilai minimum dan maksimum. Diagram batang juga bisa digunakan untuk memulai diskusi tentang bagaimana menormalkan data Anda.

Normalisasi adalah penyesuaian beberapa atau semua nilai atribut pada skala yang membuat data lebih bermanfaat. Misalnya, Anda dapat dengan mudah melihat ada kesalahan dalam data: Bilah Umur pada satu rekaman adalah negatif. Anomali itu lebih mudah digambarkan oleh diagram batang daripada tabel data.

Dasar-dasar diagram lingkaran untuk analisis prediktif

Bagan pai digunakan terutama untuk menunjukkan persentase. Mereka dapat dengan mudah menggambarkan distribusi beberapa item, dan menyoroti yang paling dominan. Data mentah jaringan sosial diwakili menurut atribut Age.Perhatikan bahwa bagan tersebut menunjukkan tidak hanya distribusi laki-laki dan perempuan yang jelas, namun juga kemungkinan kesalahan: R sebagai nilai jenis kelamin yang mungkin tercipta saat data dikumpulkan.

Bagaimana menggunakan grafik untuk analisis prediktif

Teori grafik menyediakan satu set algoritma kuat yang dapat menganalisis data yang terstruktur dan direpresentasikan sebagai grafik. Dalam ilmu komputer, grafik adalah struktur data, sebuah cara untuk mengatur data yang mewakili hubungan antara pasangan objek data. Grafik terdiri dari dua bagian utama:

  • Verteks, juga dikenal sebagai simpul

  • Tepi, yang menghubungkan pasang simpul

Tepi dapat diarahkan (digambar seperti panah) dan dapat memiliki bobot. Anda dapat memutuskan untuk menempatkan tepi (panah) di antara dua node (lingkaran) - dalam hal ini, anggota jaringan sosial yang terhubung dengan anggota lain sebagai teman:

Arah panah menunjukkan siapa "teman" siapa yang pertama, atau siapa yang memulai interaksi sebagian besar waktu.

Dasar-dasar kata awan untuk analisis prediktif

Pertimbangkan daftar kata atau konsep yang disusun sebagai kata awan - representasi grafis dari semua kata dalam daftar, menunjukkan ukuran masing-masing kata sebagai proporsional ke metrik yang Anda tentukan. Misalnya, jika Anda memiliki spreadsheet kata-kata dan kejadian dan Anda ingin mengidentifikasi kata-kata yang paling penting, cobalah sebuah kata awan.

Kata awan bekerja karena kebanyakan data organisasi adalah teks; Contoh umum adalah penggunaan istilah trending Twitter. Setiap istilah dalam representasi ini memiliki bobot yang mempengaruhi ukurannya sebagai indikator kepentingan relatifnya.

Salah satu cara untuk menentukan berat badan bisa jadi dengan berapa kali sebuah kata muncul dalam pengumpulan data Anda. Semakin sering sebuah kata muncul, bobot yang "lebih berat" - dan semakin besar jumlahnya di awan.

Perilaku berkelompok secara alami adalah sistem pengorganisasian sendiri dimana objek (khususnya, makhluk hidup) cenderung berperilaku sesuai dengan (a) lingkungan tempat tinggal mereka dan (b) tanggapan mereka terhadap objek lain yang ada. Perilaku berkelompok masyarakat alami seperti lebah, lalat, burung, ikan, dan semut - atau, dalam hal ini, orang - juga dikenal sebagai kecerdasan

swarm . Burung mengikuti peraturan alam saat mereka berperilaku seperti kawanan domba.

Flock-mate adalah burung yang terletak dengan jarak tertentu satu sama lain; Burung-burung tersebut dianggap serupa. Setiap burung bergerak sesuai dengan tiga aturan utama yang mengatur perilaku berkelompok. Pemisahan:

  • Flock-mate tidak boleh bertabrakan satu sama lain. Alignment:

  • Flock-mate untuk bergerak dalam arah rata-rata yang sama dengan tetangga mereka. Kohesi:

  • Flock-mates bergerak sesuai dengan posisi rata-rata atau lokasi kawanannya. Memodelkan ketiga aturan tersebut dapat memungkinkan sistem analitik untuk mensimulasikan perilaku berkelompok. Dengan menggunakan perilaku alami burung berkelompok yang mengorganisir diri sendiri, Anda bisa mengubah spreadsheet langsung menjadi visualisasi.Kuncinya adalah mendefinisikan pengertian kesamaan sebagai bagian dari data Anda. Mulailah dengan beberapa pertanyaan:

Apa yang membuat dua objek data dalam data Anda serupa?

  • Atribut mana yang paling bisa mendorong kesamaan antara dua data rekam?

  • Misalnya, dalam data jaringan sosial, catatan data mewakili pengguna individual; atribut yang menggambarkannya dapat mencakup Usia, Kode Pos, Status Hubungan, Daftar Teman, Jumlah Teman, Kebiasaan, Acara

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...