Rumah Keuangan Pribadi Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Daftar Isi:

Video: TensorFlow Dev Summit 2019 Keynote 2024

Video: TensorFlow Dev Summit 2019 Keynote 2024
Anonim

Gambar bernilai seribu kata - terutama saat Anda mencoba menangani data analisis prediktif Anda dengan baik. Pada tahap pra-pemrosesan, saat Anda mempersiapkan data Anda, ini adalah praktik umum untuk memvisualisasikan apa yang ada sebelum melanjutkan ke langkah berikutnya.

Anda mulai dengan menggunakan spreadsheet seperti Microsoft Excel untuk membuat matriks data - yang terdiri dari data kandidat fitur (juga disebut atribut ). Beberapa paket perangkat lunak intelijen bisnis (seperti Tableau) dapat memberi Anda gambaran awal tentang data yang akan Anda gunakan untuk analisis.

Cara menggunakan visualisasi tabular untuk analisis prediktif

Tabel adalah representasi bergambar yang paling sederhana dan paling dasar. Tabel (juga dikenal sebagai spreadsheets ) terdiri dari baris dan kolom - yang sesuai, masing-masing, dengan objek dan atributnya yang disebutkan sebelumnya sebagai pembuatan data Anda. Misalnya, perhatikan data jaringan sosial online. Objek data bisa mewakili pengguna. Atribut pengguna (objek data) dapat berupa judul kolom: Gender, Kode Pos, atau Tanggal Lahir.

Sel dalam tabel mewakili nilai. Visualisasi dalam tabel dapat membantu Anda dengan mudah menemukan nilai atribut objek data yang hilang.

Tabel juga dapat memberikan fleksibilitas untuk menambahkan atribut baru yang merupakan kombinasi atribut lainnya. Misalnya, dalam data jaringan sosial, Anda dapat menambahkan kolom lain yang disebut Usia, yang dapat dengan mudah dihitung - sebagai atribut turunan - dari atribut Tanggal Lahir yang ada. Data jaringan sosial tabular menunjukkan kolom baru, Age, dibuat dari kolom lain yang ada (Date of Birth).

Diagram batang digunakan dalam analisis prediktif

Diagram batang dapat digunakan untuk melihat lonjakan atau anomali pada data Anda. Anda dapat menggunakannya untuk masing-masing atribut untuk memotret dengan cepat nilai minimum dan maksimum. Diagram batang juga bisa digunakan untuk memulai diskusi tentang bagaimana menormalkan data Anda.

Normalisasi adalah penyesuaian beberapa atau semua nilai atribut pada skala yang membuat data lebih bermanfaat. Misalnya, Anda dapat dengan mudah melihat ada kesalahan dalam data: Bilah Umur pada satu rekaman adalah negatif. Anomali itu lebih mudah digambarkan oleh diagram batang daripada tabel data.

Dasar-dasar diagram lingkaran untuk analisis prediktif

Bagan pai digunakan terutama untuk menunjukkan persentase. Mereka dapat dengan mudah menggambarkan distribusi beberapa item, dan menyoroti yang paling dominan. Data mentah jaringan sosial diwakili menurut atribut Age.Perhatikan bahwa bagan tersebut menunjukkan tidak hanya distribusi laki-laki dan perempuan yang jelas, namun juga kemungkinan kesalahan: R sebagai nilai jenis kelamin yang mungkin tercipta saat data dikumpulkan.

Bagaimana menggunakan grafik untuk analisis prediktif

Teori grafik menyediakan satu set algoritma kuat yang dapat menganalisis data yang terstruktur dan direpresentasikan sebagai grafik. Dalam ilmu komputer, grafik adalah struktur data, sebuah cara untuk mengatur data yang mewakili hubungan antara pasangan objek data. Grafik terdiri dari dua bagian utama:

  • Verteks, juga dikenal sebagai simpul

  • Tepi, yang menghubungkan pasang simpul

Tepi dapat diarahkan (digambar seperti panah) dan dapat memiliki bobot. Anda dapat memutuskan untuk menempatkan tepi (panah) di antara dua node (lingkaran) - dalam hal ini, anggota jaringan sosial yang terhubung dengan anggota lain sebagai teman:

Arah panah menunjukkan siapa "teman" siapa yang pertama, atau siapa yang memulai interaksi sebagian besar waktu.

Dasar-dasar kata awan untuk analisis prediktif

Pertimbangkan daftar kata atau konsep yang disusun sebagai kata awan - representasi grafis dari semua kata dalam daftar, menunjukkan ukuran masing-masing kata sebagai proporsional ke metrik yang Anda tentukan. Misalnya, jika Anda memiliki spreadsheet kata-kata dan kejadian dan Anda ingin mengidentifikasi kata-kata yang paling penting, cobalah sebuah kata awan.

Kata awan bekerja karena kebanyakan data organisasi adalah teks; Contoh umum adalah penggunaan istilah trending Twitter. Setiap istilah dalam representasi ini memiliki bobot yang mempengaruhi ukurannya sebagai indikator kepentingan relatifnya.

Salah satu cara untuk menentukan berat badan bisa jadi dengan berapa kali sebuah kata muncul dalam pengumpulan data Anda. Semakin sering sebuah kata muncul, bobot yang "lebih berat" - dan semakin besar jumlahnya di awan.

Perilaku berkelompok secara alami adalah sistem pengorganisasian sendiri dimana objek (khususnya, makhluk hidup) cenderung berperilaku sesuai dengan (a) lingkungan tempat tinggal mereka dan (b) tanggapan mereka terhadap objek lain yang ada. Perilaku berkelompok masyarakat alami seperti lebah, lalat, burung, ikan, dan semut - atau, dalam hal ini, orang - juga dikenal sebagai kecerdasan

swarm . Burung mengikuti peraturan alam saat mereka berperilaku seperti kawanan domba.

Flock-mate adalah burung yang terletak dengan jarak tertentu satu sama lain; Burung-burung tersebut dianggap serupa. Setiap burung bergerak sesuai dengan tiga aturan utama yang mengatur perilaku berkelompok. Pemisahan:

  • Flock-mate tidak boleh bertabrakan satu sama lain. Alignment:

  • Flock-mate untuk bergerak dalam arah rata-rata yang sama dengan tetangga mereka. Kohesi:

  • Flock-mates bergerak sesuai dengan posisi rata-rata atau lokasi kawanannya. Memodelkan ketiga aturan tersebut dapat memungkinkan sistem analitik untuk mensimulasikan perilaku berkelompok. Dengan menggunakan perilaku alami burung berkelompok yang mengorganisir diri sendiri, Anda bisa mengubah spreadsheet langsung menjadi visualisasi.Kuncinya adalah mendefinisikan pengertian kesamaan sebagai bagian dari data Anda. Mulailah dengan beberapa pertanyaan:

Apa yang membuat dua objek data dalam data Anda serupa?

  • Atribut mana yang paling bisa mendorong kesamaan antara dua data rekam?

  • Misalnya, dalam data jaringan sosial, catatan data mewakili pengguna individual; atribut yang menggambarkannya dapat mencakup Usia, Kode Pos, Status Hubungan, Daftar Teman, Jumlah Teman, Kebiasaan, Acara

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...