Rumah Keuangan Pribadi Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Daftar Isi:

Video: TensorFlow Dev Summit 2019 Keynote 2025

Video: TensorFlow Dev Summit 2019 Keynote 2025
Anonim

Gambar bernilai seribu kata - terutama saat Anda mencoba menangani data analisis prediktif Anda dengan baik. Pada tahap pra-pemrosesan, saat Anda mempersiapkan data Anda, ini adalah praktik umum untuk memvisualisasikan apa yang ada sebelum melanjutkan ke langkah berikutnya.

Anda mulai dengan menggunakan spreadsheet seperti Microsoft Excel untuk membuat matriks data - yang terdiri dari data kandidat fitur (juga disebut atribut ). Beberapa paket perangkat lunak intelijen bisnis (seperti Tableau) dapat memberi Anda gambaran awal tentang data yang akan Anda gunakan untuk analisis.

Cara menggunakan visualisasi tabular untuk analisis prediktif

Tabel adalah representasi bergambar yang paling sederhana dan paling dasar. Tabel (juga dikenal sebagai spreadsheets ) terdiri dari baris dan kolom - yang sesuai, masing-masing, dengan objek dan atributnya yang disebutkan sebelumnya sebagai pembuatan data Anda. Misalnya, perhatikan data jaringan sosial online. Objek data bisa mewakili pengguna. Atribut pengguna (objek data) dapat berupa judul kolom: Gender, Kode Pos, atau Tanggal Lahir.

Sel dalam tabel mewakili nilai. Visualisasi dalam tabel dapat membantu Anda dengan mudah menemukan nilai atribut objek data yang hilang.

Tabel juga dapat memberikan fleksibilitas untuk menambahkan atribut baru yang merupakan kombinasi atribut lainnya. Misalnya, dalam data jaringan sosial, Anda dapat menambahkan kolom lain yang disebut Usia, yang dapat dengan mudah dihitung - sebagai atribut turunan - dari atribut Tanggal Lahir yang ada. Data jaringan sosial tabular menunjukkan kolom baru, Age, dibuat dari kolom lain yang ada (Date of Birth).

Diagram batang digunakan dalam analisis prediktif

Diagram batang dapat digunakan untuk melihat lonjakan atau anomali pada data Anda. Anda dapat menggunakannya untuk masing-masing atribut untuk memotret dengan cepat nilai minimum dan maksimum. Diagram batang juga bisa digunakan untuk memulai diskusi tentang bagaimana menormalkan data Anda.

Normalisasi adalah penyesuaian beberapa atau semua nilai atribut pada skala yang membuat data lebih bermanfaat. Misalnya, Anda dapat dengan mudah melihat ada kesalahan dalam data: Bilah Umur pada satu rekaman adalah negatif. Anomali itu lebih mudah digambarkan oleh diagram batang daripada tabel data.

Dasar-dasar diagram lingkaran untuk analisis prediktif

Bagan pai digunakan terutama untuk menunjukkan persentase. Mereka dapat dengan mudah menggambarkan distribusi beberapa item, dan menyoroti yang paling dominan. Data mentah jaringan sosial diwakili menurut atribut Age.Perhatikan bahwa bagan tersebut menunjukkan tidak hanya distribusi laki-laki dan perempuan yang jelas, namun juga kemungkinan kesalahan: R sebagai nilai jenis kelamin yang mungkin tercipta saat data dikumpulkan.

Bagaimana menggunakan grafik untuk analisis prediktif

Teori grafik menyediakan satu set algoritma kuat yang dapat menganalisis data yang terstruktur dan direpresentasikan sebagai grafik. Dalam ilmu komputer, grafik adalah struktur data, sebuah cara untuk mengatur data yang mewakili hubungan antara pasangan objek data. Grafik terdiri dari dua bagian utama:

  • Verteks, juga dikenal sebagai simpul

  • Tepi, yang menghubungkan pasang simpul

Tepi dapat diarahkan (digambar seperti panah) dan dapat memiliki bobot. Anda dapat memutuskan untuk menempatkan tepi (panah) di antara dua node (lingkaran) - dalam hal ini, anggota jaringan sosial yang terhubung dengan anggota lain sebagai teman:

Arah panah menunjukkan siapa "teman" siapa yang pertama, atau siapa yang memulai interaksi sebagian besar waktu.

Dasar-dasar kata awan untuk analisis prediktif

Pertimbangkan daftar kata atau konsep yang disusun sebagai kata awan - representasi grafis dari semua kata dalam daftar, menunjukkan ukuran masing-masing kata sebagai proporsional ke metrik yang Anda tentukan. Misalnya, jika Anda memiliki spreadsheet kata-kata dan kejadian dan Anda ingin mengidentifikasi kata-kata yang paling penting, cobalah sebuah kata awan.

Kata awan bekerja karena kebanyakan data organisasi adalah teks; Contoh umum adalah penggunaan istilah trending Twitter. Setiap istilah dalam representasi ini memiliki bobot yang mempengaruhi ukurannya sebagai indikator kepentingan relatifnya.

Salah satu cara untuk menentukan berat badan bisa jadi dengan berapa kali sebuah kata muncul dalam pengumpulan data Anda. Semakin sering sebuah kata muncul, bobot yang "lebih berat" - dan semakin besar jumlahnya di awan.

Perilaku berkelompok secara alami adalah sistem pengorganisasian sendiri dimana objek (khususnya, makhluk hidup) cenderung berperilaku sesuai dengan (a) lingkungan tempat tinggal mereka dan (b) tanggapan mereka terhadap objek lain yang ada. Perilaku berkelompok masyarakat alami seperti lebah, lalat, burung, ikan, dan semut - atau, dalam hal ini, orang - juga dikenal sebagai kecerdasan

swarm . Burung mengikuti peraturan alam saat mereka berperilaku seperti kawanan domba.

Flock-mate adalah burung yang terletak dengan jarak tertentu satu sama lain; Burung-burung tersebut dianggap serupa. Setiap burung bergerak sesuai dengan tiga aturan utama yang mengatur perilaku berkelompok. Pemisahan:

  • Flock-mate tidak boleh bertabrakan satu sama lain. Alignment:

  • Flock-mate untuk bergerak dalam arah rata-rata yang sama dengan tetangga mereka. Kohesi:

  • Flock-mates bergerak sesuai dengan posisi rata-rata atau lokasi kawanannya. Memodelkan ketiga aturan tersebut dapat memungkinkan sistem analitik untuk mensimulasikan perilaku berkelompok. Dengan menggunakan perilaku alami burung berkelompok yang mengorganisir diri sendiri, Anda bisa mengubah spreadsheet langsung menjadi visualisasi.Kuncinya adalah mendefinisikan pengertian kesamaan sebagai bagian dari data Anda. Mulailah dengan beberapa pertanyaan:

Apa yang membuat dua objek data dalam data Anda serupa?

  • Atribut mana yang paling bisa mendorong kesamaan antara dua data rekam?

  • Misalnya, dalam data jaringan sosial, catatan data mewakili pengguna individual; atribut yang menggambarkannya dapat mencakup Usia, Kode Pos, Status Hubungan, Daftar Teman, Jumlah Teman, Kebiasaan, Acara

Bagaimana Memvisualisasikan Analisis Prediktif' Data Mentah - dummies

Pilihan Editor

Asisten Dokter Ujian: Tipe 1 dan Tipe 2 Diabetes - dummies

Asisten Dokter Ujian: Tipe 1 dan Tipe 2 Diabetes - dummies

Sebagai masalah yang lebih umum , Asisten Dokter Ujian (PANCE) akan mengharapkan Anda untuk mengetahui perbedaan antara diabetes tipe 1 dan tipe 2. Diabetes mellitus (DM) adalah karena metabolisme insulin yang abnormal di dalam tubuh. Pada diabetes mellitus tipe 1, pankreas tidak memproduksi insulin, dan pada tipe 2, tubuh menahan tindakan ...

Asisten Dokter Asisten: Testis dan Sekitarnya - dummies

Asisten Dokter Asisten: Testis dan Sekitarnya - dummies

Banyak kondisi kesehatan dapat mempengaruhi testis dan ini akan dibahas di Asisten Dokter Ujian. Tidak hanya kondisi penting secara klinis, tapi juga hasil tinggi untuk tes. Dari torsi hingga kanker hingga infeksi, waspadai kondisi ini. Torsion Testicular torsion adalah kondisi yang tidak Anda inginkan pada kondisi terburuk Anda ...

Praktek Pertanyaan Dermatologi pada Asisten Dokter - dummies

Praktek Pertanyaan Dermatologi pada Asisten Dokter - dummies

Dari ruam sampai eksim dan infeksi bakteri terhadap virus exanthems, pertanyaan latihan ini serupa dengan pertanyaan dermatologi pada Physician Assistant Exam (PANCE). Contoh Pertanyaan PANCE Salah satu dari berikut ini dapat berkembang menjadi karsinoma sel skuamosa dari waktu ke waktu? (A) Onikomikosis (B) Keratosis aktinik (C) Keratosis seboroik (D) Psoriasis (E) Impetigo Anda sedang mengevaluasi ...

Pilihan Editor

GED Test Prep: Penalaran Melalui Bahasa Membaca Seni Pertanyaan Drag-and-Drop

GED Test Prep: Penalaran Melalui Bahasa Membaca Seni Pertanyaan Drag-and-Drop

Bagian Penalaran Melalui Bahasa Seni GED menggunakan jenis pertanyaan drag-and-drop, antara lain. Item ini mengharuskan Anda menyeret dan melepaskan informasi dari satu lokasi ke layar lainnya. Biasanya, tujuannya adalah agar Anda menyusun ulang sesuatu dari yang paling tidak penting bagi kebanyakan orang, untuk menempatkan peristiwa ke dalam urutan, atau hanya ...

Tips Uji GED: Pertanyaan Mengatasi dan Menjawab - dummies

Tips Uji GED: Pertanyaan Mengatasi dan Menjawab - dummies

Saat Anda memulai GED, Anda ingin memiliki rencana permainan di tempat untuk bagaimana menjawab pertanyaan. Ingatlah tips berikut ini untuk membantu Anda mengatasi setiap pertanyaan: Kapan pun Anda membaca sebuah pertanyaan, tanyakan pada diri Anda, "Apa yang saya minta? "Melakukannya membantu Anda tetap fokus pada apa yang Anda butuhkan ...

GED Test Prep: Penalaran Melalui Bahasa Penulisan Seni Pertanyaan Tanggapan yang Diperluas - dummies

GED Test Prep: Penalaran Melalui Bahasa Penulisan Seni Pertanyaan Tanggapan yang Diperluas - dummies

Ketika Anda menyelesaikan bagian pertama dari bagian Reasoning Through Language Arts (RLA) dari GED, Anda memulai Respons Extended-di mana Anda menulis esai dengan menganalisis argumen yang disajikan dalam dua lembar teks contoh. Anda mendapatkan 45 menit untuk mengerjakan bagian RLA ini, dan Anda tidak dapat melakukannya ...

Pilihan Editor

Cara Melacak Konten dan Membuat Laporan untuk Otomasi Pemasaran - dummies

Cara Melacak Konten dan Membuat Laporan untuk Otomasi Pemasaran - dummies

Setelah Anda memiliki konten untuk kampanye otomasi pemasaran, saatnya belajar mengelolanya. Melacak konten Anda - mengetahui siapa yang terlibat dengannya dan di mana dia terlibat dengan-membantu Anda mengetahui bagaimana menyajikannya dengan lebih baik pada kesempatan berikutnya. Otomatisasi pemasaran membuat manajemen konten sangat berbeda dari bagaimana ...

Bagaimana Menggunakan Otomasi Pemasaran untuk Melacak Prospek Pemasaran Bergerak - dummies

Bagaimana Menggunakan Otomasi Pemasaran untuk Melacak Prospek Pemasaran Bergerak - dummies

Banyak pemasar diukur pada berapa banyak prospek yang mereka berikan pada penjualan dan persentase prospek tersebut diubah menjadi peluang. Untungnya, otomatisasi pemasaran dapat membantu Anda mengembangkan cara untuk mengukur prospek. Mendapatkan visibilitas ke prospek setelah mengirimkannya ke tim penjualan merupakan kutukan bagi banyak departemen pemasaran. Setelah menerapkan ...

Bagaimana Menggunakan Video Tertanam untuk Keterlibatan Peningkatan dalam Otomasi Pemasaran - dummies

Bagaimana Menggunakan Video Tertanam untuk Keterlibatan Peningkatan dalam Otomasi Pemasaran - dummies

Anda dapat menggunakan video khusus untuk mendorong konversi yang lebih tinggi melalui otomasi pemasaran Anda. Untuk membuat video yang lebih maju, pastikan Anda memiliki beberapa opsi dasar dengan alat video-hosting Anda: Putar otomatis: Opsi ini memungkinkan video Anda untuk mulai bermain saat seseorang mendarat di halaman. Ini bukan pilihan super canggih, tapi ...