Daftar Isi:
- Cara menggunakan visualisasi tabular untuk analisis prediktif
- Diagram batang digunakan dalam analisis prediktif
- Dasar-dasar diagram lingkaran untuk analisis prediktif
- Bagaimana menggunakan grafik untuk analisis prediktif
- Dasar-dasar kata awan untuk analisis prediktif
- Perilaku berkelompok secara alami adalah sistem pengorganisasian sendiri dimana objek (khususnya, makhluk hidup) cenderung berperilaku sesuai dengan (a) lingkungan tempat tinggal mereka dan (b) tanggapan mereka terhadap objek lain yang ada. Perilaku berkelompok masyarakat alami seperti lebah, lalat, burung, ikan, dan semut - atau, dalam hal ini, orang - juga dikenal sebagai kecerdasan
Video: TensorFlow Dev Summit 2019 Keynote 2024
Gambar bernilai seribu kata - terutama saat Anda mencoba menangani data analisis prediktif Anda dengan baik. Pada tahap pra-pemrosesan, saat Anda mempersiapkan data Anda, ini adalah praktik umum untuk memvisualisasikan apa yang ada sebelum melanjutkan ke langkah berikutnya.
Anda mulai dengan menggunakan spreadsheet seperti Microsoft Excel untuk membuat matriks data - yang terdiri dari data kandidat fitur (juga disebut atribut ). Beberapa paket perangkat lunak intelijen bisnis (seperti Tableau) dapat memberi Anda gambaran awal tentang data yang akan Anda gunakan untuk analisis.
Cara menggunakan visualisasi tabular untuk analisis prediktif
Tabel adalah representasi bergambar yang paling sederhana dan paling dasar. Tabel (juga dikenal sebagai spreadsheets ) terdiri dari baris dan kolom - yang sesuai, masing-masing, dengan objek dan atributnya yang disebutkan sebelumnya sebagai pembuatan data Anda. Misalnya, perhatikan data jaringan sosial online. Objek data bisa mewakili pengguna. Atribut pengguna (objek data) dapat berupa judul kolom: Gender, Kode Pos, atau Tanggal Lahir.
Sel dalam tabel mewakili nilai. Visualisasi dalam tabel dapat membantu Anda dengan mudah menemukan nilai atribut objek data yang hilang.
Tabel juga dapat memberikan fleksibilitas untuk menambahkan atribut baru yang merupakan kombinasi atribut lainnya. Misalnya, dalam data jaringan sosial, Anda dapat menambahkan kolom lain yang disebut Usia, yang dapat dengan mudah dihitung - sebagai atribut turunan - dari atribut Tanggal Lahir yang ada. Data jaringan sosial tabular menunjukkan kolom baru, Age, dibuat dari kolom lain yang ada (Date of Birth).
Diagram batang digunakan dalam analisis prediktif
Diagram batang dapat digunakan untuk melihat lonjakan atau anomali pada data Anda. Anda dapat menggunakannya untuk masing-masing atribut untuk memotret dengan cepat nilai minimum dan maksimum. Diagram batang juga bisa digunakan untuk memulai diskusi tentang bagaimana menormalkan data Anda.
Normalisasi adalah penyesuaian beberapa atau semua nilai atribut pada skala yang membuat data lebih bermanfaat. Misalnya, Anda dapat dengan mudah melihat ada kesalahan dalam data: Bilah Umur pada satu rekaman adalah negatif. Anomali itu lebih mudah digambarkan oleh diagram batang daripada tabel data.
Dasar-dasar diagram lingkaran untuk analisis prediktif
Bagan pai digunakan terutama untuk menunjukkan persentase. Mereka dapat dengan mudah menggambarkan distribusi beberapa item, dan menyoroti yang paling dominan. Data mentah jaringan sosial diwakili menurut atribut Age.Perhatikan bahwa bagan tersebut menunjukkan tidak hanya distribusi laki-laki dan perempuan yang jelas, namun juga kemungkinan kesalahan: R sebagai nilai jenis kelamin yang mungkin tercipta saat data dikumpulkan.
Bagaimana menggunakan grafik untuk analisis prediktif
Teori grafik menyediakan satu set algoritma kuat yang dapat menganalisis data yang terstruktur dan direpresentasikan sebagai grafik. Dalam ilmu komputer, grafik adalah struktur data, sebuah cara untuk mengatur data yang mewakili hubungan antara pasangan objek data. Grafik terdiri dari dua bagian utama:
-
Verteks, juga dikenal sebagai simpul
-
Tepi, yang menghubungkan pasang simpul
Tepi dapat diarahkan (digambar seperti panah) dan dapat memiliki bobot. Anda dapat memutuskan untuk menempatkan tepi (panah) di antara dua node (lingkaran) - dalam hal ini, anggota jaringan sosial yang terhubung dengan anggota lain sebagai teman:
Arah panah menunjukkan siapa "teman" siapa yang pertama, atau siapa yang memulai interaksi sebagian besar waktu.
Dasar-dasar kata awan untuk analisis prediktif
Pertimbangkan daftar kata atau konsep yang disusun sebagai kata awan - representasi grafis dari semua kata dalam daftar, menunjukkan ukuran masing-masing kata sebagai proporsional ke metrik yang Anda tentukan. Misalnya, jika Anda memiliki spreadsheet kata-kata dan kejadian dan Anda ingin mengidentifikasi kata-kata yang paling penting, cobalah sebuah kata awan.
Kata awan bekerja karena kebanyakan data organisasi adalah teks; Contoh umum adalah penggunaan istilah trending Twitter. Setiap istilah dalam representasi ini memiliki bobot yang mempengaruhi ukurannya sebagai indikator kepentingan relatifnya.
Salah satu cara untuk menentukan berat badan bisa jadi dengan berapa kali sebuah kata muncul dalam pengumpulan data Anda. Semakin sering sebuah kata muncul, bobot yang "lebih berat" - dan semakin besar jumlahnya di awan.
Perilaku berkelompok secara alami adalah sistem pengorganisasian sendiri dimana objek (khususnya, makhluk hidup) cenderung berperilaku sesuai dengan (a) lingkungan tempat tinggal mereka dan (b) tanggapan mereka terhadap objek lain yang ada. Perilaku berkelompok masyarakat alami seperti lebah, lalat, burung, ikan, dan semut - atau, dalam hal ini, orang - juga dikenal sebagai kecerdasan
swarm . Burung mengikuti peraturan alam saat mereka berperilaku seperti kawanan domba.
Flock-mate adalah burung yang terletak dengan jarak tertentu satu sama lain; Burung-burung tersebut dianggap serupa. Setiap burung bergerak sesuai dengan tiga aturan utama yang mengatur perilaku berkelompok. Pemisahan:
-
Flock-mate tidak boleh bertabrakan satu sama lain. Alignment:
-
Flock-mate untuk bergerak dalam arah rata-rata yang sama dengan tetangga mereka. Kohesi:
-
Flock-mates bergerak sesuai dengan posisi rata-rata atau lokasi kawanannya. Memodelkan ketiga aturan tersebut dapat memungkinkan sistem analitik untuk mensimulasikan perilaku berkelompok. Dengan menggunakan perilaku alami burung berkelompok yang mengorganisir diri sendiri, Anda bisa mengubah spreadsheet langsung menjadi visualisasi.Kuncinya adalah mendefinisikan pengertian kesamaan sebagai bagian dari data Anda. Mulailah dengan beberapa pertanyaan:
Apa yang membuat dua objek data dalam data Anda serupa?
-
Atribut mana yang paling bisa mendorong kesamaan antara dua data rekam?
-
Misalnya, dalam data jaringan sosial, catatan data mewakili pengguna individual; atribut yang menggambarkannya dapat mencakup Usia, Kode Pos, Status Hubungan, Daftar Teman, Jumlah Teman, Kebiasaan, Acara