Rumah Keuangan Pribadi Membangun pada penggali data dasar Scatterplots - dummies

Membangun pada penggali data dasar Scatterplots - dummies

Video: Beginilah Proses Pemasangan Kabel Optik 6 KM di Dasar Laut 2024

Video: Beginilah Proses Pemasangan Kabel Optik 6 KM di Dasar Laut 2024
Anonim

Penambang data sering memanfaatkan fitur khusus untuk mengemas lebih banyak informasi ke dalam grafik sederhana. Label, overlay, dan seleksi interaktif merupakan keunggulan aplikasi data mining, fitur khusus yang memungkinkan Anda menjadi lebih produktif.

Jarak tempuh menurun saat tenaga kuda meningkat, seperti yang terlihat pada gambar berikut.

Jarak tempuh meningkat seiring berjalannya waktu, seperti yang Anda lihat, scatterplot jarak tempuh versus model tahun. Akan sangat membantu untuk mendapatkan kedua gagasan ini menjadi satu grafik.

Pendekatan penambangan data umum untuk mengintegrasikan lebih dari dua variabel dalam grafik mencakup

  • Label: Label adalah nilai dari string atau variabel kategoris yang telah dilapiskan pada scatterplot. Gambar berikut menunjukkan scatterplot yang diberi label dengan model tahun mobil.

    Dataset dengan banyak titik atau label panjang bisa membuat grafik ini tidak terbaca! Solusinya adalah hanya menggunakan sampel data. Setup untuk jenis sampling ini ditunjukkan pada gambar berikut.

  • Hamparan: Dengan hamparan, nilai variabel kategoris menentukan bentuk atau warna titik. Gambar berikut menunjukkan penyiapan scatterplot ke model overlay tahun pada scatterplot jarak tempuh-versus-tenaga kuda.

    scatterplot hamparan yang diekspor muncul pada gambar berikut. Mungkin lebih mudah untuk membaca lapisan warna daripada lapisan bentuk titik. Pengaturannya biasanya sama.

Hal lain yang perlu diingat dengan scatterplots: Anda mungkin memiliki banyak titik jatuh di tempat yang sama! Jika demikian, Anda mungkin tidak dapat memberi tahu satu poin untuk satu kasus dari satu titik untuk 100 kasus. Obatnya adalah untuk memeriksa pilihan untuk membuat beberapa contoh terlihat. Carilah ukuran titik atau jitter (gerakkan sedikit poin dari lokasi sebenarnya untuk membuat semuanya terlihat) pilihan.

scatterplots Interaktif adalah penabung waktu yang bagus untuk penambang data.

Katakan bahwa Anda melihat sekelompok kasus menarik dalam grafik, dan Anda ingin menyelidiki lebih jauh kasus-kasus itu saja. Jika Anda hanya melihat satu atau dua titik, Anda mungkin mendapatkan informasi yang Anda inginkan dengan melayang, tapi itu tidak memuaskan saat Anda tertarik pada lebih dari beberapa poin.

Alat pemilihan data dalam scatterplots interaktif memberi Anda lebih banyak kekuatan untuk memilih data. Gambar berikut menunjukkan penyiapan grafik yang sama, namun dengan sekelompok titik yang dipilih dengan mengklik dan menyeret mouse di sekitar mereka. Ini bukan sekedar fitur visual.

Anda dapat mengekspor poin yang dipilih sebagai kumpulan data baru. Ini sangat berguna dan cepat!

Jika poin yang Anda butuhkan tidak sesuai dengan pilihan persegi panjang, Anda punya pilihan lain. Lihat area Zoom / Select. Anda bisa melihat sebuah tombol dengan persegi panjang untuk seleksi persegi panjang dan yang lainnya dengan bentuk bulat untuk pemilihan bentuk bebas.

Berikut adalah contoh pilihan bentuk bebas menggunakan data kandungan nikotin dari rokok yang dijual di berbagai belahan dunia. Scatterplot ini menunjukkan nikotin per batang rokok untuk sampel dari enam wilayah Perserikatan Bangsa-Bangsa. (Ini adalah penggunaan nontradisional dari scatterplot, karena wilayah bukanlah variabel yang kontinyu; ini kategoris. Penambang data sering menggunakan alat tradisional dengan cara nontradisional.

Poin di dalam suatu wilayah tidak jatuh dalam garis vertikal yang sempurna. Pergeseran kecil (jitter) ke kiri dan kanan dibuat untuk keterbacaan dan tampilan saja. Beberapa batang rokok memiliki tingkat nikotin yang sangat tinggi, dan Anda ingin memilih kasus-kasus tersebut.

Menu drop-down menawarkan pilihan pilihan. Pemilihan poligon memungkinkan Anda menandai area bebas di scatterplot.

Untuk menandai, klik pada grafik untuk membuat titik awal, dan kemudian klik lagi dan lagi di sekitar kelompok poin yang Anda inginkan sampai Anda membuat bentuk yang Anda butuhkan.

Klik kanan menunjukkan bahwa Anda telah menyelesaikan seleksi; ini terlihat dari sorotan pada grafik.

Membangun pada penggali data dasar Scatterplots - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...