Rumah Keuangan Pribadi Bagaimana Merepot Data Diringkas dalam ggplot2 di R - dummies

Bagaimana Merepot Data Diringkas dalam ggplot2 di R - dummies

Daftar Isi:

Video: Excel: Groups and Subtotals 2024

Video: Excel: Groups and Subtotals 2024
Anonim

Salah satu fitur ggplot2 yang sangat mudah digunakan adalah merangkum data R Anda di plot. Ini berarti bahwa Anda sering tidak perlu meringkas data Anda. Misalnya, tinggi batang dalam histogram menunjukkan berapa banyak pengamatan terhadap sesuatu yang Anda miliki di data Anda.

Ringkasan statistik untuk ini adalah untuk menghitung pengamatan. Statistik menyebut proses ini sebagai binning, dan stat default untuk geom_bar () adalah stat_bin ().

Analog dengan cara setiap geom memiliki stat default yang terkait, masing-masing stat juga memiliki geom default.

Jadi, ini menimbulkan pertanyaan: Bagaimana Anda memutuskan apakah akan menggunakan geom atau stat? Secara teori tidak masalah apakah Anda memilih geom atau stat terlebih dahulu. Dalam prakteknya, bagaimanapun, seringkali intuitif untuk memulai dengan jenis plot terlebih dahulu - dengan kata lain, tentukan geom. Jika Anda ingin menambahkan lapisan ringkasan statistik lainnya, gunakan stat.

Dalam plot ini, Anda menggunakan data yang sama untuk pertama kali membuat scatterplot dengan geom_point () dan kemudian Anda menambahkan garis halus dengan stat_smooth ().

Lihat beberapa contoh praktis penggunaan fungsi stat.

Stat Deskripsi Default Geom
stat_bin () Menghitung jumlah pengamatan di tempat sampah. geom_bar ()
stat_smooth () Buat garis halus. geom_line ()
stat_sum () Menambahkan nilai. geom_point ()
stat_identity () Tidak ada rangkuman. Data plot seperti. geom_point ()
stat_boxplot () Ringkaskan data untuk plot kotak-dan-kumis. geom_boxplot ()
Bagaimana data bin di ggplot2

Anda telah melihat bagaimana menggunakan stat_bin () untuk meringkas data Anda ke tempat sampah, karena ini adalah stat default dari geom_bar (). Ini berarti bahwa dua baris kode berikut menghasilkan plot yang identik: >> ggplot (gempa, aes (x = kedalaman)) + geom_bar (binwidth = 50)> ggplot (gempa, aes (x = kedalaman)) + stat_bin binwidth = 50)

Cara menghaluskan data R dalam ggplot2

Paket ggplot2 juga membuatnya sangat mudah untuk membuat garis regresi melalui data Anda. Anda menggunakan fungsi stat_smooth () untuk membuat jenis baris ini.

Hal yang menarik tentang stat_smooth () adalah bahwa hal itu membuat penggunaan regresi lokal secara default. R memiliki beberapa fungsi yang dapat melakukan hal ini, namun ggplot2 menggunakan fungsi loess () untuk regresi lokal. Ini berarti bahwa jika Anda ingin membuat model regresi linier Anda harus memberi tahu stat_smooth () untuk menggunakan fungsi yang lebih halus. Anda melakukan ini dengan argumen metode.

Untuk menggambarkan penggunaan yang lebih halus, mulailah dengan menciptakan sebaran pengangguran di dataset panjang: >> ggplot (longley, aes (x = Tahun, y = Bekerja)) + geom_point ()

Berikutnya, tambahkan lebih halus.Ini semudah menambahkan stat_smooth () ke baris kode Anda. >> ggplot (longley, aes (x = Tahun, y = Bekerja)) + + geom_point () + stat_smooth ()

Akhirnya, beritahu stat_smooth untuk menggunakan model regresi linier. Anda melakukan ini dengan menambahkan metode argumen = "lm". >> ggplot (longley, aes (x = Tahun, y = Bekerja)) + + geom_point () + stat_smooth (method = "lm")

Bagaimana cara memberitahu ggplot2 untuk meninggalkan data Anda unsummarized

Kadang-kadang Anda tidak ingin ggplot2 meringkas data Anda dalam plot. Ini biasanya terjadi bila data Anda sudah diringkas sebelumnya atau bila setiap baris kerangka data Anda harus diplot secara terpisah. Dalam kasus ini, Anda ingin memberi tahu ggplot2 untuk tidak melakukan apa-apa, dan stat untuk melakukan ini adalah stat_identity ().
Bagaimana Merepot Data Diringkas dalam ggplot2 di R - dummies

Pilihan Editor

Bagaimana Memeriksa Kinerja Sistem dengan AWS - dummies

Bagaimana Memeriksa Kinerja Sistem dengan AWS - dummies

AWS (Amazon Web Services) memberi Anda sejumlah metode untuk memantau layanan AWS-spesifik. Namun, Anda mungkin memiliki masalah kinerja sistem yang mendasarinya atau masalah aplikasi non-AWS yang harus dihadapi, yang berarti memiliki alat yang dapat bekerja di luar AWS. Paket grup Alat Kinerja berisi sejumlah alat khusus Linux untuk menyelesaikan tugas ini ...

Bagaimana Memilih Layanan AWS yang Anda Butuhkan - kenangan sehari-hari

Bagaimana Memilih Layanan AWS yang Anda Butuhkan - kenangan sehari-hari

Ingat bahwa Anda hanya memiliki 12 bulan kebebasan Anda percobaan untuk membuat keputusan tentang layanan AWS (Amazon Web Services) yang akan digunakan dalam bisnis Anda. Dua belas bulan mungkin tampak seperti banyak waktu, tapi Anda akan mendapati bahwa itu menguap di depan mata Anda saat Anda mencoba menyulap tanggung jawab, pertemuan, dan pertemuan sehari-hari Anda ...

Amazon Web Services For Dummies Cheat Sheet - dummies

Amazon Web Services For Dummies Cheat Sheet - dummies

Amazon Web Services (AWS) adalah penyedia layanan cloud yang menawarkan akses mudah ke berbagai sumber daya komputasi yang berguna, semuanya ditawarkan secara on-demand, dengan biaya yang efektif. Jika Anda seorang praktisi IT yang siap untuk merangkul Amazon Web Services, matikan kebiasaan desain aplikasi lama Anda dan terapkan pendekatan baru yang memanfaatkan karakteristik AWS dan ...

Pilihan Editor

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

Ketika Anda mencapai bagian Sains GED, Anda akan diharapkan memiliki pengetahuan umum di semua cabang Ilmu Pengetahuan, termasuk Ilmu Fisika. Berikut adalah contoh jenis pertanyaan yang mungkin Anda hadapi pada hari ujian. Kecepatan dan Kecepatan Ada perbedaan antara kecepatan dan kecepatan, meskipun terkadang Anda ...

Latihan GED RLA: Reading Comprehension - dummies

Latihan GED RLA: Reading Comprehension - dummies

Cara terbaik untuk mempersiapkan bagian pemahaman bacaan GED Tes RLA adalah melakukan sebanyak mungkin pertanyaan latihan. Simak sampel untuk melihat apa yang akan Anda hadapi pada hari ujian. Contoh Pertanyaan Pertanyaan 1-6 mengacu pada bagian berikut. Fasilitas untuk Akses ke Perusahaan Kreatif (FACE) Awalnya didirikan ...

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

Komponen bacaan Penalaran meskipun Bahasa Seni Bagian pada GED terdiri dari kutipan dari fiksi dan nonfiksi. Setiap kutipan diikuti oleh beberapa item pilihan berdasarkan bahan bacaan. Untuk pertanyaan di bagian ini, pilih satu jawaban terbaik untuk setiap pertanyaan. Bekerja dengan hati-hati, tapi jangan terlalu banyak menghabiskan waktu ...

Pilihan Editor

Bagaimana NaturallySpeaking Dapat Belajar dari Email Terkirim - dummies

Bagaimana NaturallySpeaking Dapat Belajar dari Email Terkirim - dummies

Menganalisis e-mail adalah salah satu cara untuk asisten NaturallySpeaking Anda untuk membangun kosa kata Anda. Proses ini membantu dalam dua cara. Ini belajar dari gaya e-mail Anda dan secara otomatis dapat menambahkan alamat e-mail yang Anda gunakan saat ini. Ia bekerja dengan Microsoft Outlook, Outlook. com, Lotus Notes, Gmail, Yahoo! , dan Windows Live Mail. Dari Pusat Akurasi, ...

Bagaimana NaturallySpeaking Berjalan di Latar Belakang - dummies

Bagaimana NaturallySpeaking Berjalan di Latar Belakang - dummies

Secara alamiSpeaking menggunakan beberapa jendela sekaligus. Biasanya, Anda meluncurkan aplikasi, Anda mendapatkan jendela aplikasi, dan Anda bekerja di jendela itu. Akhir dari cerita. Tidak demikian halnya dengan NaturallySpeaking, dan untuk alasan yang bagus: Anda ingin bisa menggunakan input suara di banyak tempat yang berbeda, tidak hanya di satu jendela saja. Inti ...

Bagaimana menambahkan perintah teks otomatis ke nuansa profesional - dummies

Bagaimana menambahkan perintah teks otomatis ke nuansa profesional - dummies

Menambahkan Fitur baru yang hebat yang akan membuat Anda semakin produktif saat menggunakan perintah Dragon Professional Individual Anda. Ini adalah kemampuan untuk menggunakan variabel dalam perintah auto-text Anda. Jadi bagaimana anda bisa menggunakannya? Setelah Anda membuat perintah baru dan menentukan isinya sehingga Anda tidak perlu mengetik ulang ...