Daftar Isi:
Video: Introduction to Pivot Tables, Charts, and Dashboards in Excel (Part 1) 2024
Anda menggunakan tapply () untuk membuat ringkasan data tabel di R. Dengan tapply (), Anda dapat dengan mudah membuat ringkasan subkelompok dalam data. Fungsi ini mengambil tiga argumen:
-
X : Sebuah vektor
-
INDEX : Faktor atau daftar faktor
-
FUN : Fungsi < Misalnya, hitung rata-rata jarak sepal dalam dataset iris: >> tapply (iris $ Sepal. Panjang, iris $ Spesies, mean) setosa versicolor virginica 5. 006 5. 936 6. 588
Dengan ini Garis pendek kode, Anda melakukan beberapa hal yang hebat. Anda menyuruh R untuk mengambil Sepal. Kolom panjang, belah sesuai Spesies, lalu hitung rata-rata untuk setiap kelompok.
Ini adalah idiom penting untuk menulis kode di R, dan biasanya berjalan dengan nama Split, Apply, and Combine (SAC). Dalam kasus ini, Anda membagi vektor menjadi beberapa kelompok, menerapkan fungsi ke setiap kelompok, dan kemudian menggabungkan hasilnya menjadi vektor.
Tentu saja, dengan menggunakan fungsi with (), Anda dapat menulis baris kode Anda dengan cara yang sedikit lebih mudah dibaca: >> with (iris, tapply (Sepal. Length, Species, mean)) setosa versicolor virginica 5 006 5. 936 6. 588Menggunakan tapply (), Anda juga dapat membuat tabel yang lebih kompleks untuk meringkas data Anda. Anda melakukan ini dengan menggunakan daftar sebagai argumen INDEX Anda.
Cara menggunakan tapply () untuk membuat tabel dengan dimensi lebih tinggi
Sebagai contoh, cobalah meringkas rt frame data, bingkai data built-in dengan data tentang mesin dan performa motor motor.. Seperti halnya objek, Anda dapat menggunakan str () untuk memeriksa strukturnya: >> str (mtcars)
Variabel adalah vektor numerik yang menunjukkan apakah mesin memiliki otomatis (0) atau manual (1) gearbox Karena ini tidak terlalu deskriptif, mulailah dengan membuat objek baru, mobil, itu adalah salinan mtcars, dan ubah kolomnya menjadi faktor:
>> mobil <- dalam (mtcars, + am <- factor (am, levels = 0: 1, labels = c ("Automatic", "Manual")) +)
Sekarang gunakan tapply () untuk menemukan mil rata-rata per galon (mpg) untuk setiap jenis kotak roda gigi: >> dengan (mobil, tapply (mpg, am, mean)) Manual Otomatis 17. 14737 24. 39231
Ya, kamu benar. Ini masih hanya meja satu dimensi. Sekarang, cobalah untuk membuat tabel dua dimensi dengan tipe gearbox (am) dan jumlah roda gigi (roda gigi): >> dengan (mobil, tapply (mpg, daftar (gigi, am), mean)) Manual Otomatis 3 16. 10667 NA 4 21. 05000 26. 275 5 NA 21. 380
Anda menggunakan tapply () untuk membuat ringkasan data tabel. Ini sedikit mirip dengan fungsi table (). Namun, tabel () hanya dapat membuat tabel kontingensi (yaitu, tabel jumlah), sedangkan dengan tapply () Anda dapat menentukan fungsi apa pun sebagai fungsi agregasi.Dengan kata lain, dengan tapply (), Anda bisa menghitung jumlah, mean, atau nilai lainnya.
Jika Anda ingin meringkas statistik pada satu vektor, tapply () sangat berguna dan cepat digunakan.Cara menggunakan agregat ()
Fungsi R lainnya yang melakukan sesuatu sangat mirip adalah agregat (): >> with (cars, aggregate (mpg, list (gear = gear, am = am), mean)) roda gigi am x 1 3 Otomatis 16. 10667 2 4 Otomatis 21. 05000 3 4 Manual 26. 27500 4 5 Manual 21. 38000
Selanjutnya, Anda mengambil agregat () ke ketinggian baru dengan menggunakan rumus antarmuka.