Daftar Isi:
- Cara menggunakan penggabungan untuk menemukan persimpangan data
- Fungsi gabungan () memungkinkan empat cara menggabungkan data:
- Kembali ke contoh negara bagian AS, untuk melakukan penggabungan lengkap negara dingin dan besar, gunakan penggabungan dan tentukan semua = TRUE: >> menggabungkan (dingin negara bagian, semua = BENAR) Nama Frost Area 1 Alaska 152 566432 2 Arizona NA 113417 3 California NA 156361 … 13 Texas NA 262134 14 Vermont 168 NA 15 Wyoming 173 NA
Video: RUMUS EXCEL CARA MENGGUNAKAN INDEX AND MATCH 2025
Di R Anda menggunakan fungsi gabungan () untuk menggabungkan frame data. Fungsi kuat ini mencoba untuk mengidentifikasi kolom atau baris yang umum di antara dua bingkai data yang berbeda.
Cara menggunakan penggabungan untuk menemukan persimpangan data
Bentuk penggabungan yang paling sederhana () menemukan persimpangan antara dua kumpulan data yang berbeda. Dengan kata lain, untuk membuat bingkai data yang terdiri dari negara bagian yang dingin dan besar, gunakan versi penggabungan default ():
Jika Anda sudah familiar dengan database bahasa seperti SQL, Anda mungkin sudah menduga bahwa penggabungan () sangat mirip dengan database join. Ini adalah, memang, kasus dan argumen yang berbeda untuk menggabungkan () memungkinkan Anda untuk melakukan bergabung alami, serta kiri, kanan, dan penuh luar bergabung.
x
-
: Bingkai data. y
-
: Bingkai data. oleh
-
, oleh. x , oleh. y : Nama kolom yang umum untuk keduanya x dan y. Defaultnya adalah menggunakan kolom dengan nama umum di antara dua frame data.
-
: Nilai logis yang menentukan jenis penggabungan Nilai defaultnya adalah semua = FALSE (artinya hanya baris yang cocok yang dikembalikan). Kelompok argumen terakhir - semuanya, semuanya. x dan semua y - layak penjelasan. Argumen ini menentukan jenis penggabungan yang akan terjadi.
Cara memahami berbagai jenis gabungan
Fungsi gabungan () memungkinkan empat cara menggabungkan data:
Natural join:
-
Untuk menjaga baris yang tidak sesuai dari frame data, tentukan argumen semua = FALSE Full outer join:
-
Untuk menyimpan semua baris dari kedua frame data, tentukan semua = TRUE. Kiri luar bergabung:
-
Untuk memasukkan semua baris dari kerangka data x Anda dan hanya yang dari y yang cocok, tentukan semuanya. x = BENAR. Gali kanan bergabung:
-
Untuk memasukkan semua baris bingkai data y dan hanya dari x yang cocok, tentukan semuanya. y = BENAR. Bagaimana menemukan serikat (full outer join)
Kembali ke contoh negara bagian AS, untuk melakukan penggabungan lengkap negara dingin dan besar, gunakan penggabungan dan tentukan semua = TRUE: >> menggabungkan (dingin negara bagian, semua = BENAR) Nama Frost Area 1 Alaska 152 566432 2 Arizona NA 113417 3 California NA 156361 … 13 Texas NA 262134 14 Vermont 168 NA 15 Wyoming 173 NA
Kedua kerangka data memiliki nama variabel, jadi R cocok dengan kasus berdasarkan nama negara bagian.Variabel Frost berasal dari data frame yang dingin. negara bagian, dan Variabel Area berasal dari data frame yang besar. negara bagian.
Perhatikan bahwa ini melakukan penggabungan lengkap dan mengisi kolom dengan nilai NA dimana tidak ada data yang sesuai.