Video: Membuat Tabel Distribusi Frekuensi dengan SPSS Sangat Mudah 2024
Keputusan pertama yang harus Anda buat sebelum menganalisis data Anda adalah bagaimana mewakili data di dalam R. Jika Data Anda hanya memiliki satu dimensi, maka Anda sudah tahu bahwa vektor mewakili jenis data ini dengan sangat baik. Namun, jika data Anda memiliki lebih dari satu dimensi, Anda memiliki pilihan untuk menggunakan matriks, daftar, atau bingkai data. Jadi, pertanyaannya adalah: Kapan anda menggunakan itu?
Matriks dan array dengan dimensi lebih tinggi berguna bila semua data Anda berasal dari satu kelas - dengan kata lain, semua data Anda bersifat numerik atau semua data Anda adalah karakter. Jika Anda seorang matematikawan atau ahli statistik, Anda terbiasa dengan matriks dan kemungkinan menggunakan jenis objek ini sangat sering.
Tapi dalam banyak situasi praktis, Anda akan memiliki data yang memiliki banyak kelas berbeda - dengan kata lain, Anda akan memiliki gabungan data numerik dan karakter. Dalam kasus ini, Anda perlu menggunakan daftar atau frame data.
Jika Anda membayangkan data Anda sebagai spreadsheet tunggal, bingkai data mungkin adalah pilihan yang baik. Ingat bahwa bingkai data hanyalah daftar vektor bernama dengan panjang yang sama, yang secara konseptual sangat mirip dengan spreadsheet dengan kolom dan kolom yang menuju masing-masing.
Jika Anda terbiasa dengan database, Anda bisa memikirkan bingkai data yang mirip dengan tabel tunggal dalam database. Bingkai data sangat berguna dan, dalam banyak kasus, akan menjadi pilihan pertama Anda untuk menyimpan data Anda.
Jika data Anda terdiri dari kumpulan objek tapi Anda tidak dapat mewakili itu sebagai array atau bingkai data, maka daftar adalah pilihan ideal Anda. Karena daftar dapat berisi semua jenis objek lain, termasuk daftar atau bingkai data lainnya, ini sangat fleksibel. Akibatnya, R memiliki beragam alat untuk memproses daftar.
Anda mungkin menemukan bahwa kerangka data adalah pilihan yang sangat sesuai untuk sebagian besar analisis dan tugas pengolahan data. Ini adalah cara yang sangat mudah untuk mewakili data Anda, dan ini serupa dengan bekerja dengan tabel database. Saat Anda membaca data dari file comma-separated value (CSV) dengan fungsi baca. csv () atau baca tabel (), R menempatkan hasilnya dalam bingkai data.
Objek | deskripsi | Komentar |
---|---|---|
vektor | Objek data dasar di R, terdiri dari satu atau lebih nilai dari
satu jenis tunggal (misalnya, karakter, bilangan, atau bilangan bulat). |
Anggap ini sebagai satu kolom atau baris dalam spreadsheet, atau kolom
dalam tabel database. |
matriks atau array | Objek multidimensi dari satu jenis (dikenal sebagai
atom ). Matriks adalah array dari dua dimensi. |
Bila Anda harus menyimpan nomor dalam banyak dimensi, gunakan
array. |
daftar | Daftar dapat berisi objek dari jenis apa pun. | Daftar sangat berguna untuk menyimpan koleksi data yang dimiliki bersama
. Karena daftar dapat berisi daftar, jenis objek ini sangat berguna. |
data frame | Bingkai data adalah jenis daftar nama khusus dimana semua elemen
memiliki panjang yang sama. |
Bingkai data mirip dengan satu spreadsheet atau tabel
dalam database. |