Video: Cara Mengembalikan Data Flashdisk yang Hilang Oleh Virus 2024
Fungsi cor () di R dapat menangani nilai data yang hilang dengan berbagai cara. Untuk itu, Anda menetapkan argumen menggunakan salah satu dari nilai teks yang mungkin. Nilai untuk argumen penggunaan sangat penting jika Anda menghitung korelasi variabel dalam bingkai data. Dengan menetapkan argumen ini ke nilai yang berbeda, Anda dapat
-
Gunakan semua pengamatan dengan menetapkan use = 'everything' . Ini berarti bahwa jika ada nilai NA di salah satu variabel, korelasi yang dihasilkan adalah NA juga. Ini adalah defaultnya.
-
Kecualikan semua pengamatan yang memiliki NA untuk setidaknya satu variabel. Untuk ini, kamu set use = 'complete. obs '. Perhatikan bahwa ini mungkin akan meninggalkan Anda hanya dengan beberapa pengamatan jika nilai yang hilang disebarkan melalui dataset yang lengkap.
-
Mengecualikan pengamatan dengan nilai NA untuk setiap pasangan variabel yang Anda periksa. Untuk itu, Anda menetapkan argumen use = 'pairwise'. Ini memastikan bahwa Anda dapat menghitung korelasi untuk setiap pasangan variabel tanpa kehilangan informasi karena kehilangan nilai pada variabel lainnya.
Sebenarnya, Anda bisa menghitung berbagai ukuran korelasi. Secara default, R menghitung koefisien korelasi Pearson standar. Untuk data yang tidak terdistribusi normal, Anda bisa menggunakan fungsi cor () untuk menghitung korelasi rank Spearman, atau tau Kendall. Untuk ini, Anda harus mengatur argumen metode ke nilai yang sesuai.