Daftar Isi:
- Bagaimana membandingkan dua contoh data
- Dalam kebanyakan kasus, Anda tidak ingin membandingkan dua sampel satu sama lain, namun bandingkan sampel dengan sampel teoritis yang berasal dari distribusi tertentu (misalnya, distribusi normal).
Video: Menghitung Z SCORE (distribusi normal) dengan MS Excel 2024
Histogram jauh dari interpretasi pemirsa. Cara grafis yang lebih baik di R untuk mengetahui apakah data Anda didistribusikan secara normal adalah dengan melihat plot quantile-quantile (QQ) yang disebut.
Dengan teknik ini, Anda menyusun bilangan bulat satu sama lain. Jika Anda membandingkan dua sampel, misalnya, Anda cukup membandingkan kedua sampel dari kedua sampel. Atau, untuk membuatnya sedikit berbeda, R melakukan hal berikut untuk membangun plot QQ:
-
Ini memilah data kedua sampel.
-
Ini memilah nilai yang diurutkan ini satu sama lain.
Jika kedua sampel tidak mengandung jumlah nilai yang sama, R menghitung nilai ekstra dengan interpolasi untuk sampel terkecil untuk membuat dua sampel dengan ukuran yang sama.
Bagaimana membandingkan dua contoh data
Tentu saja, Anda tidak perlu melakukan semuanya sendirian, Anda bisa menggunakan fungsi qqplot () untuk itu. Jadi, untuk memeriksa apakah suhu selama aktivitas dan saat istirahat didistribusikan secara merata, Anda cukup melakukan hal berikut:
Ini menciptakan plot dimana nilai yang dipesan diplot melawan satu sama lain.
Di antara tanda kurung siku, Anda dapat menggunakan vektor logis untuk memilih kasus yang Anda inginkan. Di sini Anda memilih semua kasus di mana variabel activ sama dengan 1 untuk sampel pertama, dan semua kasus dimana variabel sama dengan 0 untuk sampel kedua.
Dalam kebanyakan kasus, Anda tidak ingin membandingkan dua sampel satu sama lain, namun bandingkan sampel dengan sampel teoritis yang berasal dari distribusi tertentu (misalnya, distribusi normal).
Untuk membuat plot QQ dengan cara ini, R memiliki fungsi qqnorm () khusus. Sesuai dengan namanya, fungsi ini memplot sampel Anda terhadap distribusi normal. Anda cukup memberikan sampel yang ingin Anda plot sebagai argumen pertama dan menambahkan parameter grafis yang Anda sukai.
R kemudian membuat sampel dengan nilai yang berasal dari distribusi normal
standar , atau distribusi normal dengan mean nol dan standar deviasi satu. Dengan sampel kedua ini, R menciptakan plot QQ seperti yang dijelaskan sebelumnya. R juga memiliki fungsi qqline (), yang menambahkan baris ke plot normal QQ Anda. Baris ini membuat lebih mudah untuk mengevaluasi apakah Anda melihat penyimpangan yang jelas dari normalitas. Semakin dekat semua poin mengarah ke garis, semakin dekat distribusi sampel Anda sampai pada distribusi normal. Fungsi qqline () juga mengambil sampel sebagai argumen.
Sekarang Anda ingin melakukan ini untuk suhu selama periode aktif dan tidak aktif berang-berang. Anda bisa menggunakan fungsi qqnorm () dua kali untuk membuat kedua plot. Untuk periode tidak aktif, Anda bisa menggunakan kode berikut: >> qqnorm (beaver2 $ temp [beaver2 $ activ == 0], main = "tidak aktif")> qqline (beaver2 $ temp [beaver2 $ activ == 0])
Anda dapat melakukan hal yang sama untuk periode aktif dengan mengubah nilai 0 menjadi 1.