Video: Digital Inside: Tren Big Data #2 2024
Anda memiliki dataset dan Anda telah memformatnya agar sesuai dengan kebutuhan Anda. di R, jadi sekarang Anda siap untuk pekerjaan sebenarnya. Menganalisis data Anda selalu dimulai dengan menjelaskannya. Dengan cara ini Anda bisa mendeteksi kesalahan dalam data, dan Anda bisa menentukan model mana yang tepat untuk mendapatkan informasi yang Anda butuhkan dari data yang Anda miliki.
Statistik deskriptif mana yang Anda gunakan bergantung pada sifat data Anda, tentu saja.
Terkadang Anda lebih tertarik pada gambaran umum data Anda daripada nilai individual Anda. Anda mungkin tidak tertarik dengan jarak tempuh setiap mobil, namun dalam jarak tempuh rata-rata semua mobil dari kumpulan data tersebut. Untuk ini, Anda menghitung mean dengan menggunakan mean () fungsi, seperti ini: >> mean (cars $ mpg) [1] 20. 09062
Anda juga bisa menghitung jumlah silinder rata-rata yang dimiliki mobil tersebut, namun ini tidak benar-benar masuk akal Rata-rata akan menjadi 6. 1875 silinder, dan tidak ada mobil yang berkendara dengan silinder yang tidak lengkap. Dalam hal ini, median
- nilai paling utama dalam data Anda - lebih masuk akal. Anda mendapatkan median dari menggunakan fungsi median (), seperti ini: