Daftar Isi:
- Yang signifikan tidak selalu berarti penting
- Bila mencoba memasukkan model regresi ke scatterplot, godaannya adalah segera menggunakan garis. Ini adalah model regresi yang paling sesuai, dan bila Anda memahaminya, lereng dan penyadapan tidak terlalu menakutkan.
- Apakah Anda bekerja dengan regresi linier atau regresi curvilinear, ingatlah bahwa tidak tepat untuk menggeneralisasi melampaui batas scatterplot.
- Analisis residu yang cermat (perbedaan antara nilai yang diamati dan yang diperkirakan) dapat memberi tahu Anda banyak tentang seberapa baik garis itu sesuai dengan data. Asumsi dasar adalah bahwa variabilitas di sekitar garis regresi sama di atas dan di bawah garis.Jika tidak, modelnya mungkin tidak seperti prediksi seperti yang Anda pikirkan. Jika variabilitasnya sistematis (variabilitas yang lebih besar pada satu ujung daripada yang lain), regresi lengkung mungkin lebih tepat daripada linier. Kesalahan standar estimasi tidak akan selalu menjadi indikatornya.
- Percaya atau tidak, ini kadang terjadi dengan koefisien korelasi. Sampel yang sangat besar dapat membuat koefisien korelasi kecil secara statistik signifikan.
- Saat melihat grafik, pastikan Anda tahu apa yang ada di masing-masing sumbu. Pastikan Anda memahami satuan ukuran. Apakah Anda mengerti variabel independen? Apakah Anda mengerti variabel dependen? Dapatkah Anda menjelaskan masing-masing kata Anda sendiri? Jika jawaban atas pertanyaan-pertanyaan ini adalah "Tidak," Anda tidak mengerti grafik yang Anda lihat.
- Jadi Anda hampir siap untuk bersaing di Rock-Paper-Scissors World Series. Dalam persiapan untuk turnamen internasional ini, Anda telah menghitung semua kecocokan Anda dari sepuluh tahun terakhir, mencantumkan persentase waktu yang Anda menangkan saat memainkan setiap peran.
- Bila titik dalam grafik mewakili alat, pastikan grafik tersebut menyertakan kesalahan standar masing-masing mean.Ini memberi pemirsa gambaran variabilitas dalam data - yang merupakan aspek penting dari data.
- Jika Anda serius melakukan pekerjaan statistik, Anda mungkin punya kesempatan untuk melihat teks statistik atau dua teks statistik. Ingatlah bahwa simbol di beberapa area statistik tidak standar.
Video: Statistical Programming with R by Connor Harris 2024
Dunia statistik penuh dengan jebakan, tapi juga penuh dengan peluang. Entah Anda pengguna statistik atau seseorang yang harus menafsirkannya, kemungkinan terjerumus ke dalam perangkap. Mungkin juga berjalan di sekitar mereka. Berikut adalah sepuluh tip dan jebakan dari bidang pengujian hipotesis, regresi, korelasi, dan grafik.
Yang signifikan tidak selalu berarti penting
Signifikansi adalah, dalam banyak hal, istilah yang dipilih dengan buruk. Bila uji statistik menghasilkan hasil yang signifikan, dan keputusannya adalah menolak H 0 , yang tidak menjamin bahwa studi di balik data itu penting. Statistik hanya dapat membantu pengambilan keputusan tentang angka dan kesimpulan tentang proses yang menghasilkannya. Mereka tidak bisa membuat proses itu penting atau menghancurkan bumi. Pentingnya adalah sesuatu yang harus Anda jangkau sendiri - dan tidak ada uji statistik yang dapat melakukannya untuk Anda.
Bila mencoba memasukkan model regresi ke scatterplot, godaannya adalah segera menggunakan garis. Ini adalah model regresi yang paling sesuai, dan bila Anda memahaminya, lereng dan penyadapan tidak terlalu menakutkan.
Tetapi regresi linier bukanlah satu-satunya jenis regresi. Mungkin cocok dengan kurva melalui scatterplot. Jangan terkecoh: Konsep statistik dibalik regresi curvilinear lebih sulit dipahami daripada konsep dibalik regresi linier.
Mengekstrapolasi di luar sampel scatterplot adalah ide yang buruk
Apakah Anda bekerja dengan regresi linier atau regresi curvilinear, ingatlah bahwa tidak tepat untuk menggeneralisasi melampaui batas scatterplot.
Misalkan Anda telah membuat hubungan prediktif yang solid antara tes kemampuan matematika dan kinerja dalam kursus matematika, dan scatterplot Anda hanya mencakup rentang kemampuan matematika yang sempit. Anda tidak memiliki cara untuk mengetahui apakah hubungan tersebut bertahan melebihi rentang tersebut. Prediksi di luar rentang tersebut tidak valid.
Periksa variabilitas di sekitar garis regresi
Analisis residu yang cermat (perbedaan antara nilai yang diamati dan yang diperkirakan) dapat memberi tahu Anda banyak tentang seberapa baik garis itu sesuai dengan data. Asumsi dasar adalah bahwa variabilitas di sekitar garis regresi sama di atas dan di bawah garis.Jika tidak, modelnya mungkin tidak seperti prediksi seperti yang Anda pikirkan. Jika variabilitasnya sistematis (variabilitas yang lebih besar pada satu ujung daripada yang lain), regresi lengkung mungkin lebih tepat daripada linier. Kesalahan standar estimasi tidak akan selalu menjadi indikatornya.
Sampel bisa terlalu besar
Percaya atau tidak, ini kadang terjadi dengan koefisien korelasi. Sampel yang sangat besar dapat membuat koefisien korelasi kecil secara statistik signifikan.
Tapi apa arti koefisien korelasi itu? Koefisien determinasi -r
2 - benar saja. 038, artinya SS Regression kurang dari 4 persen SS Total . Itu asosiasi yang sangat kecil. Intinya: Saat melihat koefisien korelasi, perhatikan ukuran sampel. Jika cukup besar, bisa membuat asosiasi sepele ternyata signifikan secara statistik. (Hmmm …
signifikansi - itu dia lagi!) Konsumen: Ketahui sumbu Anda
Saat melihat grafik, pastikan Anda tahu apa yang ada di masing-masing sumbu. Pastikan Anda memahami satuan ukuran. Apakah Anda mengerti variabel independen? Apakah Anda mengerti variabel dependen? Dapatkah Anda menjelaskan masing-masing kata Anda sendiri? Jika jawaban atas pertanyaan-pertanyaan ini adalah "Tidak," Anda tidak mengerti grafik yang Anda lihat.
Jadi Anda hampir siap untuk bersaing di Rock-Paper-Scissors World Series. Dalam persiapan untuk turnamen internasional ini, Anda telah menghitung semua kecocokan Anda dari sepuluh tahun terakhir, mencantumkan persentase waktu yang Anda menangkan saat memainkan setiap peran.
Untuk meringkas semua hasil, gunakan kemampuan grafis Excel untuk membuat grafik.
Sederhananya, grafik garis bukanlah grafik yang tepat bila setidaknya satu dari variabel Anda adalah sekumpulan kategori. Sebagai gantinya, buat grafik kolom. Diagram lingkaran juga bekerja di sini, karena datanya adalah persentase dan Anda hanya memiliki sedikit irisan.
Kapan pun sesuai, sertakan variabilitas dalam grafik
Bila titik dalam grafik mewakili alat, pastikan grafik tersebut menyertakan kesalahan standar masing-masing mean.Ini memberi pemirsa gambaran variabilitas dalam data - yang merupakan aspek penting dari data.
Berarti sendiri tidak selalu menceritakan keseluruhan ceritanya. Ambillah setiap kesempatan untuk memeriksa varians dan standar deviasi. Anda mungkin menemukan beberapa nugget tersembunyi. Variasi sistematis - nilai varians tinggi yang terkait dengan sarana besar, misalnya - mungkin merupakan petunjuk tentang hubungan yang tidak Anda lihat sebelumnya.
Hati-hati saat menghubungkan konsep teks teks statistik ke Excel
Jika Anda serius melakukan pekerjaan statistik, Anda mungkin punya kesempatan untuk melihat teks statistik atau dua teks statistik. Ingatlah bahwa simbol di beberapa area statistik tidak standar.
Menghubungkan konsep buku teks ke fungsi statistik Excel bisa menjadi tantangan karena teks dan karena Excel. Pesan di kotak dialog dan pada file Help mungkin berisi simbol selain yang Anda baca, atau mungkin juga menggunakan simbol yang sama namun dengan cara yang berbeda. Perbedaan ini mungkin membawa Anda untuk membuat entri yang salah ke parameter di kotak dialog, sehingga menghasilkan kesalahan yang sulit dilacak.