Video: Top 10 Excel New Features 2024
Dalam menganalisis data untuk infografis Anda, Anda harus sadar bahwa beberapa titik data - yang dikenal sebagai outlier - terletak jauh di luar norma untuk Perhatian perhatian pada diri mereka sendiri. Dalam kasus yang paling parah, mereka bahkan bisa mengurangi data dan membuat gambar subjek yang menyesatkan. Anda perlu mengenali kapan Anda memiliki outlier dan kemudian memutuskan apa yang harus dilakukan mengenai hal itu.
Tabel ini berisi contoh sederhana untuk menunjukkan ide ini. Dua dataset tersebut mewakili nilai siswa, selama delapan minggu, dalam dua ujian mingguan; jumlahnya adalah persentase yang benar pada ujian. Dataset di sebelah kiri (ujian pertama) tidak berisi outlier, namun dataset di sebelah kanan (ujian kedua) tidak. Satu outlier ditampilkan dalam huruf tebal.
Minggu | Kelas (tidak ada outlier) | Kelas (satu outlier) |
---|---|---|
1 | 90% | 90% |
2 | 88% | 88% |
3 | 90% | 90% |
4 | 85% | 50% |
5 | 86% | 86% |
6 | 87% | 87% |
7 | 85% | 85% |
8 | 84% | 84% |
Rata-rata > 87% | 83% |
|
Apa yang dilakukan jurnalis data dalam kasus seperti itu? Berikut adalah beberapa pilihan:
Buang outlier.
-
Jika hanya menggunakan grafik rata-rata dan khawatir bahwa itu menyesatkan, hilangkan outlier sebagai penyimpangan dan kemudian hitung rata-rata tanpa minggu itu, seperti yang ditunjukkan pada gambar.
Jika Anda memilih opsi ini, pastikan untuk menambahkan catatan kaki yang menjelaskan semuanya: dalam kasus ini, penghapusan titik data. Selalu setransparan mungkin.
Tampilkan data as-is.
-
Apakah Anda hanya menggunakan rata-rata dalam grafik atau merencanakan semua data dalam grafik, Anda selalu dapat menyajikan data persis seperti yang ada pada Anda, seperti yang ditunjukkan pada gambar berikut. Dalam kasus ini, Anda harus menambahkan catatan kaki yang memanggil outlier agar pembaca Anda benar-benar menyadarinya.
Buatlah "garis yang paling sesuai. "
-
Opsi ini berlaku hanya jika Anda ingin membuat bagan yang menunjukkan semua data. Garis yang paling sesuai - juga disebut regresi linear - adalah rata-rata visual data Anda: secara harfiah garis yang mewakili titik data Anda yang paling banyak tersebar.