Video: 5 kesalahan sederhana penyebab ac cepet rusak 2024
Bila Anda mengandalkan teknologi atau instrumentasi untuk melakukan tugas analisis prediktif, kesalahan di sini atau di sana dapat menyebabkan instrumen ini mendaftarkan nilai ekstrim atau tidak biasa. Jika sensor mendaftarkan nilai pengamatan yang gagal memenuhi standar kontrol kualitas dasar, mereka dapat menghasilkan gangguan nyata yang tercermin dalam data.
Seseorang yang melakukan entri data, misalnya, dapat dengan mudah menambahkan tambahan 0 pada akhir sebuah nilai secara tidak sengaja, mengeluarkan arus keluar dari jangkauan dan menghasilkan outlier.
Jika Anda melihat data pengamatan yang dikumpulkan oleh sensor air yang dipasang di Pelabuhan Baltimore - dan laporan kedalaman air 20 kaki di atas permukaan laut rata - Anda memiliki outlier. Sensor ini jelas salah kecuali Baltimore benar-benar tertutup oleh air.
Data dapat berakhir dengan outlier karena kejadian eksternal atau kesalahan oleh seseorang atau instrumen.
Jika kejadian nyata seperti kecelakaan kilat dilacak pada kesalahan di sistem, konsekuensinya masih nyata - tetapi jika Anda mengetahui sumber masalahnya, Anda dapat menyimpulkan bahwa kekurangan pada data, bukan model Anda, harus disalahkan jika model Anda tidak memprediksi kejadian tersebut.
Mengetahui sumber outlier akan memandu keputusan Anda tentang bagaimana mengatasinya. Outlier yang merupakan hasil kesalahan entri data dapat dikoreksi dengan mudah setelah berkonsultasi dengan sumber data. Outliers yang mencerminkan kenyataan perubahan dapat meminta Anda untuk mengubah model Anda.
Tidak ada jawaban seukuran satu sama lain saat Anda memutuskan apakah akan menyertakan atau mengabaikan data ekstrem yang bukan merupakan kesalahan atau kesalahan. Tanggapan Anda bergantung pada sifat analisis yang Anda lakukan - dan jenis model yang sedang Anda bangun. Dalam beberapa kasus, cara untuk mengatasi outlier itu sangat mudah:
-
Jika Anda melacak outlier Anda ke kesalahan entri data saat Anda berkonsultasi dengan sumber data, Anda dapat dengan mudah memperbaiki data dan (mungkin) menjaga agar model tetap utuh.
-
Jika sensor air di Baltimore Harbor melaporkan air sampai kedalaman 20 kaki di atas permukaan laut rata-rata, dan Anda berada di Baltimore, melihat ke luar jendela Anda:
-
Jika Baltimore tidak sepenuhnya tertutup oleh air, sensor jelas salah
-
Jika Anda melihat seekor ikan melihat Anda, kenyataannya telah berubah; Anda mungkin harus merevisi model Anda.
-
-
Kecelakaan lampu kilat mungkin merupakan kejadian satu kali (hanya dalam jangka pendek), namun pengaruhnya nyata - dan jika Anda telah mempelajari pasar dalam jangka panjang, Anda tahu bahwa hal serupa dapat terjadi lagi..Jika bisnis Anda ada di bidang keuangan dan Anda selalu berurusan dengan pasar saham, Anda ingin model Anda memperhitungkan penyimpangan semacam itu.
Secara umum, jika hasil sebuah acara yang biasanya dianggap outlier dapat memberi dampak signifikan pada bisnis Anda, pertimbangkan bagaimana menangani kejadian-kejadian dalam analisis Anda. Ingatlah hal-hal umum ini tentang outlier:
-
Dataset yang lebih kecil adalah, semakin signifikan dampak yang dapat dihasilkan oleh analisis pada analisis.
-
Saat mengembangkan model Anda, pastikan Anda juga mengembangkan teknik untuk menemukan outlier dan untuk secara sistematis memahami dampaknya terhadap bisnis Anda.
-
Mendeteksi outlier bisa menjadi proses yang kompleks; tidak ada cara sederhana untuk mengidentifikasi mereka.
-
Pakar domain (seseorang yang mengetahui bidang pemodelan Anda) adalah orang masuk terbaik Anda untuk memverifikasi apakah titik data valid, outlier yang dapat Anda abaikan, atau outlier yang Anda miliki untuk memperhitungkan. Pakar domain harus bisa menjelaskan faktor apa saja yang menciptakan outlier, apa variabilitas variasinya, dan dampaknya terhadap bisnis.
-
Alat visualisasi dapat membantu Anda melihat data outlier dalam data. Juga, jika Anda mengetahui kisaran nilai yang diharapkan, Anda dapat dengan mudah mengajukan kueri untuk data yang berada di luar jangkauan tersebut.