Video: My Friend Irma: The Red Hand / Billy Boy, the Boxer / The Professor's Concerto 2024
Pastikan Anda memeriksa dengan seksama outlier sebelum mereka mempengaruhi analisis prediktif Anda. Outlier dapat mendistorsi data dan analisis data. Sebagai contoh, setiap analisis statistik yang dilakukan dengan data yang menyisakan outlier di tempat berakhir dengan meniru cara dan varians.
Pencantuman yang tidak diperiksa atau disalahartikan dapat menyebabkan kesimpulan salah. Katakanlah data Anda yang menunjukkan bahwa saham yang diperdagangkan sepanjang tahun dengan harga di atas $ 50 - namun hanya beberapa menit dari keseluruhan tahun, saham tersebut diperdagangkan pada harga $ 20. Harga $ 20 - pengecualian yang jelas - adalah outlier dalam dataset ini.
Sekarang Anda harus memutuskan apakah memasukkan harga saham $ 20 dalam analisis Anda; Jika Anda melakukannya, itu memiliki konsekuensi untuk keseluruhan model. Tapi apa yang anda anggap normal? Apakah & ldquo; flash crash & rdquo; yang mengejutkan pasar saham pada 6 Mei 2010, sebuah kejadian normal atau pengecualian?
Selama waktu yang singkat, pasar saham mengalami penurunan tajam dalam harga di seluruh dewan - yang mengetuk harga saham sampel turun dari $ 50 menjadi $ 20, namun tidak ada hubungannya dengan saham dibandingkan dengan kondisi pasar yang lebih luas. Apakah model Anda perlu memperhitungkan fluktuasi pasar saham yang lebih besar?
Siapa pun yang kehilangan uang pada saat singkat pasar bebas jatuh mempertimbangkan beberapa menit yang sebenarnya dan normal (bahkan jika mereka merasa seperti keabadian untuk melewatinya). Portofolio yang berkurang dalam milidetik karena penurunan yang cepat, meski berumur pendek, jelas nyata. Namun flash crash adalah anomali, outlier yang menimbulkan masalah bagi model.
Terlepas dari apa yang dianggap normal (yang dapat berubah pula), data terkadang berisi nilai yang tidak sesuai dengan nilai yang diharapkan. Hal ini terutama berlaku di pasar saham, di mana hampir semua peristiwa dapat menyebabkan pasar terbang atau terjun. Anda tidak ingin model Anda gagal saat kenyataan berubah secara tiba-tiba - namun sebuah model dan kenyataan adalah dua hal yang berbeda.