Daftar Isi:
- Perataan data beroperasi dengan beberapa asumsi:
- Perataan data tidak menjadi bingung dengan model pemasangan ,
Video: Vivo Y81 keyboard Settings ! 2024
Perataan data pada analisis prediktif pada dasarnya, mencoba menemukan "sinyal" pada "noise" oleh membuang data poin yang dianggap "ribut". Idenya adalah untuk mempertajam pola dalam data dan menyoroti tren yang sedang ditunjukkan data. Implikasi di balik perataan data adalah bahwa data terdiri dari dua bagian: satu bagian (terdiri dari titik data inti
) yang menandakan tren keseluruhan atau tren nyata, dan bagian lain yang sebagian besar terdiri dari penyimpangan (99,9> noise ) - beberapa titik berfluktuasi yang diakibatkan oleh beberapa volatilitas dalam data. Smoothing data berusaha menghilangkan bagian kedua.
Perataan data beroperasi dengan beberapa asumsi:
Fluktuasi data kemungkinan besar akan menjadi kebisingan.
-
Bahwa bagian data yang bising berdurasi pendek.
-
Bahwa fluktuasi data, terlepas dari seberapa beragamnya, tidak akan mempengaruhi tren mendasar yang ditunjukkan oleh titik data inti.
-
Kebisingan dalam data cenderung acak; Fluktuasinya seharusnya tidak mempengaruhi keseluruhan tren yang ditarik dari memeriksa sisa data. Jadi mengurangi atau menghilangkan titik data yang bising dapat memperjelas tren dan pola nyata dalam data - yang berlaku, memperbaiki rasio "signal-to-noise" data. "
Perataan data menyangkut dirinya sendiri dengan sebagian besar titik data, posisi mereka dalam grafik, dan apa pola yang dihasilkannya memprediksi tentang kecenderungan umum (katakanlah) harga saham, apakah arahan umumnya naik, turun, atau miring..
Perkiraan berdasarkan kecenderungan umum yang disimpulkan dari data yang merapikan mengasumsikan bahwa arah apa pun yang diikuti data sejauh ini akan berlanjut ke masa depan dengan cara yang sesuai dengan tren. Di pasar saham, misalnya, kinerja masa lalu bukanlah indikasi pasti kinerja masa depan, namun pastinya bisa menjadi panduan umum pergerakan harga saham ke depan.
Metode, kelebihan, dan kekurangan perataan data
Perataan data tidak menjadi bingung dengan model pemasangan,
yang merupakan bagian dari analisis data yang terdiri dari dua langkah: Temukan yang sesuai model yang mewakili data. Pastikan model sesuai dengan data secara efektif.
-
Perataan data berfokus pada penetapan arah fundamental untuk titik data inti dengan (1) mengabaikan titik data yang bising dan (2) menggambar kurva yang lebih halus melalui titik data yang melompati yang menggeliat dan menekankan pola utama - tren - dalam data, tidak peduli seberapa lambat kemunculan mereka. Dengan demikian, dalam rangkaian waktu numerik, perataan data berfungsi sebagai bentuk penyaringan.
-
Perataan data dapat menggunakan salah satu dari metode berikut:
Random walk
didasarkan pada gagasan bahwa hasil berikutnya, atau titik data masa depan, adalah penyimpangan acak dari titik data terakhir yang diketahui atau sekarang.
-
Rata-rata pergerakan adalah rata-rata berjalan berturut-turut, periode sama dengan spasi. Contohnya adalah perhitungan rata-rata pergerakan harga 200 hari dari harga saham.
-
Eksponensial smoothing memberi bobot, atau kepentingan secara eksponensial lebih besar, ke titik data terkini daripada titik data yang lebih tua.
-
Sederhana: Metode ini harus digunakan bila data deret waktu tidak memiliki tren dan tidak musiman.
-
Linear: Metode ini harus digunakan bila data deret waktu memiliki garis tren.
-
Musiman: Metode ini harus digunakan saat data deret waktu tidak memiliki tren tapi musiman.
-
Apa metode pemulusan semua memiliki kesamaan adalah bahwa mereka melakukan semacam proses rata-rata pada beberapa titik data. Rata-rata dari titik data yang berdekatan adalah cara penting untuk mengurangi tren atau pola yang mendasarinya. Kelebihan perataan data
-
mudah diterapkan.
Ini membantu mengidentifikasi tren.
-
Ini membantu mengekspos pola pada data.
-
Ini menghilangkan poin data yang telah Anda putuskan tidak menarik.
-
Ini membantu memprediksi arah umum dari titik data yang diamati berikutnya.
-
Ini menghasilkan grafik halus yang bagus.
-
Tapi semuanya memiliki sisi negatifnya. Kelemahan dari perataan data adalah
-
Ini mungkin menghilangkan poin data yang valid yang dihasilkan dari peristiwa ekstrem.
Hal ini dapat menyebabkan prediksi yang tidak akurat jika data uji hanya bersifat musiman dan tidak sepenuhnya mewakili kenyataan yang menghasilkan titik data.
-
Ini bisa menggeser atau membelokkan data, terutama puncaknya, sehingga menghasilkan gambaran yang menyimpang tentang apa yang sedang terjadi.
-
Mungkin rentan terhadap gangguan yang signifikan dari outlier dalam data.
-
Ini bisa menghasilkan penyimpangan besar dari data asli.
-
Jika perataan data tidak lebih dari sekedar memberi data facelift saja, itu bisa menjadi salah secara mendasar dengan cara berikut:
-
Hal ini dapat mengenalkan kesalahan melalui distorsi yang mengobati data yang merapikan seolah-olah identik dengan aslinya. data.
Dapat mengabaikan interpretasi dengan mengabaikan - dan bersembunyi - risiko tertanam di dalam data.
-
Hal ini dapat menyebabkan hilangnya detail dalam data Anda - yang merupakan salah satu cara agar kurva merapikan dapat sangat menyimpang dari data asli.
-
Seberapa serius perataan data dapat mempengaruhi data Anda bergantung pada sifat data yang ada, dan teknik pemulusan yang diterapkan pada data tersebut.Misalnya, jika data asli memiliki lebih banyak puncak di dalamnya, maka perataan data akan menyebabkan pergeseran besar dari puncak pada grafik yang dihaluskan - kemungkinan besar distorsi.
-
Berikut adalah beberapa poin peringatan yang harus diingat saat Anda mendekati perataan data:
Sebaiknya bandingkan grafik merapikan ke grafik tersentuh yang memplot data asli.
Titik-titik data yang dihapus selama perataan data mungkin bukan suara; mereka bisa saja valid, poin data nyata yang dihasilkan dari kejadian langka tapi nyata.
-
Perataan data dapat membantu dalam jumlah sedikit, namun penggunaan berlebihan dapat menyebabkan keliru data Anda.
-
Dengan menerapkan penilaian profesional dan keahlian pengetahuan bisnis Anda, Anda dapat menggunakan perataan data secara efektif. Menghapus suara dari data Anda - tanpa mempengaruhi keakuratan dan kegunaan data asli - setidaknya sama dengan seni sebagai sains.