Rumah Keuangan Pribadi Keterbatasan Data dalam Prediktif Analytics - dummies

Keterbatasan Data dalam Prediktif Analytics - dummies

Video: Cara menghilangkan saran kata di keyboard vivo 2024

Video: Cara menghilangkan saran kata di keyboard vivo 2024
Anonim

Seperti banyak aspek sistem bisnis lainnya, data adalah ciptaan manusia - jadi cenderung memiliki batasan pada kegunaannya saat pertama kali dapatkan itu Berikut adalah ikhtisar beberapa keterbatasan yang mungkin Anda hadapi:

  • Data tidak lengkap. Nilai yang hilang, bahkan kekurangan bagian atau sebagian besar data, dapat membatasi kegunaannya.

    Misalnya, data Anda mungkin hanya mencakup satu atau dua kondisi dari kumpulan yang lebih besar yang ingin Anda model - seperti saat model yang dibuat untuk menganalisis kinerja pasar saham hanya memiliki data yang tersedia dari 5 tahun terakhir, yang mengalahkan keduanya data dan model terhadap asumsi pasar bull.

    Saat pasar mengalami koreksi yang mengarah ke pasar beruang, model gagal menyesuaikan diri - hanya karena tidak dilatih dan diuji dengan data yang mewakili pasar beruang.

    Pastikan Anda melihat kerangka waktu yang memberi gambaran lengkap tentang fluktuasi data Anda secara alami; data Anda tidak boleh dibatasi oleh seasonality .

  • Jika Anda menggunakan data dari survei, ingatlah bahwa orang tidak selalu memberikan informasi yang akurat. Tidak semua orang akan menjawab dengan jujur ​​tentang (katakanlah) berapa kali mereka berolahraga - atau berapa banyak minuman beralkohol yang mereka konsumsi - per minggu. Orang mungkin tidak jujur ​​sama sadar diri, tapi datanya masih miring.

  • Data yang dikumpulkan dari berbagai sumber dapat bervariasi dalam kualitas dan format. Data dikumpulkan dari berbagai sumber seperti survei, e-mail, formulir pemasukan data, dan situs perusahaan akan memiliki atribut dan struktur yang berbeda. Data dari berbagai sumber mungkin tidak memiliki banyak kesesuaian antara bidang data. Data semacam itu memerlukan preprocessing besar sebelum analisisnya siap. Sidebar yang menyertainya memberikan contoh.

Data yang dikumpulkan dari berbagai sumber mungkin memiliki perbedaan format, catatan duplikat, dan inkonsistensi di seluruh data gabungan. Berharap untuk menghabiskan waktu lama membersihkan data tersebut - dan bahkan lebih lama memvalidasi keandalannya.

Untuk menentukan keterbatasan data Anda, pastikan untuk:

  • Verifikasi semua variabel yang akan Anda gunakan dalam model Anda.

  • Menilai cakupan data, terutama dari waktu ke waktu, sehingga model Anda dapat menghindari perangkap musiman.

  • Periksa nilai yang hilang, kenali mereka, dan tilai dampaknya terhadap keseluruhan analisis.

  • Hati-hati dengan nilai ekstrim (outlier) dan putuskan apakah memasukkannya ke dalam analisis.

  • Konfirmasikan bahwa kumpulan data pelatihan dan pengujian cukup besar.

  • Pastikan tipe data (bilangan bulat, nilai desimal, atau karakter, dan sebagainya) benar dan tetapkan batas atas dan bawah dari nilai yang mungkin.

  • Perhatian ekstra pada integrasi data saat data Anda berasal dari berbagai sumber.

Pastikan Anda memahami sumber data dan pengaruhnya terhadap keseluruhan kualitas data Anda.

  • Pilih dataset yang relevan yang mewakili seluruh populasi.

  • Pilih parameter yang tepat untuk analisis Anda.

Bahkan setelah semua perawatan dan perhatian ini, jangan heran jika data Anda masih perlu preprocessing sebelum Anda bisa menganalisisnya secara akurat. Preprocessing sering membutuhkan waktu lama dan usaha yang signifikan karena harus menangani beberapa masalah yang berkaitan dengan data asli - masalah ini meliputi:

  • Setiap nilai yang hilang dari data.

  • Ketidakkonsistenan dan / atau kesalahan yang ada dalam data.

  • Setiap duplikat atau outlier dalam data.

  • Normalisasi atau transformasi data lainnya.

  • Data turunan yang dibutuhkan untuk analisis.

Keterbatasan Data dalam Prediktif Analytics - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...