Rumah Keuangan Pribadi Keterbatasan Data dalam Prediktif Analytics - dummies

Keterbatasan Data dalam Prediktif Analytics - dummies

Video: Cara menghilangkan saran kata di keyboard vivo 2025

Video: Cara menghilangkan saran kata di keyboard vivo 2025
Anonim

Seperti banyak aspek sistem bisnis lainnya, data adalah ciptaan manusia - jadi cenderung memiliki batasan pada kegunaannya saat pertama kali dapatkan itu Berikut adalah ikhtisar beberapa keterbatasan yang mungkin Anda hadapi:

  • Data tidak lengkap. Nilai yang hilang, bahkan kekurangan bagian atau sebagian besar data, dapat membatasi kegunaannya.

    Misalnya, data Anda mungkin hanya mencakup satu atau dua kondisi dari kumpulan yang lebih besar yang ingin Anda model - seperti saat model yang dibuat untuk menganalisis kinerja pasar saham hanya memiliki data yang tersedia dari 5 tahun terakhir, yang mengalahkan keduanya data dan model terhadap asumsi pasar bull.

    Saat pasar mengalami koreksi yang mengarah ke pasar beruang, model gagal menyesuaikan diri - hanya karena tidak dilatih dan diuji dengan data yang mewakili pasar beruang.

    Pastikan Anda melihat kerangka waktu yang memberi gambaran lengkap tentang fluktuasi data Anda secara alami; data Anda tidak boleh dibatasi oleh seasonality .

  • Jika Anda menggunakan data dari survei, ingatlah bahwa orang tidak selalu memberikan informasi yang akurat. Tidak semua orang akan menjawab dengan jujur ​​tentang (katakanlah) berapa kali mereka berolahraga - atau berapa banyak minuman beralkohol yang mereka konsumsi - per minggu. Orang mungkin tidak jujur ​​sama sadar diri, tapi datanya masih miring.

  • Data yang dikumpulkan dari berbagai sumber dapat bervariasi dalam kualitas dan format. Data dikumpulkan dari berbagai sumber seperti survei, e-mail, formulir pemasukan data, dan situs perusahaan akan memiliki atribut dan struktur yang berbeda. Data dari berbagai sumber mungkin tidak memiliki banyak kesesuaian antara bidang data. Data semacam itu memerlukan preprocessing besar sebelum analisisnya siap. Sidebar yang menyertainya memberikan contoh.

Data yang dikumpulkan dari berbagai sumber mungkin memiliki perbedaan format, catatan duplikat, dan inkonsistensi di seluruh data gabungan. Berharap untuk menghabiskan waktu lama membersihkan data tersebut - dan bahkan lebih lama memvalidasi keandalannya.

Untuk menentukan keterbatasan data Anda, pastikan untuk:

  • Verifikasi semua variabel yang akan Anda gunakan dalam model Anda.

  • Menilai cakupan data, terutama dari waktu ke waktu, sehingga model Anda dapat menghindari perangkap musiman.

  • Periksa nilai yang hilang, kenali mereka, dan tilai dampaknya terhadap keseluruhan analisis.

  • Hati-hati dengan nilai ekstrim (outlier) dan putuskan apakah memasukkannya ke dalam analisis.

  • Konfirmasikan bahwa kumpulan data pelatihan dan pengujian cukup besar.

  • Pastikan tipe data (bilangan bulat, nilai desimal, atau karakter, dan sebagainya) benar dan tetapkan batas atas dan bawah dari nilai yang mungkin.

  • Perhatian ekstra pada integrasi data saat data Anda berasal dari berbagai sumber.

Pastikan Anda memahami sumber data dan pengaruhnya terhadap keseluruhan kualitas data Anda.

  • Pilih dataset yang relevan yang mewakili seluruh populasi.

  • Pilih parameter yang tepat untuk analisis Anda.

Bahkan setelah semua perawatan dan perhatian ini, jangan heran jika data Anda masih perlu preprocessing sebelum Anda bisa menganalisisnya secara akurat. Preprocessing sering membutuhkan waktu lama dan usaha yang signifikan karena harus menangani beberapa masalah yang berkaitan dengan data asli - masalah ini meliputi:

  • Setiap nilai yang hilang dari data.

  • Ketidakkonsistenan dan / atau kesalahan yang ada dalam data.

  • Setiap duplikat atau outlier dalam data.

  • Normalisasi atau transformasi data lainnya.

  • Data turunan yang dibutuhkan untuk analisis.

Keterbatasan Data dalam Prediktif Analytics - dummies

Pilihan Editor

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Sementara ada cara baru untuk membuat tabel di Office 2011 untuk Mac, Anda masih bisa menggunakan teknik stand-by. Menu yang familiar masih bekerja di Office 2011 untuk Mac, dan inilah buktinya. Dialog meja semuanya masih ada di sana: Di Word, pilih Table → Insert → Table; Sebagai alternatif, pada tab Tabel Ribbon, di Tabel Pilihan ...

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Apakah Anda menggunakan Office 2011 untuk Mac atau Produk Microsoft Office lainnya, toolbar Anda bisa sangat berantakan. Setiap kali Anda merasa perlu untuk men-tweak antarmuka aplikasi Microsoft Office, Anda perlu memanggil dialog Customize Toolbars and Menus. Ini adalah dialog super kuat di Word, Excel, dan PowerPoint yang memungkinkan Anda ...

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Setelah Anda menyesuaikan Office 2011 Anda bilah alat dan antarmuka, Anda dapat berbagi penyesuaian dengan orang lain. Namun, pastikan bahwa Anda menasihati orang-orang yang telah Anda lakukan sebelum membagikan dokumen Anda dengannya; Jika tidak, mereka mungkin akan terkejut saat mereka membuka dokumen Anda dan melihat susunan toolbar atau menu yang berbeda dari pada apa ...

Pilihan Editor

Penting Office 2007 Commands - dummies

Penting Office 2007 Commands - dummies

Anda dapat membuat program Office 2007 lebih mudah jika Anda menggunakan pintasan sederhana ini. Perintah-perintah ini, seperti mengurungkan kesalahan dan memperbesar dan memperkecil akan membantu Anda menghemat waktu. Memasuki simbol: Untuk memasukkan simbol atau karakter asing yang tidak ada pada keyboard Anda, masuk ke tab Insert dan klik Symbol ...

Menyesuaikan Perintah Menu di Office 2003 - dummies

Menyesuaikan Perintah Menu di Office 2003 - dummies

Office 2003 menyediakan dua teknik untuk menyesuaikan menu dan perintah menu. Anda bisa memulai dari kotak dialog Rearrange Commands atau menggunakan metode drag-and-drop. Teruslah membaca. Menangani perintah menu di kotak dialog Rearrange Commands Teknik tombol Options Toolbar untuk menangani tombol toolbar bagus dan keren, tapi bagaimana jika Anda ingin ...

Pilihan Editor

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Ketika Anda menjawab Argument Analysis Pertanyaan di GRE, argumen mungkin tampak logis dan adil di permukaan tapi sebenarnya keliru (keliru, cacat). Alasan melingkar, penalaran sebab-akibat yang keliru, dan generalisasi sweeping adalah tiga tanda argumen lemah. Dengan melihat beberapa kesalahan logis yang lebih umum, Anda dapat mengidentifikasi kelemahan dalam argumen dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Meskipun pertanyaan matematika biasanya hanya memiliki satu jawaban yang benar, ini tidak selalu terjadi. Akibatnya, beberapa pertanyaan pilihan ganda pada tes GRE Math akan memberi Anda daftar jawaban dan meminta Anda untuk memilih lebih dari satu. Pertanyaan praktik berikut meminta Anda untuk menemukan nilai kemungkinan yang berbeda secara berurutan dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pada tes GRE Verbal, beberapa pertanyaan pilihan ganda akan memiliki lebih dari satu jawaban yang benar. Untuk pertanyaan ini, Anda akan diminta untuk melihat-lihat pilihan jawaban dan memilih semua yang menurut Anda benar. Dalam pertanyaan praktik berikut, Anda diminta untuk membaca bagian yang disertakan, dan kemudian ...