Video: Pertanyaan yang Sering Keluar dalam Sidang Skripsi (HASIL CUMLAUDE!!!) 2024
Penambangan data dilakukan dengan trial and error, dan karena itu, untuk penambang data, membuat kesalahan hanya alami saja. Kesalahan bisa berharga, dengan kata lain, setidaknya dalam kondisi tertentu. Tidak semua kesalahan diciptakan sama. Ada yang lebih baik dihindari. Daftar berikut menawarkan sepuluh kesalahan seperti itu. Jika Anda membacanya dengan hati-hati, dan memberikannya pada ingatan, Anda mungkin menghindari beberapa rintangan pada kurva belajar:
-
Melewati pemeriksaan kualitas data: Sebagian besar penambang data berpikir bahwa mengembangkan model prediktif lebih menyenangkan daripada meninjau data untuk masalah kualitas. Tapi jika Anda gagal mendeteksi dan memperbaiki masalah kualitas data, Anda bisa mendapatkan prediksi yang tidak berharga.
-
Hilangnya intinya: Anda telah menemukan sesuatu yang menarik! Itu bagus, tapi kalau tidak juga relevan dengan masalah bisnis yang Anda tetapkan untuk dipecahkan, nah, itu sama sekali tidak relevan. Kembali ke jalurnya.
-
Percaya bahwa pola dalam data membuktikan hubungan sebab-akibat: Anda menjelajahi dataset dan memperhatikan bahwa bila Variabel A meningkat, Variabel B juga meningkat. Hal ini bisa terjadi karena Variabel A mempengaruhi Variabel B, atau karena Variabel B mempengaruhi Variabel A. Di sisi lain, bisa jadi keduanya dipengaruhi oleh beberapa variabel lain yang belum Anda pertimbangkan. Atau bisa juga kebetulan satu kali. Siapa yang bisa bilang
-
Peregangan kesimpulan terlalu jauh: Jangan menganggap bahwa hubungan yang Anda amati dalam data akan terulang dalam situasi yang berbeda. Jika data Anda dikumpulkan di lingkungan yang sejuk, jangan berasumsi bahwa segala sesuatunya akan berjalan dengan cara yang sama dalam setting pabrik yang panas.
-
Pertaruhan pada hasil yang tidak masuk akal: Metode penambangan data bersifat informal dan biasanya tidak didukung oleh metode dan teori ilmiah, jadi hasil Anda lebih baik setidaknya membuat bisnis masuk akal. Jika tidak ada penjelasan akal sehat untuk hasil yang Anda hadirkan, manajemen eksekutif Anda mungkin tidak akan menganggapnya serius, dan seharusnya tidak.
-
Jatuh cinta dengan metode pemodelan tertentu: Tidak ada satu jenis model data mining yang sesuai dengan setiap situasi.
-
Masukkan model ke dalam produksi tanpa pengujian yang memadai: Jangan bertaruh bisnis Anda dengan model prediktif sampai Anda mengujinya dengan data holdout dan dalam skala kecil di lapangan.
-
Mengabaikan hasil yang tidak Anda sukai: Jika Anda mengabaikan data Anda sekarang, itu akan kembali suatu hari dan katakan, "Sudah saya katakan. "
-
Menggunakan data mining untuk menangani setiap kebutuhan analisis data: Data mining memiliki nilai yang sangat besar, namun beberapa aplikasi masih memerlukan metode pengumpulan data yang ketat, analisis statistik formal, dan metode ilmiah.
-
Dengan anggapan bahwa teknik analisis data tradisional tidak lagi penting: Lihat peluru sebelumnya.