Daftar Isi:
- Hukum pertama: Sasaran bisnis
- Hukum kedua: Pengetahuan bisnis
- Inilah Hukum Penambangan Data 3, atau "Data Preparation Law":
- Inilah Hukum Penambangan Data ke-4, atau "NFL-DM":
- Inilah Hukum Penambangan Data 5:
- Inilah Hukum Penambangan Data ke-6, atau "Undang-Undang Wawasan":
- Inilah Hukum Penetapan Data ke-7, atau "Prediksi Hukum":
- Inilah Hukum Penambangan Data ke-8, atau "Hukum Nilai":
- Inilah Hukum Penambangan Data 9, atau "Hukum Perubahan":
Video: Safe and Sorry – Terrorism & Mass Surveillance 2024
Setiap profesi memiliki prinsip panduan, gagasan yang memberikan struktur dan bimbingan dalam pekerjaan sehari-hari. Data mining tidak terkecuali. Berikut adalah sembilan gagasan mendasar untuk membimbing Anda saat Anda mulai bekerja dan menjadi penambang data. Inilah 9 Undang-Undang Data Mining yang pada awalnya dinyatakan oleh penambang data perintis, Thomas Khabaza.
Hukum pertama: Sasaran bisnis
Inilah Hukum Pertama Penambangan Data, atau "Hukum Sasaran Bisnis": Sasaran bisnis adalah asal dari setiap solusi penambangan data.
Anda mencari data untuk menemukan informasi yang membantu Anda menjalankan bisnis dengan lebih baik. Bukankah ini mantra semua analisis data bisnis? Tentu saja harus! Namun, penambang data pemula sering fokus pada teknologi dan rincian lainnya, yang mungkin menarik, namun tidak sesuai dengan kebutuhan dan tujuan pembuat keputusan eksekutif.
Anda harus mengembangkan kebiasaan untuk mengidentifikasi sasaran bisnis sebelum melakukan hal lain, dan berfokus pada sasaran tersebut pada setiap langkah dalam proses penambangan data. Ini penting bahwa hukum ini muncul lebih dulu. Setiap orang harus mengerti bahwa data mining adalah proses dengan suatu tujuan.
Hukum kedua: Pengetahuan bisnis
Inilah Hukum 2 Data Mining, atau "Knowledge Pengetahuan Bisnis": Pengetahuan bisnis sangat penting bagi setiap langkah proses penambangan data. Data mining memberi kekuatan kepada orang - pelaku bisnis - yang menggunakan pengetahuan, pengalaman, dan wawasan bisnis mereka, bersama dengan metode penambangan data, untuk menemukan makna dalam data.
Anda tidak perlu menjadi ahli statistik yang hebat untuk melakukan pengumpulan data, tapi Anda harus tahu sesuatu tentang data yang ditandakan dan bagaimana bisnis bekerja. Hanya bila Anda memahami data dan masalah yang perlu Anda selesaikan, proses penambangan data dapat membantu Anda menemukan informasi yang berguna dan menggunakannya.
Inilah Hukum Penambangan Data 3, atau "Data Preparation Law":
Penyiapan data lebih dari separuh setiap proses penambangan data. Ahli statistik tradisional sering kali memiliki kesempatan untuk mengumpulkan data baru untuk menjawab pertanyaan penelitian tertentu. Mereka mungkin menggunakan proses yang ketat untuk merencanakan eksperimen, merancang kuesioner penelitian survei atau mengumpulkan data berkualitas tinggi yang ditargetkan dengan baik untuk tujuan penelitian tertentu. Namun setelah semua itu, mereka masih menghabiskan banyak waktu untuk membersihkan dan menyiapkan data untuk analisis.
Penambang data, di sisi lain, hampir selalu harus bekerja dengan data apa pun yang tersedia. Mereka menggunakan catatan bisnis yang ada, data publik, atau data yang bisa mereka beli.Kemungkinannya adalah, semua data dikumpulkan untuk beberapa tujuan selain data mining, dan tanpa rencana yang ketat atau proses pengumpulan data yang cermat. Jadi penambang data menghabiskan banyak waktu untuk persiapan data.
Hukum keempat: Model benar
Inilah Hukum Penambangan Data ke-4, atau "NFL-DM":
Model yang tepat untuk aplikasi tertentu hanya dapat ditemukan melalui percobaan. Hukum ini juga dikenal dengan singkatan NFL-DM, artinya tidak ada makan siang gratis untuk penambang data.
Pertama, apa modelnya? Ini adalah persamaan yang mewakili pola yang diamati dalam data. Paling tidak, ini mewakili pola secara kasar. Model matematika dari hal-hal nyata tidak pernah sempurna! Ini adalah fakta kehidupan, dan ini sama nyatanya dengan fisikawan nuklir seperti juga untuk penambang data.
Dalam data mining, model dipilih melalui trial and error. Anda akan bereksperimen dengan tipe model yang berbeda.
Hukum kelima: Pola
Inilah Hukum Penambangan Data 5:
Selalu ada pola. Sebagai penambang data, Anda akan menjelajahi data untuk mencari pola yang berguna. Dengan kata lain, Anda akan mencari hubungan yang berarti antara variabel dalam data. Memahami hubungan ini memberikan pemahaman bisnis yang lebih baik, dan prediksi yang lebih baik tentang apa yang akan terjadi di masa depan. Yang terpenting, memahami pola dalam data memungkinkan Anda mempengaruhi apa yang akan terjadi di masa depan.
Anda selalu menemukan pola. Data selalu ada sesuatu untuk diceritakan kepada Anda. Terkadang, ini menegaskan bahwa apa yang telah Anda lakukan itu benar. Itu mungkin tidak mengasyikkan, tapi setidaknya ini memberitahu Anda bahwa Anda telah berada di jalur yang benar. Hari-hari lain, data mungkin memberi tahu Anda bahwa praktik bisnis Anda saat ini tidak berjalan baik. Itu menggairahkan, dan meski mungkin tidak menyenangkan dalam jangka pendek, mengetahui kebenaran merupakan langkah penting menuju perbaikan.
Hukum 6: Amplifikasi
Inilah Hukum Penambangan Data ke-6, atau "Undang-Undang Wawasan":
Data mining memperkuat persepsi dalam domain bisnis. Metode penambangan data memungkinkan Anda memahami bisnis Anda lebih baik daripada yang bisa Anda lakukan tanpa mereka. Metode penambangan data membantu Anda menyukai kaca pembesar atau mikroskop, memungkinkan penemuan efek yang akan sulit atau tidak mungkin dideteksi melalui pelaporan biasa.
Data mining tidak instan.
Penemuan dan pembelajaran melalui data mining merupakan proses interaktif. Anda akan membuat penemuan, mencari tahu sedikit dari masing-masing, dan menggunakan apa yang telah Anda temukan untuk mengambil tindakan. Hasil setiap tindakan yang Anda coba akan menghasilkan lebih banyak data, dan data tersebut memungkinkan Anda memahami sesuatu yang lebih. Ini adalah siklus penemuan, dan siklus berlanjut selama Anda terus mengeksplorasi dan bereksperimen.
Hukum ke 7: Prediksi
Inilah Hukum Penetapan Data ke-7, atau "Prediksi Hukum":
Prediksi meningkatkan informasi secara umum oleh generalisasi. Data mining membantu Anda menggunakan apa yang Anda ketahui untuk membuat prediksi yang lebih baik (atau perkiraan) dari hal-hal yang tidak Anda ketahui. Penambangan data menggunakan metode data dan pemodelan untuk menggantikan harapan informal Anda dengan perkiraan data yang didorong, konsisten, dan lebih akurat.
Hukum 8: Nilai
Inilah Hukum Penambangan Data ke-8, atau "Hukum Nilai":
Nilai hasil data mining tidak ditentukan oleh keakuratan atau stabilitas model prediktif. Penambang data tidak mempermasalahkan teori. Sebagai penambang data, Anda mungkin tidak pernah tahu teori di balik model statistik yang Anda gunakan. Mungkin itu juga, karena dalam data mining, Anda akan menggunakan model tersebut dengan cara yang tidak sesuai dengan teori di belakangnya.
Anda akan mencari model yang menghasilkan prediksi yang benar (dan Anda akan menggunakan pengujian, bukan teori statistik, untuk menilainya). Tapi Anda mungkin lebih memperhatikan masalah lain, seperti apakah model itu masuk akal bisnis, memberi Anda faktor prediktif yang tidak terduga atau praktis digunakan di tempat kerja Anda.
Hukum 9: Ganti
Inilah Hukum Penambangan Data 9, atau "Hukum Perubahan":
Semua pola dapat berubah sewaktu-waktu. Dunia selalu berubah. Model yang memberi Anda prediksi besar hari ini mungkin tidak berguna besok. Ini adalah fakta kehidupan bagi semua analis data, bukan hanya para penambang data.