Video: Basic Machine Learning Algorithms Overview - Data Science Crash Course Mini-series 2024
Oleh Meta S. Brown
Data mining adalah cara para pebisnis biasa menggunakan berbagai teknik analisis data untuk menemukan berguna. informasi dari data dan memasukkan informasi tersebut ke dalam penggunaan praktis. Penambang data tidak memperdulikan teori dan asumsi. Mereka memvalidasi penemuan mereka dengan melakukan pengujian. Dan mereka mengerti bahwa segala sesuatunya berubah, jadi ketika penemuan yang bekerja seperti pesona kemarin tidak tahan hingga hari ini, mereka beradaptasi.
Perintis data penambang Thomas Khabaza mengembangkan "Sembilan Hukum Pertambangan Data" untuk membimbing para penambang data baru saat mereka mulai bekerja. Panduan referensi ini menunjukkan kepada Anda apa arti masing-masing undang-undang ini bagi pekerjaan sehari-hari Anda.Hukum Penambangan Data Pertama, atau "Hukum Sasaran Bisnis":
-
Tujuan bisnis adalah asal dari setiap solusi data mining.
Hukum Penambangan Data 2, atau "Hukum Pengetahuan Bisnis":
-
Pengetahuan Bisnis sangat penting bagi setiap langkah proses data mining . Anda tidak perlu menjadi ahli statistik yang hebat untuk melakukan pengumpulan data, tapi Anda harus tahu sesuatu tentang data yang ditandakan dan bagaimana bisnis bekerja.
-
Penyiapan data lebih dari separuh dari setiap proses data mining . Cukup banyak setiap penambang data akan menghabiskan lebih banyak waktu untuk persiapan data daripada analisis.
Hukum Penambangan Data 4, atau "Tidak Makan Siang Gratis untuk Penambang Data":
-
Model yang tepat untuk aplikasi tertentu hanya dapat ditemukan dengan eksperimen . Dalam data mining, model dipilih melalui trial and error.
Hukum Penambangan Data 5:
-
Selalu ada pola dalam data . Sebagai penambang data, Anda menjelajahi data untuk mencari pola yang berguna. Memahami pola dalam data memungkinkan Anda mempengaruhi apa yang terjadi di masa depan.
Hukum Penambangan Data 6, atau "Hukum Wawasan":
-
Data mining memperkuat persepsi di ranah bisnis . Metode data mining memungkinkan Anda memahami bisnis Anda lebih baik daripada yang bisa Anda lakukan tanpa mereka.
Hukum Penambangan Data 7 atau "Prediksi Hukum":
-
Prediksi meningkatkan informasi secara umum oleh generalisasi. Data mining membantu kita menggunakan apa yang kita ketahui untuk membuat prediksi yang lebih baik (atau perkiraan) dari hal-hal yang tidak kita ketahui.
8th Data Mining, atau "Value Law":
-
Nilai hasil data mining tidak ditentukan oleh keakuratan atau stabilitas model prediksi . Model Anda harus menghasilkan prediksi yang bagus, konsisten. Itu dia.
Hukum Penambangan Data 9, atau "Hukum Perubahan":
-
Semua pola dapat berubah sewaktu-waktu. Model apa pun yang memberi Anda prediksi hebat hari ini mungkin tidak berguna besok.
Tahap Proses Data Mining
Proses Standar Lintas Silang
untuk Data Mining ( CRISP-DM ) adalah kerangka proses penambangan data yang dominan. Ini adalah standar terbuka; siapapun boleh menggunakannya Daftar berikut menjelaskan berbagai tahap proses. Pemahaman bisnis:
-
Dapatkan pemahaman yang jelas tentang masalah yang sedang Anda selesaikan, bagaimana dampaknya terhadap organisasi Anda, dan tujuan Anda untuk mengatasinya. Tugas dalam tahap ini meliputi: Mengidentifikasi tujuan bisnis Anda
-
Menilai situasi Anda
-
Mendefinisikan tujuan penambangan data
-
Memproduksi rencana proyek Anda
-
Pemahaman data:
-
-
Tinjau data yang Anda miliki, mendokumentasikannya, mengidentifikasi pengelolaan data dan masalah kualitas data. Tugas untuk fase ini meliputi: Mengumpulkan data
-
Menggambarkan
-
Menjelajahi
-
Memverifikasi kualitas
-
Persiapan data:
-
-
Siapkan data Anda untuk dipodelkan. Tugas untuk fase ini meliputi: Memilih data
-
Membersihkan data
-
Membangun
-
Mengintegrasikan
-
Pemformatan
-
Pemodelan:
-
-
Gunakan teknik matematika untuk mengidentifikasi pola dalam data Anda. Tugas untuk fase ini meliputi: Memilih teknik
-
Merancang tes
-
Model bangunan
-
Menilai model
-
Evaluasi:
-
-
Tinjau kembali pola yang telah Anda temukan dan nilai potensi penggunaan bisnisnya. Tugas untuk fase ini meliputi: Mengevaluasi hasil
-
Meninjau proses
-
Menentukan langkah selanjutnya
-
Penyebaran:
-
-
Letakkan penemuan Anda untuk bekerja dalam bisnis sehari-hari. Tugas untuk fase ini meliputi: Perencanaan penyebaran (metode untuk mengintegrasikan penemuan data mining Anda)
-
Melaporkan hasil akhir
-
Meninjau hasil akhir
-