Rumah Keuangan Pribadi 9 Hukum Data Mining - dummies

9 Hukum Data Mining - dummies

Daftar Isi:

Video: Safe and Sorry – Terrorism & Mass Surveillance 2024

Video: Safe and Sorry – Terrorism & Mass Surveillance 2024
Anonim

Setiap profesi memiliki prinsip panduan, gagasan yang memberikan struktur dan bimbingan dalam pekerjaan sehari-hari. Data mining tidak terkecuali. Berikut adalah sembilan gagasan mendasar untuk membimbing Anda saat Anda mulai bekerja dan menjadi penambang data. Inilah 9 Undang-Undang Data Mining yang pada awalnya dinyatakan oleh penambang data perintis, Thomas Khabaza.

Hukum pertama: Sasaran bisnis

Inilah Hukum Pertama Penambangan Data, atau "Hukum Sasaran Bisnis": Sasaran bisnis adalah asal dari setiap solusi penambangan data.

Anda mencari data untuk menemukan informasi yang membantu Anda menjalankan bisnis dengan lebih baik. Bukankah ini mantra semua analisis data bisnis? Tentu saja harus! Namun, penambang data pemula sering fokus pada teknologi dan rincian lainnya, yang mungkin menarik, namun tidak sesuai dengan kebutuhan dan tujuan pembuat keputusan eksekutif.

Anda harus mengembangkan kebiasaan untuk mengidentifikasi sasaran bisnis sebelum melakukan hal lain, dan berfokus pada sasaran tersebut pada setiap langkah dalam proses penambangan data. Ini penting bahwa hukum ini muncul lebih dulu. Setiap orang harus mengerti bahwa data mining adalah proses dengan suatu tujuan.

Hukum kedua: Pengetahuan bisnis

Inilah Hukum 2 Data Mining, atau "Knowledge Pengetahuan Bisnis": Pengetahuan bisnis sangat penting bagi setiap langkah proses penambangan data. Data mining memberi kekuatan kepada orang - pelaku bisnis - yang menggunakan pengetahuan, pengalaman, dan wawasan bisnis mereka, bersama dengan metode penambangan data, untuk menemukan makna dalam data.

Anda tidak perlu menjadi ahli statistik yang hebat untuk melakukan pengumpulan data, tapi Anda harus tahu sesuatu tentang data yang ditandakan dan bagaimana bisnis bekerja. Hanya bila Anda memahami data dan masalah yang perlu Anda selesaikan, proses penambangan data dapat membantu Anda menemukan informasi yang berguna dan menggunakannya.

Hukum ke 3: Persiapan data

Inilah Hukum Penambangan Data 3, atau "Data Preparation Law":

Penyiapan data lebih dari separuh setiap proses penambangan data. Ahli statistik tradisional sering kali memiliki kesempatan untuk mengumpulkan data baru untuk menjawab pertanyaan penelitian tertentu. Mereka mungkin menggunakan proses yang ketat untuk merencanakan eksperimen, merancang kuesioner penelitian survei atau mengumpulkan data berkualitas tinggi yang ditargetkan dengan baik untuk tujuan penelitian tertentu. Namun setelah semua itu, mereka masih menghabiskan banyak waktu untuk membersihkan dan menyiapkan data untuk analisis.

Penambang data, di sisi lain, hampir selalu harus bekerja dengan data apa pun yang tersedia. Mereka menggunakan catatan bisnis yang ada, data publik, atau data yang bisa mereka beli.Kemungkinannya adalah, semua data dikumpulkan untuk beberapa tujuan selain data mining, dan tanpa rencana yang ketat atau proses pengumpulan data yang cermat. Jadi penambang data menghabiskan banyak waktu untuk persiapan data.

Hukum keempat: Model benar

Inilah Hukum Penambangan Data ke-4, atau "NFL-DM":

Model yang tepat untuk aplikasi tertentu hanya dapat ditemukan melalui percobaan. Hukum ini juga dikenal dengan singkatan NFL-DM, artinya tidak ada makan siang gratis untuk penambang data.

Pertama, apa modelnya? Ini adalah persamaan yang mewakili pola yang diamati dalam data. Paling tidak, ini mewakili pola secara kasar. Model matematika dari hal-hal nyata tidak pernah sempurna! Ini adalah fakta kehidupan, dan ini sama nyatanya dengan fisikawan nuklir seperti juga untuk penambang data.

Dalam data mining, model dipilih melalui trial and error. Anda akan bereksperimen dengan tipe model yang berbeda.

Hukum kelima: Pola

Inilah Hukum Penambangan Data 5:

Selalu ada pola. Sebagai penambang data, Anda akan menjelajahi data untuk mencari pola yang berguna. Dengan kata lain, Anda akan mencari hubungan yang berarti antara variabel dalam data. Memahami hubungan ini memberikan pemahaman bisnis yang lebih baik, dan prediksi yang lebih baik tentang apa yang akan terjadi di masa depan. Yang terpenting, memahami pola dalam data memungkinkan Anda mempengaruhi apa yang akan terjadi di masa depan.

Anda selalu menemukan pola. Data selalu ada sesuatu untuk diceritakan kepada Anda. Terkadang, ini menegaskan bahwa apa yang telah Anda lakukan itu benar. Itu mungkin tidak mengasyikkan, tapi setidaknya ini memberitahu Anda bahwa Anda telah berada di jalur yang benar. Hari-hari lain, data mungkin memberi tahu Anda bahwa praktik bisnis Anda saat ini tidak berjalan baik. Itu menggairahkan, dan meski mungkin tidak menyenangkan dalam jangka pendek, mengetahui kebenaran merupakan langkah penting menuju perbaikan.

Hukum 6: Amplifikasi

Inilah Hukum Penambangan Data ke-6, atau "Undang-Undang Wawasan":

Data mining memperkuat persepsi dalam domain bisnis. Metode penambangan data memungkinkan Anda memahami bisnis Anda lebih baik daripada yang bisa Anda lakukan tanpa mereka. Metode penambangan data membantu Anda menyukai kaca pembesar atau mikroskop, memungkinkan penemuan efek yang akan sulit atau tidak mungkin dideteksi melalui pelaporan biasa.

Data mining tidak instan.

Penemuan dan pembelajaran melalui data mining merupakan proses interaktif. Anda akan membuat penemuan, mencari tahu sedikit dari masing-masing, dan menggunakan apa yang telah Anda temukan untuk mengambil tindakan. Hasil setiap tindakan yang Anda coba akan menghasilkan lebih banyak data, dan data tersebut memungkinkan Anda memahami sesuatu yang lebih. Ini adalah siklus penemuan, dan siklus berlanjut selama Anda terus mengeksplorasi dan bereksperimen.

Hukum ke 7: Prediksi

Inilah Hukum Penetapan Data ke-7, atau "Prediksi Hukum":

Prediksi meningkatkan informasi secara umum oleh generalisasi. Data mining membantu Anda menggunakan apa yang Anda ketahui untuk membuat prediksi yang lebih baik (atau perkiraan) dari hal-hal yang tidak Anda ketahui. Penambangan data menggunakan metode data dan pemodelan untuk menggantikan harapan informal Anda dengan perkiraan data yang didorong, konsisten, dan lebih akurat.

Hukum 8: Nilai

Inilah Hukum Penambangan Data ke-8, atau "Hukum Nilai":

Nilai hasil data mining tidak ditentukan oleh keakuratan atau stabilitas model prediktif. Penambang data tidak mempermasalahkan teori. Sebagai penambang data, Anda mungkin tidak pernah tahu teori di balik model statistik yang Anda gunakan. Mungkin itu juga, karena dalam data mining, Anda akan menggunakan model tersebut dengan cara yang tidak sesuai dengan teori di belakangnya.

Anda akan mencari model yang menghasilkan prediksi yang benar (dan Anda akan menggunakan pengujian, bukan teori statistik, untuk menilainya). Tapi Anda mungkin lebih memperhatikan masalah lain, seperti apakah model itu masuk akal bisnis, memberi Anda faktor prediktif yang tidak terduga atau praktis digunakan di tempat kerja Anda.

Hukum 9: Ganti

Inilah Hukum Penambangan Data 9, atau "Hukum Perubahan":

Semua pola dapat berubah sewaktu-waktu. Dunia selalu berubah. Model yang memberi Anda prediksi besar hari ini mungkin tidak berguna besok. Ini adalah fakta kehidupan bagi semua analis data, bukan hanya para penambang data.

9 Hukum Data Mining - dummies

Pilihan Editor

Rakit Menu untuk Situs Anda di Flash - dummies

Rakit Menu untuk Situs Anda di Flash - dummies

Jika Anda telah membuat satu tombol di Flash, Anda dapat menduplikat simbol tombol dan kemudian mengubah teks untuk menyempurnakan menu Anda. Jika Anda benar matematika, tombol Anda berukuran sempurna. Saat Anda menyelaraskan tombol ujung ke ujung, menu Anda akan dirakit. Untuk merakit menu, ikuti langkah-langkah berikut:

Tambahkan dan Edit Simbol pada Flash CS5 Stage - dummies

Tambahkan dan Edit Simbol pada Flash CS5 Stage - dummies

Anda dapat menggunakan kembali simbol setelah Anda menambahkan ke perpustakaan Adobe Flash Creative Suite 5 Anda. Setiap salinan simbol disebut sebagai contoh di Flash CS5. Meskipun semua contoh simbol tetap terhubung kembali dengan aslinya di Perpustakaan, Anda memiliki fleksibilitas untuk menskalakan, mengubah, dan memutar ...

Bitmap versus Vector Artwork di Flash CS5 - dummies

Bitmap versus Vector Artwork di Flash CS5 - dummies

Dalam desain berbasis komputer, Anda harus waspada terhadap dua jenis grafis: bitmap dan vektor. Lingkungan gambar di Flash secara native menciptakan grafis vektor, namun Anda dapat menggunakan grafik bitmap dan vektor dalam film Flash. Grafik vektor mengacu pada karya seni terukur yang terdiri dari titik, jalur, dan pengisian yang dibuat oleh komputer berdasarkan ...

Pilihan Editor

Kata 2016 Teks Entri dan Pemformatan Shortcut - dummies

Kata 2016 Teks Entri dan Pemformatan Shortcut - dummies

Kata 2016 menawarkan banyak cara untuk berinteraksi dengan dokumen Anda. Ada beberapa shortcut keyboard yang bisa menghemat waktu. Dengan cara pintas keyboard ini, Anda bisa mempercepat pengeditan dan pemformatan teks. Untuk melakukan ini Dengan keyboard Mulai baris baru di paragraf yang sama Shift + Enter Masukkan halaman istirahat Ctrl + Enter Insert ...

Kata 2016 Lihat Jalan Pintas - dummies

Kata 2016 Lihat Jalan Pintas - dummies

Pernah merasa Anda tidak memiliki perspektif yang benar? Nah, Word 2016 memudahkan Anda mengubah tampilan dokumen sehingga Anda bisa mendapatkan perspektif yang berbeda. Dengan cara pintas keyboard ini, Anda dapat beralih di antara berbagai tampilan di Word 2016. Beralih ke tampilan ini Dengan keyboard Print Layout Alt + Ctrl + P Garis Besar Alt + Ctrl + O Draft ...

Kata 2013 For Dummies Cheat Sheet - dummies

Kata 2013 For Dummies Cheat Sheet - dummies

Kata adalah salah satu program komputer yang paling banyak digunakan di planet ini. Membantu Anda menulis teks adalah salah satu hal yang dilakukan komputer dengan baik, tapi itu tidak membuat tugas penulisan teks lebih mudah atau menyiratkan bahwa menggunakan Word cukup sederhana sehingga Anda tidak memerlukan bantuan. Jadi nikmati Cheat Sheet ini.

Pilihan Editor

Administrasi jaringan: Memelihara Perintah Windows - dummies

Administrasi jaringan: Memelihara Perintah Windows - dummies

Kemampuan untuk menyusun perintah Windows bersama dapat membiarkan Anda menyelesaikannya dalam satu perintah apa yang akan mengambil puluhan perintah terpisah. Anda bisa memasukkan dua atau lebih perintah pada baris yang sama dengan memisahkan perintah dengan ampersand (&), seperti ini: C:> copy *. doc a: & del *. doc Di sini, salinan perintah Salin ...

Administrasi jaringan: Mengelompokkan alamat IP - dummies

Administrasi jaringan: Mengelompokkan alamat IP - dummies

Ketika perancang asli protokol IP membuat skema pengalamatan IP, mereka bisa saja menugaskan sejumlah bit alamat IP yang sewenang-wenang untuk ID jaringan. Bit yang tersisa kemudian akan digunakan untuk host ID. Sebagai contoh, anggaplah bahwa perancang memutuskan bahwa setengah dari alamat (16 bit) akan menjadi ...