Rumah Keuangan Pribadi Apa yang dilakukan Penambang Data - dummies

Apa yang dilakukan Penambang Data - dummies

Daftar Isi:

Video: Berapa Banyak Emas Yang Ada di Freeport? 2024

Video: Berapa Banyak Emas Yang Ada di Freeport? 2024
Anonim

Jika Anda memikirkan data sebagai bahan baku, dan informasi yang dapat Anda dapatkan dari data sebagai sesuatu yang berharga dan relatif disempurnakan, proses penggalian informasi dapat dilakukan. dibandingkan dengan mengekstraksi logam dari bijih atau permata dari kotoran. Begitulah istilah data mining berasal.

Berfokus pada bisnis data mining

Penambang data tidak hanya merenungkan data tanpa tujuan, berharap menemukan sesuatu yang menarik. Setiap proyek data mining dimulai dengan masalah bisnis yang spesifik dan tujuan untuk mencocokkan.

Sebagai penambang data, mungkin Anda tidak memiliki wewenang untuk membuat keputusan bisnis akhir, jadi penting bagi Anda menyelaraskan pekerjaan Anda dengan kebutuhan para pengambil keputusan. Anda harus memahami masalah, kebutuhan, dan preferensi mereka, dan memfokuskan usaha Anda untuk memberikan informasi yang mendukung keputusan bisnis yang baik.

Pengetahuan bisnis Anda sendiri sangat penting. Eksekutif tidak akan duduk di samping Anda saat Anda bekerja, memberikan umpan balik mengenai relevansi penemuan Anda dengan keprihatinan mereka. Anda harus menggunakan pengalaman dan ketajaman Anda sendiri untuk menilai itu sendiri karena Anda bekerja.

Memahami bagaimana penambang data meluangkan waktunya

Akan lebih bagus lagi jika penambang data bisa menghabiskan sepanjang hari untuk membuat penemuan yang mengubah hidup, membangun model yang berharga, dan mengintegrasikannya ke dalam bisnis sehari-hari. Tapi itu seperti mengatakan akan lebih bagus lagi jika atlet bisa menghabiskan sepanjang turnamen yang menang. Butuh banyak persiapan untuk membangun momen kemenangan itu. Jadi, seperti atlet, penambang data menghabiskan banyak waktu untuk persiapan.

Mengenal proses penambangan data

Proses kerja yang baik membantu Anda memaksimalkan waktu, data, dan semua sumber daya lainnya. Dalam buku ini, Anda akan menemukan proses penambangan data yang paling populer, CRISP-DM. Ini adalah siklus penemuan dan tindakan enam tahap yang diciptakan oleh konsorsium penambang data dari banyak industri, dan standar terbuka yang dapat digunakan siapa pun.

Tahapan proses CRISP-DM adalah

  1. Pengertian Bisnis

  2. Pemahaman Data

  3. Persiapan Data

  4. Pemodelan

  5. Evaluasi

  6. Penerapan (menggunakan model dalam bisnis sehari-hari)

Masing-masing Fase membawa bobot yang sama pentingnya kualitas hasil dan nilai bisnis. Tapi dalam hal waktu yang dibutuhkan, persiapan data memang mendominasi. Penyiapan data secara rutin membutuhkan lebih banyak waktu daripada semua fase lain dalam proses penambangan data.

Membuat model

Bila tujuan dipahami, dan data sudah dibersihkan dan siap digunakan, Anda dapat mengalihkan perhatian ke model prediktif.Model melakukan apa yang laporan tidak bisa; mereka memberi informasi yang mendukung tindakan.

Laporan dapat memberi tahu Anda bahwa penjualan sedang turun. Hal ini dapat mematahkan penjualan berdasarkan wilayah, produk, dan saluran sehingga Anda tahu di mana penjualan menurun dan apakah penurunan ini meluas atau hanya mempengaruhi area tertentu saja. Tapi mereka tidak memberi petunjuk tentang penjualan mengapa ditolak atau tindakan apa yang bisa membantu menghidupkan kembali bisnis.

Model membantu Anda memahami faktor-faktor yang mempengaruhi penjualan, tindakan yang cenderung meningkatkan atau menurunkan penjualan, dan strategi dan taktik yang membuat bisnis Anda berjalan dengan lancar. Itu menarik, bukan? Mungkin karena itulah kebanyakan penambang data menganggap pemodelan menjadi bagian pekerjaan yang menyenangkan.

Memahami model matematis

Model matematika sangat penting untuk data mining, tapi apa fungsinya? Apa yang mereka lakukan, bagaimana cara kerjanya, dan bagaimana cara mereka diciptakan?

Model matematis adalah, sederhana dan sederhana, persamaan, atau rangkaian persamaan, yang menggambarkan hubungan antara dua hal atau lebih. Persamaan semacam itu adalah singkatan dari teori tentang cara kerja alam dan masyarakat. Teori ini mungkin didukung oleh bukti substansial atau mungkin hanya tebakan liar. Bahasa matematika sama dalam kedua kasus.

Istilah seperti model prediksi, model statistik, atau model linier mengacu pada jenis model matematis tertentu, nama yang mencerminkan penggunaan, bentuk, atau metode penggambaran yang diinginkan model tertentu Ketiga contoh ini hanyalah beberapa dari banyak istilah seperti itu.

Bila model disebutkan dalam setting bisnis, kemungkinan besar model yang digunakan untuk membuat prediksi. Model digunakan untuk memprediksi harga saham, penjualan produk, dan tingkat pengangguran, di antara banyak hal lainnya.

Prediksi ini mungkin atau mungkin tidak akurat, namun untuk sejumlah nilai tertentu (faktor yang diketahui seperti ini disebut variabel independen atau input ) yang termasuk dalam model, Anda akan temukan prediksi yang didefinisikan dengan baik (juga disebut variabel dependen , output, atau result ). Model matematis digunakan untuk tujuan lain dalam bisnis, juga, seperti untuk menggambarkan mekanisme kerja yang mendorong proses tertentu.

Dalam data mining, Anda membuat model dengan menemukan pola dalam data menggunakan pembelajaran mesin atau metode statistik. Penambang data tidak mengikuti pendekatan ketat yang sama yang dilakukan para ahli statistik klasik, namun semua model berasal dari data aktual dan teknik pemodelan matematika yang konsisten. Semua model data mining didukung oleh bukti.

Mengapa menggunakan model matematis? Tidak bisakah hubungan yang sama dideskripsikan dengan menggunakan kata-kata? Itu mungkin, namun Anda menemukan keuntungan tertentu untuk penggunaan persamaan. Ini termasuk

  • Convenience: Dibandingkan dengan deskripsi yang sama yang ditulis dalam kalimat, persamaannya singkat. Simbolisme matematis telah berkembang secara khusus untuk tujuan mewakili hubungan matematis; bahasa seperti bahasa inggris belum.

  • Kejelasan: Persamaan menyampaikan gagasan secara ringkas dan tidak ambigu.Mereka tidak tunduk pada interpretasi yang berbeda berdasarkan budaya, dan simbolisme matematika adalah semacam bahasa umum yang digunakan secara luas di seluruh dunia.

  • Konsistensi: Karena representasi matematis tidak ambigu, implikasi dari situasi tertentu didefinisikan secara jelas oleh model matematis.

Menempatkan informasi ke dalam tindakan

Model hanya memberikan nilai saat Anda menggunakannya dalam bisnis. Prediksi model dapat mendukung pengambilan keputusan dengan berbagai cara. Anda bisa memasukkan prediksi ke dalam laporan atau presentasi untuk digunakan dalam membuat keputusan tertentu.

  • Integrasikan model ke dalam sistem operasional (seperti sistem layanan pelanggan) untuk memberikan prediksi real-time untuk pemakaian sehari-hari. (Misalnya, Anda mungkin mengajukan klaim asuransi untuk pembayaran segera, penolakan segera, atau penyelidikan lebih lanjut.)

  • Gunakan model untuk prediksi bets. (Misalnya, Anda bisa mencetak daftar pelanggan internal untuk menentukan pelanggan mana yang akan menerima tawaran tertentu.)

Apa yang dilakukan Penambang Data - dummies

Pilihan Editor

Bertahan dalam Zombie Sieges di Minecraft - dummies

Bertahan dalam Zombie Sieges di Minecraft - dummies

Bermasalah dengan zombie yang menyerang desa Anda pada malam hari di Minecraft? Pelajari bagaimana untuk membela diri, menyembuhkan penduduk desa zombie, dan pulihkan dunia Anda!

Zaman Batu di Minecraft - dummies

Zaman Batu di Minecraft - dummies

Tonggak penting dalam mode Minecraft Survival, dan yang dicapai oleh beberapa pemain di Hari pertama, mencapai Zaman Batu. Setelah Anda membuat pickax kayu dan Anda bisa menemukan gua atau menggali lubang, item dalam tabel berikut tersedia untuk Anda. Sebagian besar bahan berbasis batu lebih padat dari yang lain ...

Zaman Looting di Minecraft - dummies

Zaman Looting di Minecraft - dummies

Anda mencapai Usia Looting di Minecraft di awal permainan - kadang-kadang, bahkan paralel untuk mencapai Era Kayu. Anda mulai dengan membunuh musuh untuk menjarah, dan dengan menggunakan jarahan untuk memperbaiki repertoar kerajinan Anda. Lebih banyak item kemudian tersedia bagi Anda, seperti tercantum dalam tabel. Semua alat meningkatkan jumlah ...

Pilihan Editor

Infografis tepat waktu: Berbagi Breaking News - dummies

Infografis tepat waktu: Berbagi Breaking News - dummies

Walaupun infografik Anda tidak mungkin menjadi satu-satunya sumber berita, Ini bisa membantu pemahaman pembaca akan sebuah acara berita. Misalnya, banyak orang belajar di Twitter pada bulan Oktober, 2011 bahwa pendiri Apple Steve Jobs telah meninggal dunia. Infografis tidak akan menjadi orang pertama yang mendengarnya. Tapi orang-orang ...

Pilihan Editor

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

Ketika Anda mencapai bagian Sains GED, Anda akan diharapkan memiliki pengetahuan umum di semua cabang Ilmu Pengetahuan, termasuk Ilmu Fisika. Berikut adalah contoh jenis pertanyaan yang mungkin Anda hadapi pada hari ujian. Kecepatan dan Kecepatan Ada perbedaan antara kecepatan dan kecepatan, meskipun terkadang Anda ...

Latihan GED RLA: Reading Comprehension - dummies

Latihan GED RLA: Reading Comprehension - dummies

Cara terbaik untuk mempersiapkan bagian pemahaman bacaan GED Tes RLA adalah melakukan sebanyak mungkin pertanyaan latihan. Simak sampel untuk melihat apa yang akan Anda hadapi pada hari ujian. Contoh Pertanyaan Pertanyaan 1-6 mengacu pada bagian berikut. Fasilitas untuk Akses ke Perusahaan Kreatif (FACE) Awalnya didirikan ...

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

Komponen bacaan Penalaran meskipun Bahasa Seni Bagian pada GED terdiri dari kutipan dari fiksi dan nonfiksi. Setiap kutipan diikuti oleh beberapa item pilihan berdasarkan bahan bacaan. Untuk pertanyaan di bagian ini, pilih satu jawaban terbaik untuk setiap pertanyaan. Bekerja dengan hati-hati, tapi jangan terlalu banyak menghabiskan waktu ...