Rumah Keuangan Pribadi Fase 4 dari Model Proses CRISP-DM: Model pemodelan - dummies

Fase 4 dari Model Proses CRISP-DM: Model pemodelan - dummies

Daftar Isi:

Video: Proses persalinan Kala 1 - 4 #keperawatan#unhas#OSCE 2024

Video: Proses persalinan Kala 1 - 4 #keperawatan#unhas#OSCE 2024
Anonim

Pemodelan adalah bagian dari Proses Standar Industri Silang untuk model proses Data Mining (CRISP-DM) yang kebanyakan data penambang seperti yang terbaik Data Anda sudah dalam keadaan baik, dan sekarang Anda dapat mencari pola yang berguna dalam data Anda.

Fase pemodelan mencakup empat tugas. Ini adalah

  • Memilih teknik pemodelan

  • Merancang uji

  • Model bangunan

  • Menilai model

Tugas: Memilih teknik pemodelan

Dunia indah data mining menawarkan jumlah besar sekali teknik pemodelan, namun tidak semuanya sesuai dengan kebutuhan Anda. Persempit daftar berdasarkan jenis variabel yang terlibat, pemilihan teknik yang tersedia di alat Anda, dan pertimbangan bisnis apa pun yang penting bagi Anda.

Misalnya, banyak organisasi menyukai metode dengan keluaran yang mudah ditafsirkan, jadi pohon keputusan atau regresi logistik mungkin dapat diterima, namun jaringan syaraf tiruan mungkin tidak akan diterima.

Hasil untuk tugas ini mencakup dua laporan:

  • Teknik pemodelan: Tentukan teknik yang akan Anda gunakan.

  • Asumsi Pemodelan: Banyak teknik pemodelan didasarkan pada asumsi tertentu. Misalnya, jenis model mungkin ditujukan untuk penggunaan dengan data yang memiliki jenis distribusi tertentu. Dokumentasikan asumsi-asumsi ini dalam laporan ini.

Ahli statistik berpengetahuan luas, ketat, dan rewel tentang asumsi. Itu belum tentu benar penambang data, dan itu bukan keharusan menjadi penambang data. Jika Anda memiliki pengetahuan statistik yang dalam dan memahami asumsi di balik model yang Anda pilih, Anda bisa bersikap tegas dan rewel tentang asumsi.

Tapi banyak penambang data, terutama penambang data pemula, tidak terlalu memikirkan asumsi. Alternatifnya adalah pengujian - banyak dan banyak pengujian - dari model Anda.

Tugas: Merancang tes

Tes dalam tugas ini adalah tes yang akan Anda gunakan untuk menentukan seberapa baik model Anda bekerja. Mungkin sesederhana membelah data Anda ke dalam kelompok kasus untuk pelatihan model dan kelompok lain untuk pengujian model.

Data pelatihan digunakan untuk menyesuaikan bentuk matematis dengan model data, dan data uji digunakan selama proses pelatihan model untuk menghindari overfitting: membuat model yang sempurna untuk satu dataset, namun tidak ada yang lain. Anda juga dapat menggunakan data holdout , data yang tidak digunakan selama proses pelatihan model, untuk tes tambahan.

Penyerahan tugas ini adalah desain uji Anda. Ini tidak perlu rumit, tapi setidaknya Anda harus memperhatikan bahwa data pelatihan dan pengujian Anda serupa dan Anda menghindari mengenalkan bias ke dalam data.

Tugas: Model bangunan

Pemodelan adalah apa yang banyak orang bayangkan sebagai keseluruhan pekerjaan penambang data, tapi hanya satu tugas belasan! Meskipun demikian, pemodelan untuk menangani tujuan bisnis yang spesifik adalah inti dari profesi penambangan data.

Hasil yang diharapkan untuk tugas ini mencakup tiga item:

  • Pengaturan parameter: Saat membuat model, kebanyakan alat memberi Anda pilihan untuk menyesuaikan berbagai pengaturan, dan pengaturan ini berdampak pada struktur model akhir.. Dokumentasikan pengaturan ini dalam laporan.

  • Deskripsi model: Jelaskan model Anda. Sebutkan jenis model (seperti regresi linier atau jaringan syaraf tiruan) dan variabel yang digunakan. Jelaskan bagaimana model ditafsirkan. Dokumentasikan kesulitan yang dihadapi dalam proses pemodelan.

  • Model: Penyerahan ini adalah modelnya sendiri. Beberapa tipe model dapat dengan mudah didefinisikan dengan persamaan sederhana; yang lain terlalu rumit dan harus ditransmisikan dalam format yang lebih canggih.

Tugas: Menilai model

Sekarang Anda akan meninjau model yang telah Anda buat, dari sudut pandang teknis dan juga dari sudut pandang bisnis (seringkali dengan masukan dari pakar bisnis di tim proyek Anda).

Hasil untuk tugas ini mencakup dua laporan:

  • Penilaian model: Ringkaskan informasi yang dikembangkan dalam tinjauan model Anda. Jika Anda telah membuat beberapa model, Anda mungkin memberi peringkat berdasarkan penilaian nilai mereka untuk aplikasi tertentu.

  • Pengaturan parameter yang telah direvisi: Anda dapat memilih untuk menyempurnakan pengaturan yang digunakan untuk membangun model dan melakukan putaran pemodelan lainnya dan mencoba memperbaiki hasil Anda.

Saat merasa nyaman dalam karir penambangan data baru Anda, akan masuk akal jika Anda mengetahui parameter model dan mengetahui bagaimana Anda bisa menggunakannya. Pilihan Anda akan sangat bervariasi dengan jenis model dan alat khusus yang Anda gunakan.

Fase 4 dari Model Proses CRISP-DM: Model pemodelan - dummies

Pilihan Editor

Bertahan dalam Zombie Sieges di Minecraft - dummies

Bertahan dalam Zombie Sieges di Minecraft - dummies

Bermasalah dengan zombie yang menyerang desa Anda pada malam hari di Minecraft? Pelajari bagaimana untuk membela diri, menyembuhkan penduduk desa zombie, dan pulihkan dunia Anda!

Zaman Batu di Minecraft - dummies

Zaman Batu di Minecraft - dummies

Tonggak penting dalam mode Minecraft Survival, dan yang dicapai oleh beberapa pemain di Hari pertama, mencapai Zaman Batu. Setelah Anda membuat pickax kayu dan Anda bisa menemukan gua atau menggali lubang, item dalam tabel berikut tersedia untuk Anda. Sebagian besar bahan berbasis batu lebih padat dari yang lain ...

Zaman Looting di Minecraft - dummies

Zaman Looting di Minecraft - dummies

Anda mencapai Usia Looting di Minecraft di awal permainan - kadang-kadang, bahkan paralel untuk mencapai Era Kayu. Anda mulai dengan membunuh musuh untuk menjarah, dan dengan menggunakan jarahan untuk memperbaiki repertoar kerajinan Anda. Lebih banyak item kemudian tersedia bagi Anda, seperti tercantum dalam tabel. Semua alat meningkatkan jumlah ...

Pilihan Editor

Infografis tepat waktu: Berbagi Breaking News - dummies

Infografis tepat waktu: Berbagi Breaking News - dummies

Walaupun infografik Anda tidak mungkin menjadi satu-satunya sumber berita, Ini bisa membantu pemahaman pembaca akan sebuah acara berita. Misalnya, banyak orang belajar di Twitter pada bulan Oktober, 2011 bahwa pendiri Apple Steve Jobs telah meninggal dunia. Infografis tidak akan menjadi orang pertama yang mendengarnya. Tapi orang-orang ...

Pilihan Editor

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

GED Contoh Pertanyaan: Pertanyaan Ilmu Fisik - dummies

Ketika Anda mencapai bagian Sains GED, Anda akan diharapkan memiliki pengetahuan umum di semua cabang Ilmu Pengetahuan, termasuk Ilmu Fisika. Berikut adalah contoh jenis pertanyaan yang mungkin Anda hadapi pada hari ujian. Kecepatan dan Kecepatan Ada perbedaan antara kecepatan dan kecepatan, meskipun terkadang Anda ...

Latihan GED RLA: Reading Comprehension - dummies

Latihan GED RLA: Reading Comprehension - dummies

Cara terbaik untuk mempersiapkan bagian pemahaman bacaan GED Tes RLA adalah melakukan sebanyak mungkin pertanyaan latihan. Simak sampel untuk melihat apa yang akan Anda hadapi pada hari ujian. Contoh Pertanyaan Pertanyaan 1-6 mengacu pada bagian berikut. Fasilitas untuk Akses ke Perusahaan Kreatif (FACE) Awalnya didirikan ...

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

GED Penalaran melalui Latihan Keterampilan Membaca Bahasa Seni - dummies

Komponen bacaan Penalaran meskipun Bahasa Seni Bagian pada GED terdiri dari kutipan dari fiksi dan nonfiksi. Setiap kutipan diikuti oleh beberapa item pilihan berdasarkan bahan bacaan. Untuk pertanyaan di bagian ini, pilih satu jawaban terbaik untuk setiap pertanyaan. Bekerja dengan hati-hati, tapi jangan terlalu banyak menghabiskan waktu ...