Rumah Keuangan Pribadi Fase 2 dari Model Proses CRISP-DM: Pemahaman Data - dummies

Fase 2 dari Model Proses CRISP-DM: Pemahaman Data - dummies

Daftar Isi:

Video: CRISP DM 2024

Video: CRISP DM 2024
Anonim

Pada tahap kedua dari model Proses Standar Industri Silang untuk Proses Data Mining (CRISP-DM), Anda mendapatkan data dan verifikasi itu sesuai dengan kebutuhan anda Anda mungkin mengidentifikasi masalah yang menyebabkan Anda kembali ke pemahaman bisnis dan merevisi rencana Anda. Anda bahkan mungkin menemukan kekurangan dalam pemahaman bisnis Anda, alasan lain untuk memikirkan kembali tujuan dan rencana.

Tahap pemahaman data mencakup empat tugas . Ini adalah

  • Mengumpulkan data

  • Menggambarkan data

  • Mengeksplorasi data

  • Memeriksa kualitas data

Tugas: Mengumpulkan data

Anda baru saja menetapkan sasaran dan menetapkan rencana penambangan data. Setiap langkah dari rencana tersebut bergantung pada data yang benar. Lebih baik pastikan Anda benar-benar memiliki data itu!

Hanya ada satu penyampaian untuk tugas ini: laporan pengumpulan data awal. Dalam laporan Anda, Anda perlu memverifikasi bahwa Anda telah memperoleh data atau setidaknya memperoleh akses ke data, menguji proses akses data, dan memverifikasi bahwa datanya ada. Anda juga perlu memuat data ke alat yang akan Anda gunakan untuk data mining untuk memverifikasi bahwa alat tersebut kompatibel dengan data.

Anda dapat melakukan banyak pekerjaan untuk mengumpulkan data yang Anda butuhkan sebelum Anda dapat menulis laporan ini. Pertama, Anda akan membuat rencana Anda, sebagai berikut:

  • Menguraikan persyaratan data: Buat daftar jenis data yang diperlukan untuk menangani sasaran data mining. Perluas daftar dengan rincian seperti rentang waktu dan format data yang diperlukan.

  • Verifikasi ketersediaan data: Konfirmasikan bahwa data yang diperlukan ada, dan Anda dapat menggunakannya. Jika beberapa data yang Anda inginkan tidak tersedia, putuskan bagaimana Anda akan mengatasi masalah itu. Pertimbangkan alternatif seperti

    • Mengganti dengan sumber data alternatif

    • Mempersempit ruang lingkup proyek

    • Mengumpulkan data baru

  • Tentukan kriteria seleksi: Identifikasi sumber data spesifik (database, file, dokumen, dan sebagainya.) Anda akan menggunakannya. Di dalam sumber tersebut, tentukan tabel, kolom, dan rentang kasus yang relevan dengan proyek ini.

Setelah Anda melalui langkah-langkah ini, Anda benar-benar harus mendapatkan data. Pada tahap ini, impor data ke dalam platform penambangan data yang akan Anda gunakan untuk proyek tersebut untuk memastikan bahwa hal itu mungkin dilakukan dan Anda memahami prosesnya. Dalam proses uji coba ini Anda mungkin menemukan keterbatasan perangkat lunak (atau perangkat keras) yang tidak Anda duga, seperti

  • Batas jumlah kasus atau bidang, atau jumlah memori yang mungkin Anda gunakan

  • Ketidakmampuan untuk membaca format data sumber Anda

  • Kesulitan menangani ketidaksempurnaan dalam data (misalnya, Anda mungkin menemukan produk yang tidak akan mengimpor atau menganalisis kumpulan data yang tidak lengkap)

Akhirnya, rangkum proses pengumpulan dalam sebuah laporan.Laporan tersebut harus menjelaskan kebutuhan Anda, dan jelaskan secara terperinci data apa yang telah Anda kumpulkan dan dari sumber apa. Di sini Anda mengkonfirmasi bahwa Anda benar-benar memperoleh data dan kompatibel dengan platform penambangan data Anda. Jika Anda mengalami kesulitan, Anda akan menjelaskannya dan bagaimana Anda membicarakannya (menggunakan sumber alternatif, merevisi rencana, mengubah format).

Penyerahan tugas ini hanyalah sebuah laporan sederhana, namun pekerjaan yang harus Anda lakukan sebelum Anda dapat menulis laporan itu tidak akan mudah dilakukan! Akses data bisa menjadi salah satu bagian proses penambangan data yang paling menantang dan menyebalkan, yang penuh tantangan teknis dan bisnis.

Tugas: Menggambarkan data

Sekarang Anda memiliki data, siapkan deskripsi umum tentang apa yang Anda miliki.

Penyerahan tugas ini adalah laporan deskripsi data. Di dalamnya, Anda menggambarkan sumber dan format data, jumlah kasus, jumlah dan deskripsi bidang, dan informasi umum lainnya yang mungkin penting. Anda juga membuat evaluasi singkat tentang kesesuaian data untuk tujuan penambangan data Anda. Misalnya, pastikan bahwa data mencakup bidang yang Anda harapkan dan perlu berada di sana dan cukup banyak kasus untuk analisis.

Tugas: Menjelajahi data

Dalam tugas ini, Anda memeriksa datanya lebih dekat. Untuk setiap variabel, Anda melihat kisaran nilai dan distribusinya. Anda akan menggunakan manipulasi data sederhana dan teknik statistik dasar untuk pemeriksaan lebih lanjut ke dalam data. Eksplorasi data mendukung beberapa tujuan:

  • Kenali data.

  • Tanda titik-titik masalah kualitas data.

  • Tetapkan panggung untuk langkah persiapan data.

Penyerahan tugas ini adalah laporan eksplorasi data. Ini adalah tempat untuk mendokumentasikan hipotesis atau temuan awal yang telah Anda kembangkan selama eksplorasi data. Laporan ini harus mencakup deskripsi data yang lebih rinci daripada laporan deskripsi data, termasuk distribusi, ringkasan, dan tanda-tanda masalah kualitas data.

Tugas: Memeriksa kualitas data

Anda memiliki data dan Anda telah memeriksanya, dan sekarang Anda harus menentukan apakah itu cukup baik untuk mendukung tujuan Anda. Anda akan sering memiliki beberapa masalah kualitas untuk ditangani namun tetap dapat bergerak maju, namun terkadang kualitas data sangat buruk sehingga tidak dapat mendukung rencana Anda dan Anda harus mencari alternatif. Beberapa masalah data terburuk akan mencakup

  • Data yang Anda butuhkan tidak ada. (Apakah tidak pernah ada, atau apakah itu dibuang? Dapatkah data ini dikumpulkan dan disimpan untuk digunakan di masa depan?)

  • Itu ada, namun Anda tidak dapat memilikinya. (Dapatkah pembatasan ini dapat diatasi?)

  • Anda menemukan masalah kualitas data yang parah (banyak nilai yang hilang atau salah yang tidak dapat diperbaiki).

Penyerahan tugas ini adalah laporan kualitas data. Ini merangkum data yang Anda miliki, masalah kualitas kecil dan utama yang telah Anda temukan, dan kemungkinan solusi untuk masalah kualitas atau alternatif (seperti menggunakan sumber data alternatif).Jika Anda menghadapi masalah kualitas data yang serius dan tidak dapat mengidentifikasi solusi yang memadai, Anda mungkin harus merekomendasikan untuk mempertimbangkan kembali tujuan atau rencana.

Fase 2 dari Model Proses CRISP-DM: Pemahaman Data - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...