Rumah Keuangan Pribadi Bagaimana Menghasilkan Data Berasal Berasal dan Mengurangi Dimensinya untuk Analisis Prediktif - dummies

Bagaimana Menghasilkan Data Berasal Berasal dan Mengurangi Dimensinya untuk Analisis Prediktif - dummies

Daftar Isi:

Video: (Indonesian) THRIVE: What On Earth Will It Take? 2024

Video: (Indonesian) THRIVE: What On Earth Will It Take? 2024
Anonim

Dalam tahap eksplorasi analisis prediktif ini, Anda akan mendapatkan pengetahuan mendalam tentang data Anda - yang pada gilirannya akan membantu Anda memilih variabel yang relevan untuk dianalisis. Pemahaman ini juga akan membantu Anda mengevaluasi hasil model Anda. Tapi pertama-tama Anda harus mengidentifikasi dan membersihkan data untuk analisis.

Cara menghasilkan data turunan

Atribut turunan seluruhnya merupakan catatan baru yang dibuat dari satu atau lebih atribut yang ada. Contohnya adalah pembuatan catatan yang mengidentifikasi buku-buku yang terlaris di pameran buku. Data mentah mungkin tidak menangkap catatan seperti itu - tetapi untuk tujuan pemodelan, catatan turunan itu penting. Rasio harga per saham dan rata-rata pergerakan 200 hari adalah dua contoh data turunan yang banyak digunakan dalam aplikasi keuangan.

Atribut turunan dapat diperoleh dari perhitungan sederhana seperti menyimpulkan umur dari tanggal lahir. Atribut yang diturunkan juga dapat dihitung dengan meringkas informasi dari banyak catatan. Misalnya, mengubah tabel pelanggan dan buku yang dibeli ke dalam tabel dapat memungkinkan Anda untuk melacak jumlah buku yang terjual melalui sistem recommender, melalui pemasaran yang ditargetkan, dan di pameran buku - dan mengidentifikasi demografi pelanggan yang membeli buku-buku itu

Membangkitkan atribut tambahan semacam itu membawa kekuatan prediktif tambahan ke analisis. Sebenarnya, banyak atribut semacam itu diciptakan untuk menyelidiki potensi kekuatan prediksi mereka. Beberapa model prediktif dapat menggunakan atribut turunan lebih banyak daripada atribut dalam keadaan mentahnya. Jika beberapa atribut turunan terbukti sangat prediktif dan kekuatan mereka terbukti relevan, maka masuk akal untuk mengotomatisasi proses yang menghasilkannya.

Catatan yang berasal adalah catatan baru yang membawa informasi baru dan memberikan cara baru dalam menyajikan data mentah; mereka bisa menjadi nilai yang luar biasa untuk pemodelan prediktif.

Bagaimana mengurangi dimensi data Anda

Data yang digunakan dalam model prediktif biasanya dikumpulkan dari berbagai sumber. Analisis Anda dapat menarik dari data yang tersebar di beberapa format data, file, dan database, atau beberapa tabel dalam database yang sama. Menyatukan data bersama-sama dan menggabungkannya ke dalam format terpadu agar pemodel data dapat digunakan sangat penting.

Jika data Anda mengandung konten hierarkis, itu mungkin perlu

diratakan . Beberapa data memiliki beberapa karakteristik hierarkis seperti hubungan orang tua-anak, atau catatan yang terdiri dari rekaman lainnya.Misalnya, produk seperti mobil mungkin memiliki banyak pembuat; Perataan data, dalam hal ini, berarti mencakup setiap pembuat sebagai fitur tambahan dari rekaman yang Anda analisis. Data perataan sangat penting saat menggabungkan beberapa catatan terkait untuk menghasilkan gambar yang lebih baik.

Sebagai contoh, menganalisis efek samping untuk beberapa obat yang dibuat oleh beberapa perusahaan mungkin mengharuskan data tersebut diratakan pada tingkat substansi. Dengan demikian, Anda akhirnya menghapus

hubungan satu-ke-banyak (dalam hal ini, banyak pembuat dan banyak zat untuk satu produk) yang dapat menyebabkan duplikasi data terlalu banyak dengan mengulangi banyak masukan zat yang berulang informasi produk dan pembuat di setiap entri. Perataan mengurangi

dimensi data , yang ditunjukkan oleh jumlah fitur yang ada dalam catatan atau pengamatan. Misalnya, pelanggan dapat memiliki beberapa fitur berikut: nama, usia, alamat, item yang dibeli. Ketika Anda memulai analisis Anda, Anda mungkin menemukan diri Anda mengevaluasi catatan dengan banyak fitur, hanya beberapa yang penting untuk analisisnya. Jadi, Anda harus menghilangkan semua kecuali beberapa fitur yang memiliki kekuatan paling prediktif untuk proyek spesifik Anda.

Mengurangi dimensi data dapat dicapai dengan meletakkan semua data dalam satu tabel yang menggunakan beberapa kolom untuk mewakili atribut yang diminati. Pada permulaan analisis, tentu saja, analisis harus mengevaluasi sejumlah besar kolom - namun angka tersebut dapat dipersempit seiring analisis berlangsung.

Proses ini dapat dibantu dengan menyusun kembali bidang - misalnya, dengan mengelompokkan data dalam kategori yang memiliki karakteristik serupa.

Dataset yang dihasilkan - kumpulan data yang dibersihkan - biasanya dimasukkan ke basis data terpisah untuk digunakan para analis. Selama proses pemodelan, data ini harus mudah diakses, dikelola, dan tetap up to date.

Bagaimana Menghasilkan Data Berasal Berasal dan Mengurangi Dimensinya untuk Analisis Prediktif - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...