Rumah Keuangan Pribadi Bagaimana Menghasilkan Data Berasal Berasal dan Mengurangi Dimensinya untuk Analisis Prediktif - dummies

Bagaimana Menghasilkan Data Berasal Berasal dan Mengurangi Dimensinya untuk Analisis Prediktif - dummies

Daftar Isi:

Video: (Indonesian) THRIVE: What On Earth Will It Take? 2025

Video: (Indonesian) THRIVE: What On Earth Will It Take? 2025
Anonim

Dalam tahap eksplorasi analisis prediktif ini, Anda akan mendapatkan pengetahuan mendalam tentang data Anda - yang pada gilirannya akan membantu Anda memilih variabel yang relevan untuk dianalisis. Pemahaman ini juga akan membantu Anda mengevaluasi hasil model Anda. Tapi pertama-tama Anda harus mengidentifikasi dan membersihkan data untuk analisis.

Cara menghasilkan data turunan

Atribut turunan seluruhnya merupakan catatan baru yang dibuat dari satu atau lebih atribut yang ada. Contohnya adalah pembuatan catatan yang mengidentifikasi buku-buku yang terlaris di pameran buku. Data mentah mungkin tidak menangkap catatan seperti itu - tetapi untuk tujuan pemodelan, catatan turunan itu penting. Rasio harga per saham dan rata-rata pergerakan 200 hari adalah dua contoh data turunan yang banyak digunakan dalam aplikasi keuangan.

Atribut turunan dapat diperoleh dari perhitungan sederhana seperti menyimpulkan umur dari tanggal lahir. Atribut yang diturunkan juga dapat dihitung dengan meringkas informasi dari banyak catatan. Misalnya, mengubah tabel pelanggan dan buku yang dibeli ke dalam tabel dapat memungkinkan Anda untuk melacak jumlah buku yang terjual melalui sistem recommender, melalui pemasaran yang ditargetkan, dan di pameran buku - dan mengidentifikasi demografi pelanggan yang membeli buku-buku itu

Membangkitkan atribut tambahan semacam itu membawa kekuatan prediktif tambahan ke analisis. Sebenarnya, banyak atribut semacam itu diciptakan untuk menyelidiki potensi kekuatan prediksi mereka. Beberapa model prediktif dapat menggunakan atribut turunan lebih banyak daripada atribut dalam keadaan mentahnya. Jika beberapa atribut turunan terbukti sangat prediktif dan kekuatan mereka terbukti relevan, maka masuk akal untuk mengotomatisasi proses yang menghasilkannya.

Catatan yang berasal adalah catatan baru yang membawa informasi baru dan memberikan cara baru dalam menyajikan data mentah; mereka bisa menjadi nilai yang luar biasa untuk pemodelan prediktif.

Bagaimana mengurangi dimensi data Anda

Data yang digunakan dalam model prediktif biasanya dikumpulkan dari berbagai sumber. Analisis Anda dapat menarik dari data yang tersebar di beberapa format data, file, dan database, atau beberapa tabel dalam database yang sama. Menyatukan data bersama-sama dan menggabungkannya ke dalam format terpadu agar pemodel data dapat digunakan sangat penting.

Jika data Anda mengandung konten hierarkis, itu mungkin perlu

diratakan . Beberapa data memiliki beberapa karakteristik hierarkis seperti hubungan orang tua-anak, atau catatan yang terdiri dari rekaman lainnya.Misalnya, produk seperti mobil mungkin memiliki banyak pembuat; Perataan data, dalam hal ini, berarti mencakup setiap pembuat sebagai fitur tambahan dari rekaman yang Anda analisis. Data perataan sangat penting saat menggabungkan beberapa catatan terkait untuk menghasilkan gambar yang lebih baik.

Sebagai contoh, menganalisis efek samping untuk beberapa obat yang dibuat oleh beberapa perusahaan mungkin mengharuskan data tersebut diratakan pada tingkat substansi. Dengan demikian, Anda akhirnya menghapus

hubungan satu-ke-banyak (dalam hal ini, banyak pembuat dan banyak zat untuk satu produk) yang dapat menyebabkan duplikasi data terlalu banyak dengan mengulangi banyak masukan zat yang berulang informasi produk dan pembuat di setiap entri. Perataan mengurangi

dimensi data , yang ditunjukkan oleh jumlah fitur yang ada dalam catatan atau pengamatan. Misalnya, pelanggan dapat memiliki beberapa fitur berikut: nama, usia, alamat, item yang dibeli. Ketika Anda memulai analisis Anda, Anda mungkin menemukan diri Anda mengevaluasi catatan dengan banyak fitur, hanya beberapa yang penting untuk analisisnya. Jadi, Anda harus menghilangkan semua kecuali beberapa fitur yang memiliki kekuatan paling prediktif untuk proyek spesifik Anda.

Mengurangi dimensi data dapat dicapai dengan meletakkan semua data dalam satu tabel yang menggunakan beberapa kolom untuk mewakili atribut yang diminati. Pada permulaan analisis, tentu saja, analisis harus mengevaluasi sejumlah besar kolom - namun angka tersebut dapat dipersempit seiring analisis berlangsung.

Proses ini dapat dibantu dengan menyusun kembali bidang - misalnya, dengan mengelompokkan data dalam kategori yang memiliki karakteristik serupa.

Dataset yang dihasilkan - kumpulan data yang dibersihkan - biasanya dimasukkan ke basis data terpisah untuk digunakan para analis. Selama proses pemodelan, data ini harus mudah diakses, dikelola, dan tetap up to date.

Bagaimana Menghasilkan Data Berasal Berasal dan Mengurangi Dimensinya untuk Analisis Prediktif - dummies

Pilihan Editor

SharePoint 2010 Edit Menu - dummies

SharePoint 2010 Edit Menu - dummies

SharePoint 2010 menyediakan dua metode untuk bekerja dengan dokumen. Setiap dokumen memiliki menu Edit yang dapat Anda gunakan untuk mengambil beberapa tindakan pada dokumen itu, seperti memeriksanya untuk diedit. Ribbon juga menampilkan serangkaian tindakan yang dapat dilakukan pada masing-masing dokumen atau sekelompok dokumen yang dipilih. Mengakses ...

SharePoint 2010 Halaman Master dan Galeri Tata Letak Halaman - dummies

SharePoint 2010 Halaman Master dan Galeri Tata Letak Halaman - dummies

Jika Anda berada di situs kolaborasi SharePoint 2010 koleksi, Anda bisa mencatat galeri Master Page di Galeri, namun tidak ada link untuk menerapkan halaman utama di bagian Look and Feel. Di situs penerbitan, Anda memiliki galeri Halaman Utama dan Galeri Page Layout serta pilihan Master Page di ...

Kerangka situs Business Intelligence Center SharePoint 2010 - dummies

Kerangka situs Business Intelligence Center SharePoint 2010 - dummies

Template situs Business Intelligence Center yang baru di SharePoint 2010 menyatukan semuanya untuk Anda guna memantau, menganalisis, dan mewakili data kinerja dan hasil dalam organisasi Anda. Untuk membuat situs berdasarkan template Business Intelligence Center, Anda harus memiliki fitur PerformancePoint Services Site Collection yang diaktifkan. Jika Anda bukan ...

Pilihan Editor

Manfaat Memotret di Alam pada masa siang hari

Manfaat Memotret di Alam pada masa siang hari

Jika Anda kebetulan melakukan pemotretan di alam tengah hari, maka Anda mungkin memiliki waktu yang lebih sulit menemukan cahaya yang memiliki arah atau kualitas yang Anda inginkan. Matahari bertumpu tinggi di langit untuk sebagian besar hari itu, berseri lurus ke bawah pada subjek Anda ...

Manfaat Kamera Digital Kompak untuk Fotografi HDR

Manfaat Kamera Digital Kompak untuk Fotografi HDR

(Kadang disebut titik digital - dan - kamera shoot) adalah yang termurah masuk ke fotografi dengan rentang dinamis tinggi. Anda bisa membelinya seharga sekitar $ 100 dan memulai karir Anda tanpa harus mendapatkan hipotek kedua di rumah Anda. Berikut adalah beberapa model yang bisa sesuai dengan tagihan. Nikon Coolpix S220 dan Canon PowerShot A480 ...

HDR hitam-putih: Berwarna dengan Elemen Variasi Warna Alat - dummies

HDR hitam-putih: Berwarna dengan Elemen Variasi Warna Alat - dummies

Salah satu pilihan untuk mewarnai gambar kisaran dinamis hitam-putih tinggi (HDR) di Photoshop Elements adalah dengan menggunakan alat Variasi Warna. Beberapa kontrol tersedia di sini dimana Anda dapat menambah atau mengurangi warna pada daerah nada tertentu. Dengan kata lain, jika Anda ingin meningkatkan warna hijau dalam bayang-bayang, Anda bisa. Kelemahannya adalah bahwa ...

Pilihan Editor

Membangun Swift Outlets and Actions with Xcode - dummies

Membangun Swift Outlets and Actions with Xcode - dummies

Xcode memiliki Interface Builder yang terpasang di dalamnya sehingga Anda dapat merancang antarmuka Anda secara grafis Kunci untuk membuat semuanya bekerja adalah menghubungkan elemen grafis dari Interface Builder ke file Swift Anda. Xcode memudahkan - cukup ikuti langkah berikut: Buka Utama. storyboard Papan cerita utama Anda mungkin memiliki nama yang berbeda; ini ...

Memilih Bagaimana Melaksanakan Fungsi di Swift - dummies

Memilih Bagaimana Melaksanakan Fungsi di Swift - dummies

Saat Anda sedang berpikir untuk membuat sebuah aplikasi, bagaimana caranya? Anda memutuskan bagaimana menerapkan fungsinya? Swift, bersama dengan kerangka Cocoa and Cocoa Touch, menyediakan berbagai macam alat untuk membantu Anda. Berikut adalah daftar beberapa pertanyaan untuk diajukan kepada diri sendiri saat menentukan mana yang akan digunakan: Apakah ini sesuatu yang ...

Memoles Alat Pengembangan Anda untuk Pemasar Kakao - dummies

Memoles Alat Pengembangan Anda untuk Pemasar Kakao - dummies

Kakao adalah salah satu jenis program yang dapat Anda lakukan dengan Apple's Alat pengembang. Kakao adalah kumpulan alat dan perpustakaan yang memungkinkan Anda mendapatkan hasil maksimal dari pemrograman Mac OS X. Banyak fitur membuat Cocoa hebat, termasuk yang berikut: Desain berorientasi objek modular Penggunaan kerangka kerja Desain antarmuka visual Mengapa program dengan ...