Rumah Keuangan Pribadi Bagaimana Mengkonversi Data Mentah menjadi Matriks Analisis Prediktif - dummies

Bagaimana Mengkonversi Data Mentah menjadi Matriks Analisis Prediktif - dummies

Daftar Isi:

Video: Cara Mudah Uji Validitas Menggunakan SPSS - Full Tutorial 2025

Video: Cara Mudah Uji Validitas Menggunakan SPSS - Full Tutorial 2025
Anonim

Sebelum Anda dapat mengekstrak grup dari item data serupa dari kumpulan data Anda untuk proyek analisis prediktif Anda, Anda mungkin perlu merepresentasikan data Anda dalam tabel format yang dikenal sebagai matriks data . Ini adalah langkah preprocessing yang datang sebelum pengelompokkan data.

Bagaimana membuat matriks analisis prediksi dari istilah dalam dokumen

Misalkan kumpulan data yang akan Anda analisis terkandung dalam sekumpulan dokumen Microsoft Word. Hal pertama yang perlu Anda lakukan adalah mengubah kumpulan dokumen menjadi matriks data. Beberapa alat komersial dan open source dapat menangani tugas itu, menghasilkan matriks, di mana setiap baris sesuai dengan dokumen dalam kumpulan data. Contoh alat ini termasuk paket penambangan teks RapidMiner, dan R.

A dokumen pada dasarnya adalah sekumpulan kata. istilah adalah satu set dari satu atau beberapa kata.

Setiap istilah yang disebutkan dalam dokumen disebutkan satu atau beberapa kali dalam dokumen yang sama. Frekuensi istilah yang disebutkan dalam dokumen dapat diwakili oleh istilah frekuensi (TF), sebuah nilai numerik.

Kami membuat matriks istilah dalam dokumen sebagai berikut:

  • Istilah yang muncul di semua dokumen tercantum di baris paling atas.

  • Judul dokumen dicantumkan di kolom paling kiri

  • Angka-angka yang muncul di dalam sel matriks sesuai dengan frekuensi masing-masing.

Misalnya, Dokumen A direpresentasikan sebagai kumpulan angka (5, 16, 0, 19, 0, 0.) di mana 5 sesuai dengan berapa kali istilah analisis prediktif diulang, 16 sesuai dengan angka ke masa ilmu komputer diulang, dan seterusnya. Ini adalah cara termudah untuk mengubah seperangkat dokumen menjadi matriks.

Predictive Analytics Ilmu Komputer Belajar Clustering 2013 Antropologi
Dokumen A 5 16 0 < 19 0 0 Dokumen B
8 6 2 3 0 0 Dokumen C
0 < 5 2 3 3 9 Dokumen D 1
9 13 4 6 7 > Dokumen E 2 16
16 0 2 13 Dokumen F 13 0
19 16 > 4 2 Dasar-dasar pemilihan istilah prediktif Salah satu tantangan dalam mengelompokkan dokumen teks adalah menentukan bagaimana memilih persyaratan terbaik untuk mewakili semua dokumen dalam koleksi. Seberapa penting sebuah istilah dalam kumpulan dokumen dapat dihitung dengan cara yang berbeda. Jika, misalnya, Anda menghitung berapa kali sebuah istilah diulang dalam sebuah dokumen dan bandingkan jumlah itu dengan seberapa sering kejadian itu terjadi berulang-ulang dalam keseluruhan koleksi, Anda bisa merasakan kepentingan istilah tersebut relatif terhadap persyaratan lainnya. Mendasarkan kepentingan relatif sebuah istilah pada frekuensi dalam sebuah koleksi sering dikenal dengan bobot

. Bobot yang Anda tetapkan dapat didasarkan pada dua prinsip:

Persyaratan yang muncul beberapa kali dalam dokumen lebih disukai daripada istilah yang hanya muncul satu kali.

Persyaratan yang digunakan dalam dokumen yang relatif sedikit disukai berdasarkan persyaratan yang disebutkan dalam semua dokumen. Jika (misalnya) istilah abad

  • disebutkan dalam semua dokumen dalam dataset Anda, maka Anda mungkin tidak mempertimbangkan untuk menugaskannya cukup berat untuk memiliki kolomnya sendiri di dalam matriks.

  • Demikian pula, jika Anda berurusan dengan kumpulan data pengguna jaringan sosial online, Anda dapat dengan mudah mengonversi kumpulan data menjadi matriks. User ID atau nama akan menempati baris; kolom akan menampilkan fitur yang paling tepat menggambarkan pengguna tersebut.

Bagaimana Mengkonversi Data Mentah menjadi Matriks Analisis Prediktif - dummies

Pilihan Editor

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Sementara ada cara baru untuk membuat tabel di Office 2011 untuk Mac, Anda masih bisa menggunakan teknik stand-by. Menu yang familiar masih bekerja di Office 2011 untuk Mac, dan inilah buktinya. Dialog meja semuanya masih ada di sana: Di Word, pilih Table → Insert → Table; Sebagai alternatif, pada tab Tabel Ribbon, di Tabel Pilihan ...

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Apakah Anda menggunakan Office 2011 untuk Mac atau Produk Microsoft Office lainnya, toolbar Anda bisa sangat berantakan. Setiap kali Anda merasa perlu untuk men-tweak antarmuka aplikasi Microsoft Office, Anda perlu memanggil dialog Customize Toolbars and Menus. Ini adalah dialog super kuat di Word, Excel, dan PowerPoint yang memungkinkan Anda ...

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Setelah Anda menyesuaikan Office 2011 Anda bilah alat dan antarmuka, Anda dapat berbagi penyesuaian dengan orang lain. Namun, pastikan bahwa Anda menasihati orang-orang yang telah Anda lakukan sebelum membagikan dokumen Anda dengannya; Jika tidak, mereka mungkin akan terkejut saat mereka membuka dokumen Anda dan melihat susunan toolbar atau menu yang berbeda dari pada apa ...

Pilihan Editor

Penting Office 2007 Commands - dummies

Penting Office 2007 Commands - dummies

Anda dapat membuat program Office 2007 lebih mudah jika Anda menggunakan pintasan sederhana ini. Perintah-perintah ini, seperti mengurungkan kesalahan dan memperbesar dan memperkecil akan membantu Anda menghemat waktu. Memasuki simbol: Untuk memasukkan simbol atau karakter asing yang tidak ada pada keyboard Anda, masuk ke tab Insert dan klik Symbol ...

Menyesuaikan Perintah Menu di Office 2003 - dummies

Menyesuaikan Perintah Menu di Office 2003 - dummies

Office 2003 menyediakan dua teknik untuk menyesuaikan menu dan perintah menu. Anda bisa memulai dari kotak dialog Rearrange Commands atau menggunakan metode drag-and-drop. Teruslah membaca. Menangani perintah menu di kotak dialog Rearrange Commands Teknik tombol Options Toolbar untuk menangani tombol toolbar bagus dan keren, tapi bagaimana jika Anda ingin ...

Pilihan Editor

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Ketika Anda menjawab Argument Analysis Pertanyaan di GRE, argumen mungkin tampak logis dan adil di permukaan tapi sebenarnya keliru (keliru, cacat). Alasan melingkar, penalaran sebab-akibat yang keliru, dan generalisasi sweeping adalah tiga tanda argumen lemah. Dengan melihat beberapa kesalahan logis yang lebih umum, Anda dapat mengidentifikasi kelemahan dalam argumen dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Meskipun pertanyaan matematika biasanya hanya memiliki satu jawaban yang benar, ini tidak selalu terjadi. Akibatnya, beberapa pertanyaan pilihan ganda pada tes GRE Math akan memberi Anda daftar jawaban dan meminta Anda untuk memilih lebih dari satu. Pertanyaan praktik berikut meminta Anda untuk menemukan nilai kemungkinan yang berbeda secara berurutan dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pada tes GRE Verbal, beberapa pertanyaan pilihan ganda akan memiliki lebih dari satu jawaban yang benar. Untuk pertanyaan ini, Anda akan diminta untuk melihat-lihat pilihan jawaban dan memilih semua yang menurut Anda benar. Dalam pertanyaan praktik berikut, Anda diminta untuk membaca bagian yang disertakan, dan kemudian ...