Rumah Keuangan Pribadi Text Analytics for Unstructured Big Data - dummies

Text Analytics for Unstructured Big Data - dummies

Video: Text Analytics - Ep. 25 (Deep Learning SIMPLIFIED) 2025

Video: Text Analytics - Ep. 25 (Deep Learning SIMPLIFIED) 2025
Anonim

Banyak metode yang ada untuk menganalisis data tidak terstruktur untuk inisiatif data besar Anda. Secara historis, teknik ini keluar dari bidang teknis seperti Natural Language Processing (NLP), penemuan pengetahuan, data mining, pencarian informasi, dan statistik. Analisis teks adalah proses menganalisis teks tidak terstruktur, mengekstrak informasi yang relevan, dan mengubahnya menjadi informasi terstruktur yang kemudian dapat dimanfaatkan dengan berbagai cara.

Proses analisis dan ekstraksi memanfaatkan teknik yang berasal dari bahasa linguistik komputasi, statistik, dan disiplin ilmu komputer lainnya.

Terkadang sebuah contoh dapat membantu menjelaskan topik yang kompleks. Misalkan Anda bekerja untuk departemen pemasaran di perusahaan telepon nirkabel. Anda baru saja meluncurkan dua rencana pemanggilan baru - Rencana A dan Rencana B - dan Anda tidak mendapatkan pengambilan yang Anda inginkan di Plan A. Teks yang tidak terstruktur dari catatan call center mungkin memberi Anda beberapa wawasan mengapa ini terjadi.

Kata-kata yang digarisbawahi memberikan informasi yang mungkin perlu Anda ketahui mengapa Plan A tidak mendapatkan adopsi yang cepat. Misalnya, entitas Plan A muncul di sepanjang catatan call center, menunjukkan bahwa laporan tersebut menyebutkan rencananya.

Jumlah kata-kata roll-over minutes, data 4GB, data plan, dan expensive adalah bukti bahwa ada masalah dengan roll-over minutes, data plan, dan harga. Kata-kata seperti konyol dan bodoh memberi wawasan tentang sentimen pemanggil, yang dalam hal ini negatif.

Proses analisis teks menggunakan berbagai algoritma, seperti memahami struktur kalimat, untuk menganalisis teks yang tidak terstruktur dan kemudian mengekstrak informasi, dan mengubah informasi tersebut menjadi data terstruktur. Data terstruktur yang diambil dari teks yang tidak terstruktur diilustrasikan pada Tabel 13-1.

Identifier

Entity Keluarkan Sentimen Cust XYZ
Rencanakan A Roll-over minutes Netral Cust ABC
Rencanakan A Roll-over minutes Negatif XXXX
Rencanakan A Mahal Netral XXXX
Rencana A Rencana data Netral Cust XYT > Rencana A
Rencana Data Negatif Anda mungkin melihat ini dan berkata, "Tapi saya dapat menemukannya dengan melihat catatan call center. "Namun, ini hanya sebagian kecil dari informasi yang dicatat oleh ribuan agen call center. Setiap agen individual tidak mungkin merasakan kecenderungan yang luas mengenai masalah ini dengan setiap rencana yang ditawarkan oleh perusahaan. Agen tidak memiliki waktu atau persyaratan untuk berbagi informasi ini di semua agen call center lainnya yang mungkin mendapatkan nomor telepon yang serupa tentang Plan A. Namun, setelah informasi ini dikumpulkan dan diproses menggunakan algoritma analisis teks, sebuah tren mungkin muncul dari data tidak terstruktur ini. Itulah yang membuat analisis teks begitu hebat.

Pencarian adalah tentang mengambil dokumen berdasarkan apa yang pengguna akhir sudah tahu yang mereka cari. Analisis teks adalah tentang menemukan informasi. Sementara analisis teks berbeda dengan pencarian, teknik ini dapat menambah teknik pencarian. Misalnya, analisis teks dikombinasikan dengan pencarian dapat digunakan untuk memberikan kategorisasi atau klasifikasi dokumen yang lebih baik dan untuk menghasilkan abstrak atau ringkasan dokumen.

Ada empat teknologi: query, data mining, search, dan text analytics. Di sisi kiri tabel adalah query dan pencarian, yang keduanya tentang pengambilan. Misalnya, pengguna akhir bisa meminta database untuk mengetahui berapa banyak pelanggan yang berhenti menggunakan layanan perusahaan pada bulan lalu.

Permintaan akan mengembalikan satu nomor. Hanya dengan bertanya lebih banyak dan berbeda, pengguna akan mendapatkan informasi yang dibutuhkan untuk menentukan mengapa pelanggan pergi. Demikian juga, pencarian kata kunci memungkinkan pengguna akhir menemukan dokumen yang berisi nama pesaing perusahaan. Pencarian akan mengembalikan sekumpulan dokumen. Hanya dengan membaca dokumen, pengguna akhir akan mendapatkan jawaban yang relevan.

Retrieval

Wawasan

Text Analytics for Unstructured Big Data - dummies

Pilihan Editor

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Kantor 2011 untuk Mac: Membuat Tabel dengan Kotak Dialog atau Teks - dummies

Sementara ada cara baru untuk membuat tabel di Office 2011 untuk Mac, Anda masih bisa menggunakan teknik stand-by. Menu yang familiar masih bekerja di Office 2011 untuk Mac, dan inilah buktinya. Dialog meja semuanya masih ada di sana: Di Word, pilih Table → Insert → Table; Sebagai alternatif, pada tab Tabel Ribbon, di Tabel Pilihan ...

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Kantor 2011 untuk Mac: Melepaskan Command Toolbar - dummies

Apakah Anda menggunakan Office 2011 untuk Mac atau Produk Microsoft Office lainnya, toolbar Anda bisa sangat berantakan. Setiap kali Anda merasa perlu untuk men-tweak antarmuka aplikasi Microsoft Office, Anda perlu memanggil dialog Customize Toolbars and Menus. Ini adalah dialog super kuat di Word, Excel, dan PowerPoint yang memungkinkan Anda ...

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Kantor 2011 untuk Mac: Berbagi Toolbar dan Menu - dummies

Setelah Anda menyesuaikan Office 2011 Anda bilah alat dan antarmuka, Anda dapat berbagi penyesuaian dengan orang lain. Namun, pastikan bahwa Anda menasihati orang-orang yang telah Anda lakukan sebelum membagikan dokumen Anda dengannya; Jika tidak, mereka mungkin akan terkejut saat mereka membuka dokumen Anda dan melihat susunan toolbar atau menu yang berbeda dari pada apa ...

Pilihan Editor

Penting Office 2007 Commands - dummies

Penting Office 2007 Commands - dummies

Anda dapat membuat program Office 2007 lebih mudah jika Anda menggunakan pintasan sederhana ini. Perintah-perintah ini, seperti mengurungkan kesalahan dan memperbesar dan memperkecil akan membantu Anda menghemat waktu. Memasuki simbol: Untuk memasukkan simbol atau karakter asing yang tidak ada pada keyboard Anda, masuk ke tab Insert dan klik Symbol ...

Menyesuaikan Perintah Menu di Office 2003 - dummies

Menyesuaikan Perintah Menu di Office 2003 - dummies

Office 2003 menyediakan dua teknik untuk menyesuaikan menu dan perintah menu. Anda bisa memulai dari kotak dialog Rearrange Commands atau menggunakan metode drag-and-drop. Teruslah membaca. Menangani perintah menu di kotak dialog Rearrange Commands Teknik tombol Options Toolbar untuk menangani tombol toolbar bagus dan keren, tapi bagaimana jika Anda ingin ...

Pilihan Editor

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Bagaimana memecahkan kesalahan logis dalam analisis argumen Pertanyaan GRE - dummies

Ketika Anda menjawab Argument Analysis Pertanyaan di GRE, argumen mungkin tampak logis dan adil di permukaan tapi sebenarnya keliru (keliru, cacat). Alasan melingkar, penalaran sebab-akibat yang keliru, dan generalisasi sweeping adalah tiga tanda argumen lemah. Dengan melihat beberapa kesalahan logis yang lebih umum, Anda dapat mengidentifikasi kelemahan dalam argumen dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Matematika GRE - Pertanyaan Praktik - dummies

Meskipun pertanyaan matematika biasanya hanya memiliki satu jawaban yang benar, ini tidak selalu terjadi. Akibatnya, beberapa pertanyaan pilihan ganda pada tes GRE Math akan memberi Anda daftar jawaban dan meminta Anda untuk memilih lebih dari satu. Pertanyaan praktik berikut meminta Anda untuk menemukan nilai kemungkinan yang berbeda secara berurutan dan ...

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pilihan ganda, Beberapa Jawaban tentang Tes Verbal GRE - Pertanyaan Praktik - dummies

Pada tes GRE Verbal, beberapa pertanyaan pilihan ganda akan memiliki lebih dari satu jawaban yang benar. Untuk pertanyaan ini, Anda akan diminta untuk melihat-lihat pilihan jawaban dan memilih semua yang menurut Anda benar. Dalam pertanyaan praktik berikut, Anda diminta untuk membaca bagian yang disertakan, dan kemudian ...

Terstruktur Permintaan: Mengembalikan data
Data mining: Wawasan dari data terstruktur Tidak terstruktur Pencarian: Mengembalikan dokumen
Analisis teks: Wawasan dari teks < Teknologi pada potongan informasi kiri dan memerlukan interaksi manusia untuk mensintesis dan menganalisis informasi tersebut. Teknologi pada analisis data mining dan teks yang tepat - memberikan wawasan jauh lebih cepat. Mudah-mudahan, nilai analisis teks untuk organisasi Anda menjadi jelas.