Rumah Keuangan Pribadi Text Analytics for Unstructured Big Data - dummies

Text Analytics for Unstructured Big Data - dummies

Video: Text Analytics - Ep. 25 (Deep Learning SIMPLIFIED) 2024

Video: Text Analytics - Ep. 25 (Deep Learning SIMPLIFIED) 2024
Anonim

Banyak metode yang ada untuk menganalisis data tidak terstruktur untuk inisiatif data besar Anda. Secara historis, teknik ini keluar dari bidang teknis seperti Natural Language Processing (NLP), penemuan pengetahuan, data mining, pencarian informasi, dan statistik. Analisis teks adalah proses menganalisis teks tidak terstruktur, mengekstrak informasi yang relevan, dan mengubahnya menjadi informasi terstruktur yang kemudian dapat dimanfaatkan dengan berbagai cara.

Proses analisis dan ekstraksi memanfaatkan teknik yang berasal dari bahasa linguistik komputasi, statistik, dan disiplin ilmu komputer lainnya.

Terkadang sebuah contoh dapat membantu menjelaskan topik yang kompleks. Misalkan Anda bekerja untuk departemen pemasaran di perusahaan telepon nirkabel. Anda baru saja meluncurkan dua rencana pemanggilan baru - Rencana A dan Rencana B - dan Anda tidak mendapatkan pengambilan yang Anda inginkan di Plan A. Teks yang tidak terstruktur dari catatan call center mungkin memberi Anda beberapa wawasan mengapa ini terjadi.

Kata-kata yang digarisbawahi memberikan informasi yang mungkin perlu Anda ketahui mengapa Plan A tidak mendapatkan adopsi yang cepat. Misalnya, entitas Plan A muncul di sepanjang catatan call center, menunjukkan bahwa laporan tersebut menyebutkan rencananya.

Jumlah kata-kata roll-over minutes, data 4GB, data plan, dan expensive adalah bukti bahwa ada masalah dengan roll-over minutes, data plan, dan harga. Kata-kata seperti konyol dan bodoh memberi wawasan tentang sentimen pemanggil, yang dalam hal ini negatif.

Proses analisis teks menggunakan berbagai algoritma, seperti memahami struktur kalimat, untuk menganalisis teks yang tidak terstruktur dan kemudian mengekstrak informasi, dan mengubah informasi tersebut menjadi data terstruktur. Data terstruktur yang diambil dari teks yang tidak terstruktur diilustrasikan pada Tabel 13-1.

Identifier

Entity Keluarkan Sentimen Cust XYZ
Rencanakan A Roll-over minutes Netral Cust ABC
Rencanakan A Roll-over minutes Negatif XXXX
Rencanakan A Mahal Netral XXXX
Rencana A Rencana data Netral Cust XYT > Rencana A
Rencana Data Negatif Anda mungkin melihat ini dan berkata, "Tapi saya dapat menemukannya dengan melihat catatan call center. "Namun, ini hanya sebagian kecil dari informasi yang dicatat oleh ribuan agen call center. Setiap agen individual tidak mungkin merasakan kecenderungan yang luas mengenai masalah ini dengan setiap rencana yang ditawarkan oleh perusahaan. Agen tidak memiliki waktu atau persyaratan untuk berbagi informasi ini di semua agen call center lainnya yang mungkin mendapatkan nomor telepon yang serupa tentang Plan A. Namun, setelah informasi ini dikumpulkan dan diproses menggunakan algoritma analisis teks, sebuah tren mungkin muncul dari data tidak terstruktur ini. Itulah yang membuat analisis teks begitu hebat.

Pencarian adalah tentang mengambil dokumen berdasarkan apa yang pengguna akhir sudah tahu yang mereka cari. Analisis teks adalah tentang menemukan informasi. Sementara analisis teks berbeda dengan pencarian, teknik ini dapat menambah teknik pencarian. Misalnya, analisis teks dikombinasikan dengan pencarian dapat digunakan untuk memberikan kategorisasi atau klasifikasi dokumen yang lebih baik dan untuk menghasilkan abstrak atau ringkasan dokumen.

Ada empat teknologi: query, data mining, search, dan text analytics. Di sisi kiri tabel adalah query dan pencarian, yang keduanya tentang pengambilan. Misalnya, pengguna akhir bisa meminta database untuk mengetahui berapa banyak pelanggan yang berhenti menggunakan layanan perusahaan pada bulan lalu.

Permintaan akan mengembalikan satu nomor. Hanya dengan bertanya lebih banyak dan berbeda, pengguna akan mendapatkan informasi yang dibutuhkan untuk menentukan mengapa pelanggan pergi. Demikian juga, pencarian kata kunci memungkinkan pengguna akhir menemukan dokumen yang berisi nama pesaing perusahaan. Pencarian akan mengembalikan sekumpulan dokumen. Hanya dengan membaca dokumen, pengguna akhir akan mendapatkan jawaban yang relevan.

Retrieval

Wawasan

Text Analytics for Unstructured Big Data - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...

Terstruktur Permintaan: Mengembalikan data
Data mining: Wawasan dari data terstruktur Tidak terstruktur Pencarian: Mengembalikan dokumen
Analisis teks: Wawasan dari teks < Teknologi pada potongan informasi kiri dan memerlukan interaksi manusia untuk mensintesis dan menganalisis informasi tersebut. Teknologi pada analisis data mining dan teks yang tepat - memberikan wawasan jauh lebih cepat. Mudah-mudahan, nilai analisis teks untuk organisasi Anda menjadi jelas.