Video: Text Analytics - Ep. 25 (Deep Learning SIMPLIFIED) 2024
Banyak metode yang ada untuk menganalisis data tidak terstruktur untuk inisiatif data besar Anda. Secara historis, teknik ini keluar dari bidang teknis seperti Natural Language Processing (NLP), penemuan pengetahuan, data mining, pencarian informasi, dan statistik. Analisis teks adalah proses menganalisis teks tidak terstruktur, mengekstrak informasi yang relevan, dan mengubahnya menjadi informasi terstruktur yang kemudian dapat dimanfaatkan dengan berbagai cara.
Proses analisis dan ekstraksi memanfaatkan teknik yang berasal dari bahasa linguistik komputasi, statistik, dan disiplin ilmu komputer lainnya.
Terkadang sebuah contoh dapat membantu menjelaskan topik yang kompleks. Misalkan Anda bekerja untuk departemen pemasaran di perusahaan telepon nirkabel. Anda baru saja meluncurkan dua rencana pemanggilan baru - Rencana A dan Rencana B - dan Anda tidak mendapatkan pengambilan yang Anda inginkan di Plan A. Teks yang tidak terstruktur dari catatan call center mungkin memberi Anda beberapa wawasan mengapa ini terjadi.
Kata-kata yang digarisbawahi memberikan informasi yang mungkin perlu Anda ketahui mengapa Plan A tidak mendapatkan adopsi yang cepat. Misalnya, entitas Plan A muncul di sepanjang catatan call center, menunjukkan bahwa laporan tersebut menyebutkan rencananya.
Jumlah kata-kata roll-over minutes, data 4GB, data plan, dan expensive adalah bukti bahwa ada masalah dengan roll-over minutes, data plan, dan harga. Kata-kata seperti konyol dan bodoh memberi wawasan tentang sentimen pemanggil, yang dalam hal ini negatif.
Identifier
Entity | Keluarkan | Sentimen | Cust XYZ |
---|---|---|---|
Rencanakan A | Roll-over minutes | Netral | Cust ABC |
Rencanakan A | Roll-over minutes | Negatif | XXXX |
Rencanakan A | Mahal | Netral | XXXX |
Rencana A | Rencana data | Netral | Cust XYT > Rencana A |
Rencana Data | Negatif | Anda mungkin melihat ini dan berkata, "Tapi saya dapat menemukannya dengan melihat catatan call center. "Namun, ini hanya sebagian kecil dari informasi yang dicatat oleh ribuan agen call center. Setiap agen individual tidak mungkin merasakan kecenderungan yang luas mengenai masalah ini dengan setiap rencana yang ditawarkan oleh perusahaan. | Agen tidak memiliki waktu atau persyaratan untuk berbagi informasi ini di semua agen call center lainnya yang mungkin mendapatkan nomor telepon yang serupa tentang Plan A. Namun, setelah informasi ini dikumpulkan dan diproses menggunakan algoritma analisis teks, sebuah tren mungkin muncul dari data tidak terstruktur ini. Itulah yang membuat analisis teks begitu hebat. |
Pencarian adalah tentang mengambil dokumen berdasarkan apa yang pengguna akhir sudah tahu yang mereka cari. Analisis teks adalah tentang menemukan informasi. Sementara analisis teks berbeda dengan pencarian, teknik ini dapat menambah teknik pencarian. Misalnya, analisis teks dikombinasikan dengan pencarian dapat digunakan untuk memberikan kategorisasi atau klasifikasi dokumen yang lebih baik dan untuk menghasilkan abstrak atau ringkasan dokumen.
Ada empat teknologi: query, data mining, search, dan text analytics. Di sisi kiri tabel adalah query dan pencarian, yang keduanya tentang pengambilan. Misalnya, pengguna akhir bisa meminta database untuk mengetahui berapa banyak pelanggan yang berhenti menggunakan layanan perusahaan pada bulan lalu.
Permintaan akan mengembalikan satu nomor. Hanya dengan bertanya lebih banyak dan berbeda, pengguna akan mendapatkan informasi yang dibutuhkan untuk menentukan mengapa pelanggan pergi. Demikian juga, pencarian kata kunci memungkinkan pengguna akhir menemukan dokumen yang berisi nama pesaing perusahaan. Pencarian akan mengembalikan sekumpulan dokumen. Hanya dengan membaca dokumen, pengguna akhir akan mendapatkan jawaban yang relevan.
Retrieval
Wawasan
Terstruktur | Permintaan: Mengembalikan data | |
---|---|---|
Data mining: Wawasan dari data terstruktur | Tidak terstruktur | Pencarian: Mengembalikan dokumen |
Analisis teks: Wawasan dari teks < Teknologi pada potongan informasi kiri dan memerlukan interaksi manusia untuk mensintesis dan menganalisis informasi tersebut. Teknologi pada analisis data mining dan teks yang tepat - memberikan wawasan jauh lebih cepat. Mudah-mudahan, nilai analisis teks untuk organisasi Anda menjadi jelas. |