Rumah Keuangan Pribadi Analisis Sentimen Sosial dengan Hadoop - dummies

Analisis Sentimen Sosial dengan Hadoop - dummies

Video: Sentiment Analysis to classify Amazon Product Reviews Using Supervised Classification Algorithms 2024

Video: Sentiment Analysis to classify Amazon Product Reviews Using Supervised Classification Algorithms 2024
Anonim

Analisis sentimen sosial mudah dianggap terlalu overhyped. Penggunaan Hadoop, yang seharusnya tidak mengherankan, mengingat bahwa dunia terus terhubung dan populasi ekspresif saat ini. Kasus penggunaan ini memanfaatkan konten dari forum, blog, dan sumber media sosial lainnya untuk mengembangkan perasaan tentang apa yang orang lakukan (misalnya, peristiwa kehidupan) dan bagaimana reaksi mereka terhadap dunia di sekitar mereka (sentimen).

Karena data berbasis teks tidak sesuai dengan database relasional, Hadoop adalah tempat yang praktis untuk mengeksplorasi dan menjalankan analisis pada data ini.

Bahasa sulit untuk ditafsirkan, bahkan untuk manusia kadang-kadang - terutama jika Anda membaca teks yang ditulis oleh orang-orang dalam kelompok sosial yang berbeda dari Anda sendiri. Kelompok orang ini mungkin berbicara dalam bahasa Anda, namun ungkapan dan gaya mereka benar-benar asing, jadi Anda tidak tahu apakah mereka sedang membicarakan pengalaman baik atau buruk.

Misalnya, jika Anda mendengar kata bom yang mengacu pada sebuah film, ini mungkin berarti bahwa film itu buruk (atau bagus, jika Anda adalah bagian dari masa muda Gerakan yang menafsirkan "It's da bomb" sebagai pujian); Tentu saja, jika Anda berada dalam bisnis keamanan maskapai penerbangan, kata bom memiliki arti yang sangat berbeda. Intinya adalah bahasa itu digunakan dengan berbagai cara dan terus berkembang.

Bila Anda menganalisis sentimen pada media sosial, Anda dapat memilih dari beberapa pendekatan. Metode dasar memecah teks secara terprogram, mengekstrak string, dan menerapkan aturan. Dalam situasi sederhana, pendekatan ini masuk akal. Namun seiring dengan berkembangnya persyaratan dan peraturan menjadi lebih kompleks, pengkodean teks secara manual mudah dikelompokkan menjadi tidak layak lagi dari perspektif pemeliharaan kode, terutama untuk optimasi kinerja.

Pendekatan berbasis tata bahasa dan aturan untuk pemrosesan teks sangat mahal, yang merupakan pertimbangan penting dalam ekstraksi skala besar di Hadoop. Semakin melibatkan peraturan (yang tak terelakkan untuk tujuan kompleks seperti pengambilan sentimen), semakin banyak pemrosesan yang dibutuhkan.

Sebagai alternatif, pendekatan berbasis statistik menjadi semakin umum untuk analisis sentimen. Daripada menulis aturan kompleks secara manual, Anda dapat menggunakan model pembelajaran mesin yang berorientasi klasifikasi di Apache Mahout. Hasil tangkapan di sini adalah Anda perlu melatih model Anda dengan contoh sentimen positif dan negatif. Semakin banyak data pelatihan yang Anda berikan (misalnya teks dari tweet dan klasifikasi Anda), semakin akurat hasilnya.

Kasus penggunaan analisis sentimen sosial dapat diterapkan di berbagai industri. Misalnya, pertimbangkan keamanan pangan: Mencoba memprediksi atau mengidentifikasi wabah penyakit bawaan makanan secepat mungkin sangat penting bagi petugas kesehatan.

Gambar berikut menunjukkan aplikasi berlabuh Hadoop yang mengandung tweet menggunakan extractors berdasarkan potensi penyakit: FLU atau FOOD POISONING.

Apakah Anda melihat peta panas yang dihasilkan yang menunjukkan lokasi geografis tweets? Salah satu karakteristik data dalam dunia data besar adalah sebagian besar diperkaya secara spasial: Memiliki informasi lokalitas (dan atribut temporal juga). Dalam kasus ini, profil Twitter direkayasa ulang dengan melihat lokasi yang telah dipublikasikan. Ternyata, banyak akun Twitter memiliki lokasi geografis sebagai bagian dari profil publik mereka (dan juga penolakan yang secara jelas menyatakan bahwa pemikiran mereka adalah keputusan mereka sendiri daripada berbicara untuk atasan mereka).

Seberapa bagus mesin prediksi untuk media sosial terkena wabah flu atau kejadian keracunan makanan? Perhatikan data sampel anonim yang ditunjukkan. Anda dapat melihat bahwa sinyal media sosial mengacaukan semua indikator lain untuk memprediksi wabah flu di daerah U. S. tertentu selama akhir musim panas dan memasuki musim gugur yang akan datang.

Contoh ini menunjukkan manfaat lain yang diperoleh dari menganalisis media sosial: Ini memberi Anda kesempatan yang belum pernah terjadi sebelumnya untuk melihat informasi atribut dalam profil poster. Memang, apa yang orang katakan tentang diri mereka di profil Twitter mereka seringkali tidak lengkap (misalnya, kode lokasi tidak terisi) atau tidak bermakna (kode lokasi mungkin mengatakan

awan sembilan ). Tapi Anda bisa belajar banyak tentang orang dari waktu ke waktu, berdasarkan apa yang mereka katakan. Misalnya, seorang klien mungkin memiliki

tweeted (pengumuman tentang kelahiran bayinya, gambar Instagram dari lukisan terakhirnya, atau sebuah posting Facebook yang menyatakan bahwa dia tidak dapat mempercayai perilaku Walter White di akhir pekan Breaking Bad . Dalam contoh di mana-mana, perusahaan Anda dapat mengekstrak peristiwa kehidupan yang menghasilkan grafik keluarga (anak baru merupakan pembaruan berharga untuk profil Pengelolaan Data Master seseorang), hobi (melukis), dan atribut minat (Anda menyukai pertunjukan

Breaking Bad ). Dengan menganalisis data sosial dengan cara ini, Anda memiliki kesempatan untuk menyempurnakan atribut pribadi dengan informasi seperti hobi, ulang tahun, acara kehidupan, lokasi geografis (negara, negara bagian, dan kota, misalnya), atasan, jenis kelamin, pernikahan status, dan banyak lagi.

Asumsikan sebentar bahwa Anda adalah CIO sebuah maskapai penerbangan. Anda bisa menggunakan posting yang senang atau sering marah karena tidak hanya memastikan sentimen tapi juga melengkapi profil pelanggan untuk program loyalitas Anda dengan menggunakan informasi media sosial.

Bayangkan seberapa baik Anda bisa menargetkan pelanggan potensial dengan informasi yang dibagikan - misalnya, sebuah e-mail memberitahu klien bahwa Season 5 dari

Breaking Bad sekarang tersedia di sistem media pesawat atau mengumumkan bahwa anak-anak di bawah usia dua lalat secara gratis. Ini juga contoh bagus tentang bagaimana sistem pencatatan (misalnya, penjualan atau basis data langganan) dapat memenuhi sistem keterlibatan (katakanlah, dukung saluran). Meskipun penebusan anggota dan riwayat perjalanan loyalitas ada dalam database relasional, sistem pertunangan dapat memperbarui catatan (misalnya kolom).

Analisis Sentimen Sosial dengan Hadoop - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...