Rumah Keuangan Pribadi Bagaimana Menelusuri Data Prediktif Analytics Anda - dummies

Bagaimana Menelusuri Data Prediktif Analytics Anda - dummies

Daftar Isi:

Video: China: facial recognition and state control | The Economist 2024

Video: China: facial recognition and state control | The Economist 2024
Anonim

Untuk memanfaatkan data analisis prediktif Anda perlu mengetahui bagaimana menemukan informasi yang ingin Anda temukan. Ada dua konsep utama untuk mencari data Anda dalam persiapan untuk menggunakannya dalam analisis prediktif:

  • Bersiap untuk melampaui pencarian kata kunci dasar

  • Membuat data Anda semantik dicari

Cara menggunakan pencarian berbasis kata kunci dalam prediksi analisis

Bayangkan jika Anda ditugaskan untuk mencari data dalam jumlah besar. Salah satu cara untuk mendekati masalah adalah dengan mengeluarkan kueri penelusuran yang terdiri dari kata-kata. Alat pencarian mencari kata-kata yang cocok di database, gudang data, atau membolak-balik teks yang ada di dalamnya data Anda berada.

Asumsikan Anda mengeluarkan kueri penelusuran berikut: Presiden Amerika Serikat mengunjungi Afrika . Hasil pencarian akan terdiri dari teks yang berisi persis satu atau kombinasi kata-kata Presiden, Amerika Serikat, kunjungan, Afrika . Anda mungkin mendapatkan informasi yang tepat yang Anda cari, tapi tidak selalu.

Bagaimana dengan dokumen yang tidak berisi kata-kata yang telah disebutkan sebelumnya, namun beberapa kombinasi antara lain: perjalanan Obama ke Kenya .

Tidak ada kata yang awalnya Anda cari ada di sana - tetapi hasil pencariannya semantis (bermakna) bermanfaat. Bagaimana Anda bisa mempersiapkan data Anda agar bisa ditelusuri secara semantis? Bagaimana Anda bisa melampaui pencarian kata kunci tradisional? Jawaban Anda bisa ditemukan jika Anda terus membaca.

Cara menggunakan pencarian berbasis semantik dalam analisis prediktif

Gambaran tentang bagaimana karya pencarian berbasis semantik adalah sebuah proyek yang dipimpin Anasse Bari di Grup Bank Dunia, sebuah organisasi internasional yang misi utamanya adalah untuk memerangi kemiskinan di seluruh dunia.

Proyek ini bertujuan untuk menyelidiki pencarian dan analisis perusahaan skala besar yang ada di pasar dan membangun sebuah prototipe untuk kerangka kerja mutakhir yang akan mengatur data Bank Dunia - yang sebagian besar merupakan kumpulan dokumen, publikasi, laporan proyek yang tidak terstruktur, celana, dan studi kasus.

Pengetahuan berharga yang sangat besar ini adalah sumber yang digunakan untuk misi utama pengurangan kemiskinan dunia. Tapi kenyataan bahwa itu tidak terstruktur membuatnya menantang untuk mengakses, menangkap, berbagi, memahami, mencari, data-tambang, dan memvisualisasikan.

Bank Dunia adalah organisasi yang sangat besar, dengan banyak divisi di seluruh dunia. Salah satu divisi utama berusaha untuk memiliki kerangka kerja dan siap untuk mengalokasikan sumber daya untuk membantu tim Bari adalah Jaringan Pembangunan Manusia di dalam Bank Dunia.

Wakil Presiden Jaringan Pengembangan Manusia menguraikan satu masalah yang muncul dari ambiguitas: Divisinya menggunakan beberapa istilah dan konsep yang memiliki arti keseluruhan yang sama namun memiliki nuansa yang berbeda.

Misalnya, istilah seperti klimatologi , perubahan iklim, penipisan ozon gas, dan emisi rumah kaca semuanya berhubungan secara semantis namun tidak identik dalam arti. Dia menginginkan kemampuan pencarian yang cukup cerdas untuk mengekstrak dokumen yang berisi konsep terkait saat seseorang menggeledah salah satu istilah ini. Kerangka 'prototipe' untuk kemampuan yang dipilih oleh tim Bari adalah Arsitektur Manajemen Informasi Unstructured (UIMA), solusi berbasis perangkat lunak. Awalnya dirancang oleh IBM Research, UIMA tersedia dalam perangkat lunak IBM seperti IBM Content Analytics, salah satu alat yang mendukung IBM Watson, komputer terkenal yang memenangkan game Jeopardy. Tim Bari bergabung dengan tim yang sangat berbakat dari IBM Content Management dan Enterprise Search, dan kemudian dengan tim IBM Watson, untuk berkolaborasi dalam proyek ini. Solusi 9 Unstructured Information Management (UIM)

adalah sistem perangkat lunak yang menganalisis volume besar informasi tidak terstruktur (teks, audio, video, gambar, dan sebagainya) untuk menemukan, mengatur dan memberikan pengetahuan yang relevan kepada klien atau pengguna akhir aplikasi.

Atribut

ontologi adalah kumpulan konsep dan istilah terkait yang terkait dengan domain. Solusi berbasis UIMA menggunakan ontologi untuk memberikan penandaan semantik, yang memungkinkan pencarian yang kaya dari format data (teks, ucapan, presentasi PowerPoint, e-mail, video, dan sebagainya). UIMA menambahkan lapisan lain pada data yang diambil, lalu menambahkan metadata

untuk mengidentifikasi data yang dapat disusun dan dicari secara semantis. Pencarian semantik didasarkan pada makna kontekstual istilah pencarian saat muncul di ruang data yang dapat dicari yang dibangun UIMA. Pencarian semantik lebih akurat daripada pencarian berbasis kata kunci yang biasa karena permintaan pengguna mengembalikan hasil pencarian tidak hanya dokumen yang berisi istilah pencarian, tapi juga dokumen yang secara semantik relevan dengan kueri. Jika Anda mencari keanekaragaman hayati di Afrika, pencarian khas (berbasis kata kunci) akan mengembalikan dokumen yang memiliki kata-kata yang tepat keanekaragaman hayati

dan Afrika . Pencarian semantik berbasis UIMA tidak hanya akan mengembalikan dokumen yang memiliki dua kata itu, tapi juga dokumen semantik yang relevan dengan dokumen "keanekaragaman hayati di Afrika" yang mengandung kombinasi kata-kata seperti "sumber daya tanaman di Afrika", "sumber daya hewan di Maroko, "atau" sumber daya genetik di Zimbabwe. Dengan tag semantik dan penggunaan ontologi, informasi menjadi mudah ditelusuri secara semantis, terlepas dari bahasa atau media di mana informasi dibuat (Word, PowerPoint, e-mail, video, dan sebagainya). Solusi ini menyediakan satu hub dimana data dapat ditangkap, diatur, dipertukarkan, dan diberikan secara semantically retrievable. Kamus sinonim dan istilah terkait bersifat open source (tersedia secara bebas) - atau Anda dapat mengembangkan kamus Anda sendiri yang spesifik untuk domain atau data Anda. Anda dapat membuat spreadsheet dengan akar kata dan kata-kata, sinonim, dan istilah terkait yang terkait. Spreadsheet dapat diunggah ke alat penelusuran seperti IBM Content Analytics (ICA) untuk memberi kuasa pada analisis penelusuran perusahaan dan konten.

Bagaimana Menelusuri Data Prediktif Analytics Anda - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...