Rumah Keuangan Pribadi Data yang tidak terstruktur dalam data Data Lingkungan Besar - dummies

Data yang tidak terstruktur dalam data Data Lingkungan Besar - dummies

Daftar Isi:

Video: The history of our world in 18 minutes | David Christian 2024

Video: The history of our world in 18 minutes | David Christian 2024
Anonim

Data tidak terstruktur adalah data yang tidak mengikuti format yang ditentukan untuk data besar. Jika 20 persen data yang tersedia untuk perusahaan adalah data terstruktur, 80 persen lainnya tidak terstruktur. Data terstruktur sebenarnya adalah sebagian besar data yang akan Anda hadapi. Sampai saat ini, bagaimanapun, teknologi tidak benar-benar mendukung melakukan banyak hal kecuali mengunduhnya atau menganalisisnya secara manual.

Sumber data besar yang tidak terstruktur

Data tidak terstruktur ada dimana - mana. Sebenarnya, kebanyakan individu dan organisasi melakukan kehidupan mereka di sekitar data tidak terstruktur. Sama seperti data terstruktur, data tidak terstruktur adalah mesin yang dihasilkan atau buatan manusia.

Berikut adalah beberapa contoh data tidak terstruktur yang dihasilkan mesin:

  • Gambar satelit: Ini mencakup data cuaca atau data yang ditangkap pemerintah dalam citra pengawasan satelitnya. Pikirkan saja Google Earth, dan Anda mendapatkan fotonya.

  • Data ilmiah: Ini mencakup citra seismik, data atmosfer, dan fisika energi tinggi.

  • Foto dan video: Ini mencakup keamanan, pengawasan, dan video lalu lintas.

  • Data radar atau sonar: Ini mencakup profil seismik kendaraan bermotor, meteorologi, dan oseanografi.

Daftar berikut menunjukkan beberapa contoh data tidak terstruktur buatan manusia:

  • Teks internal untuk perusahaan Anda: Pikirkan semua teks dalam dokumen, log, hasil survei, dan e-mail. Informasi perusahaan benar-benar mewakili sebagian besar informasi teks di dunia saat ini.

  • Data media sosial: Data ini dihasilkan dari platform media sosial seperti YouTube, Facebook, Twitter, LinkedIn, dan Flickr.

  • Data mobile: Ini mencakup data seperti pesan teks dan informasi lokasi.

  • konten situs web: Ini berasal dari situs yang mengirimkan konten tidak terstruktur, seperti YouTube, Flickr, atau Instagram.

Dan daftarnya terus berlanjut.

Beberapa orang percaya bahwa kata data tidak terstruktur menyesatkan karena setiap dokumen mungkin berisi struktur atau pemformatannya sendiri berdasarkan perangkat lunak yang menciptakannya. Namun, apa yang internal dokumen itu benar-benar tidak terstruktur.

Sejauh ini, data tidak terstruktur adalah bagian terbesar dari data persamaan, dan kasus penggunaan untuk data tidak terstruktur berkembang dengan cepat. Di sisi teks saja, analisis teks dapat digunakan untuk menganalisis teks tidak terstruktur dan mengekstrak data yang relevan dan mengubah data tersebut menjadi informasi terstruktur yang dapat digunakan dengan berbagai cara.

Misalnya, kasus penggunaan data populer yang populer adalah analisis media sosial untuk digunakan dengan percakapan pelanggan dengan volume tinggi. Selain itu, data tidak terstruktur dari catatan call center, e-mail, komentar tertulis dalam sebuah survei, dan dokumen lainnya dianalisis untuk memahami perilaku pelanggan. Hal ini dapat dikombinasikan dengan media sosial dari puluhan juta sumber untuk memahami pengalaman pelanggan.

Peran CMS dalam pengelolaan data yang besar

Organisasi menyimpan beberapa data tidak terstruktur di database. Namun, mereka juga memanfaatkan sistem manajemen konten perusahaan (CMS) yang dapat mengelola siklus konten lengkap. Ini bisa termasuk konten web, konten dokumen, dan media bentuk lainnya.

Menurut Asosiasi Informasi dan Pengelolaan Gambar (AIIM), sebuah organisasi nirlaba yang menyediakan pendidikan, penelitian, dan praktik terbaik, Enterprise Content Management (ECM) terdiri dari "strategi, metode, dan alat yang digunakan untuk menangkap, mengelola, menyimpan, melestarikan, dan mengirimkan konten dan dokumen yang terkait dengan proses organisasi. "Teknologi yang termasuk dalam ECM mencakup pengelolaan dokumen, pengelolaan arsip, pencitraan, pengelolaan alur kerja, pengelolaan konten web, dan kolaborasi.

Seluruh industri berkembang di seputar pengelolaan konten, dan banyak vendor pengelolaan konten menskalakan solusi mereka untuk menangani data terstruktur dalam jumlah besar. Namun, teknologi baru juga berkembang untuk membantu mendukung data tidak terstruktur dan analisis data tidak terstruktur. Beberapa di antaranya mendukung data terstruktur dan tidak terstruktur. Beberapa mendukung arus real-time. Ini termasuk teknologi seperti Hadoop, MapReduce, dan streaming.

Sistem yang dirancang untuk menyimpan konten dalam bentuk sistem manajemen konten bukan lagi solusi yang berdiri sendiri. Sebaliknya, mereka cenderung menjadi bagian dari solusi pengelolaan data secara keseluruhan. Misalnya, organisasi Anda dapat memantau umpan Twitter yang kemudian dapat memicu pemunculan CMS secara terprogram.

Sekarang, orang yang memicu tweet mendapat jawaban kembali yang menawarkan lokasi di mana individu dapat menemukan produk yang mungkin dia cari. Manfaat terbesar adalah ketika jenis interaksi ini bisa terjadi secara real time. Ini juga menggambarkan nilai dari data real-time yang tidak terstruktur, terstruktur (data pelanggan tentang data orang yang di-tweet), dan semi-terstruktur (konten sebenarnya dalam CMS).

Kenyataannya adalah bahwa Anda mungkin akan menggunakan pendekatan hibrida untuk memecahkan masalah data besar Anda. Misalnya, tidak masuk akal untuk memindahkan semua konten berita Anda, misalnya ke Hadoop di tempat Anda karena ini seharusnya membantu mengelola data tidak terstruktur.

Data yang tidak terstruktur dalam data Data Lingkungan Besar - dummies

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...