Rumah Keuangan Pribadi Data terstruktur di lingkungan data besar - dummies

Data terstruktur di lingkungan data besar - dummies

Daftar Isi:

Video: Crystal Widjaja - Pemanfaatan Big Data di dalam Bisnis GO-JEK | BukaTalks 2025

Video: Crystal Widjaja - Pemanfaatan Big Data di dalam Bisnis GO-JEK | BukaTalks 2025
Anonim

Istilah data terstruktur umumnya mengacu pada data yang memiliki panjang dan format yang ditetapkan untuk data besar. Contoh data terstruktur meliputi angka, tanggal, dan kelompok kata dan angka yang disebut string . Sebagian besar ahli sepakat bahwa data semacam ini menyumbang sekitar 20 persen dari data yang ada di luar sana. Data terstruktur adalah data yang mungkin Anda gunakan untuk menangani. Biasanya tersimpan dalam database.

Sumber data terstruktur besar

Meskipun ini mungkin tampak seperti bisnis seperti biasa, pada kenyataannya, data terstruktur mengambil peran baru dalam dunia data besar. Evolusi teknologi menyediakan sumber data terstruktur yang lebih baru - seringkali secara real time dan dalam volume besar. Sumber data dibagi menjadi dua kategori:

  • Komputer atau mesin yang dihasilkan: Data yang dihasilkan oleh mesin umumnya mengacu pada data yang dibuat oleh mesin tanpa campur tangan manusia.

  • Manusia-dihasilkan: Ini adalah data bahwa manusia, dalam interaksi dengan komputer, pasokan.

Beberapa ahli berpendapat bahwa ada kategori ketiga yang merupakan hibrida antara mesin dan manusia. Meskipun demikian, kami memperhatikan dua kategori pertama.

Data terstruktur yang dihasilkan mesin dapat mencakup yang berikut ini:

  • Data sensor: Contohnya termasuk tag ID frekuensi radio, meter cerdas, perangkat medis, dan data Global Positioning System. Perusahaan tertarik pada hal ini untuk manajemen rantai pasokan dan pengendalian persediaan.

  • data log web: Saat server, aplikasi, jaringan, dan sebagainya beroperasi, mereka menangkap semua jenis data tentang aktivitas mereka. Ini bisa mencapai volume data yang besar yang bisa berguna, misalnya, untuk menangani perjanjian tingkat layanan atau untuk memprediksi pelanggaran keamanan.

  • Data titik penjualan: Saat kasir menggeser kode batang dari produk apa pun yang Anda beli, semua data yang terkait dengan produk dihasilkan.

  • Data keuangan: Banyak sistem keuangan sekarang terprogram; mereka dioperasikan berdasarkan aturan yang telah ditetapkan yang mengotomatisasi proses. Data perdagangan saham adalah contoh bagus dari hal ini. Ini berisi data terstruktur seperti simbol perusahaan dan nilai dolar. Beberapa data ini adalah mesin yang dihasilkan, dan ada pula yang dihasilkan manusia.

Contoh data buatan manusia yang terstruktur mungkin termasuk yang berikut ini:

  • Data masukan: Ini adalah data yang mungkin dimasukkan manusia ke komputer, seperti nama, usia, pendapatan, tidak bebas -format tanggapan survei, dan sebagainya. Data ini bisa bermanfaat untuk memahami perilaku konsumen dasar.

  • Data klik-stream: Data dihasilkan setiap kali Anda mengeklik tautan di situs web. Data ini dapat dianalisis untuk mengetahui perilaku pelanggan dan pola beli.

  • Data terkait permainan: Setiap gerakan yang Anda buat dalam permainan dapat direkam. Hal ini dapat berguna dalam memahami bagaimana pengguna akhir bergerak melalui portofolio game.

Bila diambil bersamaan dengan jutaan pengguna lain yang mengirimkan informasi yang sama, ukurannya astronomis. Selain itu, sebagian besar data ini memiliki komponen real-time untuk itu yang dapat berguna untuk memahami pola yang memiliki potensi untuk memprediksi hasil.

Intinya adalah informasi semacam ini bisa sangat kuat dan bisa dimanfaatkan untuk banyak tujuan.

Peran database relasional dalam data besar

Ketekunan data mengacu pada bagaimana database mempertahankan versi dirinya sendiri saat dimodifikasi. Kakek buyut dari data store yang persisten adalah sistem manajemen basis data relasional . Pada masa kanak-kanak, industri komputasi menggunakan teknik yang sekarang dianggap primitif untuk persistensi data.

Model relasional ditemukan oleh Edgar Codd, seorang ilmuwan IBM, pada 1970-an dan digunakan oleh IBM, Oracle, Microsoft, dan lainnya. Hal ini masih dalam penggunaan luas hari ini dan memainkan peran penting dalam evolusi data besar. Pengertian database relasional sangat penting karena database jenis lain digunakan dengan data yang besar.

Dalam model relasional, data disimpan dalam tabel. Database ini berisi skema - yaitu representasi struktural dari apa yang ada dalam database. Sebagai contoh, dalam database relasional, skema mendefinisikan tabel, kolom dalam tabel, dan hubungan antara keduanya.

Data disimpan dalam kolom, masing-masing untuk setiap atribut tertentu. Data juga disimpan di baris. Tabel pertama menyimpan informasi produk; yang kedua menyimpan informasi demografis. Masing-masing memiliki berbagai atribut. Setiap tabel dapat diperbarui dengan data baru, dan data dapat dihapus, dibaca, dan diperbarui. Hal ini sering dilakukan dalam model relasional menggunakan bahasa query terstruktur (SQL).

Aspek lain dari model relasional yang menggunakan SQL adalah tabel dapat ditanyakan menggunakan kunci yang sama. Kunci umum dalam tabel adalah CustomerID.

Anda dapat mengajukan kueri, misalnya, untuk menentukan jenis kelamin pelanggan yang membeli produk tertentu. Mungkin ada yang seperti ini:

Pilih CustomerID, State, Gender, Product dari "tabel demografi", "tabel produk" dimana Product = XXYY
Data terstruktur di lingkungan data besar - dummies

Pilihan Editor

Asisten Dokter Ujian: Tipe 1 dan Tipe 2 Diabetes - dummies

Asisten Dokter Ujian: Tipe 1 dan Tipe 2 Diabetes - dummies

Sebagai masalah yang lebih umum , Asisten Dokter Ujian (PANCE) akan mengharapkan Anda untuk mengetahui perbedaan antara diabetes tipe 1 dan tipe 2. Diabetes mellitus (DM) adalah karena metabolisme insulin yang abnormal di dalam tubuh. Pada diabetes mellitus tipe 1, pankreas tidak memproduksi insulin, dan pada tipe 2, tubuh menahan tindakan ...

Asisten Dokter Asisten: Testis dan Sekitarnya - dummies

Asisten Dokter Asisten: Testis dan Sekitarnya - dummies

Banyak kondisi kesehatan dapat mempengaruhi testis dan ini akan dibahas di Asisten Dokter Ujian. Tidak hanya kondisi penting secara klinis, tapi juga hasil tinggi untuk tes. Dari torsi hingga kanker hingga infeksi, waspadai kondisi ini. Torsion Testicular torsion adalah kondisi yang tidak Anda inginkan pada kondisi terburuk Anda ...

Praktek Pertanyaan Dermatologi pada Asisten Dokter - dummies

Praktek Pertanyaan Dermatologi pada Asisten Dokter - dummies

Dari ruam sampai eksim dan infeksi bakteri terhadap virus exanthems, pertanyaan latihan ini serupa dengan pertanyaan dermatologi pada Physician Assistant Exam (PANCE). Contoh Pertanyaan PANCE Salah satu dari berikut ini dapat berkembang menjadi karsinoma sel skuamosa dari waktu ke waktu? (A) Onikomikosis (B) Keratosis aktinik (C) Keratosis seboroik (D) Psoriasis (E) Impetigo Anda sedang mengevaluasi ...

Pilihan Editor

GED Test Prep: Penalaran Melalui Bahasa Membaca Seni Pertanyaan Drag-and-Drop

GED Test Prep: Penalaran Melalui Bahasa Membaca Seni Pertanyaan Drag-and-Drop

Bagian Penalaran Melalui Bahasa Seni GED menggunakan jenis pertanyaan drag-and-drop, antara lain. Item ini mengharuskan Anda menyeret dan melepaskan informasi dari satu lokasi ke layar lainnya. Biasanya, tujuannya adalah agar Anda menyusun ulang sesuatu dari yang paling tidak penting bagi kebanyakan orang, untuk menempatkan peristiwa ke dalam urutan, atau hanya ...

Tips Uji GED: Pertanyaan Mengatasi dan Menjawab - dummies

Tips Uji GED: Pertanyaan Mengatasi dan Menjawab - dummies

Saat Anda memulai GED, Anda ingin memiliki rencana permainan di tempat untuk bagaimana menjawab pertanyaan. Ingatlah tips berikut ini untuk membantu Anda mengatasi setiap pertanyaan: Kapan pun Anda membaca sebuah pertanyaan, tanyakan pada diri Anda, "Apa yang saya minta? "Melakukannya membantu Anda tetap fokus pada apa yang Anda butuhkan ...

GED Test Prep: Penalaran Melalui Bahasa Penulisan Seni Pertanyaan Tanggapan yang Diperluas - dummies

GED Test Prep: Penalaran Melalui Bahasa Penulisan Seni Pertanyaan Tanggapan yang Diperluas - dummies

Ketika Anda menyelesaikan bagian pertama dari bagian Reasoning Through Language Arts (RLA) dari GED, Anda memulai Respons Extended-di mana Anda menulis esai dengan menganalisis argumen yang disajikan dalam dua lembar teks contoh. Anda mendapatkan 45 menit untuk mengerjakan bagian RLA ini, dan Anda tidak dapat melakukannya ...

Pilihan Editor

Cara Melacak Konten dan Membuat Laporan untuk Otomasi Pemasaran - dummies

Cara Melacak Konten dan Membuat Laporan untuk Otomasi Pemasaran - dummies

Setelah Anda memiliki konten untuk kampanye otomasi pemasaran, saatnya belajar mengelolanya. Melacak konten Anda - mengetahui siapa yang terlibat dengannya dan di mana dia terlibat dengan-membantu Anda mengetahui bagaimana menyajikannya dengan lebih baik pada kesempatan berikutnya. Otomatisasi pemasaran membuat manajemen konten sangat berbeda dari bagaimana ...

Bagaimana Menggunakan Otomasi Pemasaran untuk Melacak Prospek Pemasaran Bergerak - dummies

Bagaimana Menggunakan Otomasi Pemasaran untuk Melacak Prospek Pemasaran Bergerak - dummies

Banyak pemasar diukur pada berapa banyak prospek yang mereka berikan pada penjualan dan persentase prospek tersebut diubah menjadi peluang. Untungnya, otomatisasi pemasaran dapat membantu Anda mengembangkan cara untuk mengukur prospek. Mendapatkan visibilitas ke prospek setelah mengirimkannya ke tim penjualan merupakan kutukan bagi banyak departemen pemasaran. Setelah menerapkan ...

Bagaimana Menggunakan Video Tertanam untuk Keterlibatan Peningkatan dalam Otomasi Pemasaran - dummies

Bagaimana Menggunakan Video Tertanam untuk Keterlibatan Peningkatan dalam Otomasi Pemasaran - dummies

Anda dapat menggunakan video khusus untuk mendorong konversi yang lebih tinggi melalui otomasi pemasaran Anda. Untuk membuat video yang lebih maju, pastikan Anda memiliki beberapa opsi dasar dengan alat video-hosting Anda: Putar otomatis: Opsi ini memungkinkan video Anda untuk mulai bermain saat seseorang mendarat di halaman. Ini bukan pilihan super canggih, tapi ...