Middleware Layanan: Pemetaan Data dan Transformasi - dummies
Gambar ini menunjukkan lingkungan di mana data diekstraksi dari tiga sumber data berbeda untuk disertakan dalam gudang data, dan masing-masing dari ketiga sumber tersebut berada pada platform yang berbeda. Pada beberapa titik dalam proses middleware, ekstrak QA'd ini harus digabungkan untuk pemetaan gabungan dan proses transformasi. The ...
Middleware Layanan: Pergerakan Data dan Pemuatan Data - dummies
Dalam banyak situasi, dua layanan middleware - seleksi dan ekstraksi, dan jaminan kualitas - berlangsung pada platform (sistem) yang sama tempat sumber data berada. Jika data warehouse Anda akan di-host pada platform yang berbeda dari pada sumber data, Anda harus menggunakan layanan pergerakan data untuk mempengaruhi sistem-ke-sistem ...
Middleware Layanan: Pemilihan dan Ekstraksi Data - dummies
Tujuan utama layanan pemilihan dan ekstraksi data adalah untuk memilih dari (mencari di) sumber data data yang ingin Anda pindah ke data warehouse dan kemudian mengekstrak (mengeluarkan) data tersebut ke dalam bentuk yang dapat disiapkan untuk layanan penjaminan mutu. Anda dapat menggunakan salah satu dari dua tipe yang berbeda ...
Data besar tambang dengan sarang semarang
Sarang adalah lapisan data-warehousing berorientasi batch yang dibangun di atas elemen inti dari Hadoop (HDFS dan MapReduce) dan sangat berguna dalam data besar. Ini menyediakan pengguna yang mengenal SQL dengan implementasi SQL-lite sederhana yang disebut HiveQL tanpa mengorbankan akses melalui pemecah dan pengurang. Dengan Hive, Anda bisa mendapatkan yang terbaik dari kedua dunia: akses seperti SQL ...
Database multidimensi - dummies
Ini bukan pertama kalinya dalam sejarah bahwa jenis produk database baru telah muncul dan mengatasi inefisiensi RDBMS . Kembali pada tahun 1980an, sebuah kelas aplikasi diidentifikasi dimana produk RDBMS tidak menangani kebutuhan pengelolaan data (terutama pembuatan RDBMS yang tersedia pada saat itu). Aplikasi ini semua dibutuhkan tipe data yang ditentukan pengguna yang ...
Middleware Layanan: Jaminan Mutu Data - dummies
Anda harus menetapkan dua layanan jaminan kualitas (QA) yang berbeda dalam arus dari layanan middleware Anda harus melakukan tugas QA pertama melawan ekstrak dari sumber data sebelum Anda menjalankan layanan middleware lagi. Jaminan kualitas data: bagian I Cobalah untuk menangkap (dan memperbaiki) kesalahan dan masalah sejak awal prosesnya ...
Database nonrelasional di Data Lingkungan Besar - dummies
Database nonrelasional tidak bergantung pada tabel / model kunci endemik ke RDBMSs (sistem manajemen basis data relasional). Singkatnya, data khusus di dunia data besar memerlukan ketekunan dan teknik manipulasi data khusus. Meskipun database gaya baru ini menawarkan beberapa jawaban atas tantangan data besar Anda, namun bukan merupakan tiket ekspres untuk menyelesaikannya ...
Pasang Big Data to Use - dummies
Analisis teks dapat digunakan untuk membantu mendapatkan wawasan tentang data. Lantas, bagaimana kalau datanya adalah data yang besar? Itu berarti data yang tidak terstruktur yang dianalisis adalah volume tinggi, kecepatan tinggi, atau keduanya. Data besar dan suara pelanggan Mengoptimalkan pengalaman pelanggan dan meningkatkan retensi pelanggan adalah driver yang dominan untuk ...
Sembilan Tanda dari Proyek Pergudangan Data yang Berhasil - dummies
Hanya karena setiap orang berkumpul di kafetaria perusahaan untuk kue dan plester dinding dengan spanduk ucapan selamat tidak berarti bahwa proyek pergudangan data Anda sukses. Bab ini memberi Anda beberapa cara untuk mengatakan bahwa Anda benar-benar sukses. Sponsor eksekutif mengatakan, "Hal ini berhasil - ini benar-benar berhasil! "Misalkan seorang senior ...
Memodifikasi Produk Intelijen Bisnis untuk Menangani Produk Data intelijen besar
Tidak benar-benar dirancang untuk menangani data yang besar, sehingga mungkin memerlukan beberapa modifikasi. Mereka dirancang untuk bekerja dengan data yang sangat terstruktur dan dipahami dengan baik, sering disimpan dalam gudang data relasional dan ditampilkan di komputer desktop atau laptop Anda. Analisis intelijen bisnis tradisional ini biasanya diterapkan pada data foto, bukan ...
Jenis kecerdasan bisnis lainnya - dummies
, Model rapi dan teratur yang memiliki empat jenis kategori intelijen bisnis (query dan pelaporan, analisis bisnis [OLAP], data mining, dan dashboard dan scorecard) dapat diperluas untuk aplikasi yang lebih kompleks. Misalnya, alat OLAP atau dasbor mungkin memiliki kemampuan sistem informasi geografis (SIG) - atau mungkin juga tidak. Seperti yang ditunjukkan pada ...
Produk relasional dan Data Warehousing - dummies
Berikut adalah beberapa produk database relasional terkemuka yang mungkin ingin Anda gunakan untuk data Anda. gudang. Hampir semua vendor ini, selama beberapa tahun terakhir, memperoleh produk tambahan, termasuk teknologi OLAP atau multidimensional-oriented dan RDBMS lainnya untuk mendukung platform yang sangat beragam dan terintegrasi ke dalam lini produk dan arsitektur mereka. Anda mungkin ingin ...
Mempersiapkan Semantik dalam Data Warehousing - dummies
Jika Anda mengevaluasi bagaimana teknologi yang terkait dengan pekerjaan pergudangan data, banyak metadata dikelola secara eksklusif di dalam alat. Beberapa telah mencoba di masa lalu untuk memecahkan masalah integrasi dengan menciptakan teknologi lain, yang dikenal sebagai repositori metadata teknis, untuk mengintegrasikan semua metadata ini dari berbagai alat. Seperti ...
Haruskah Anda Menggunakan Peralatan atau Kode Kustom? - dummies
Pada awal data pergudangan, sebagian besar organisasi menangani layanan middleware melalui pengkodean ubahsuaian, bukan dengan beberapa alat yang tersedia pada saat itu, seperti yang ditunjukkan pada contoh ini: Organisasi menulis sebuah program dalam sebuah program bahasa seperti COBOL, atau mungkin di lingkungan seperti SAS, untuk menangani ekstrak data ...
Query dan Alat Pelaporan untuk Data Warehousing - dummies
Alat query dan pelaporan membantu Anda menjalankan laporan reguler, membuat daftar terorganisir, dan melakukan pelaporan dan query lintas-tabular. Berikut adalah beberapa alat query dan pelaporan untuk membiasakan diri Anda. Peran SQL SQL adalah bahasa query database resmi yang digunakan untuk mengakses dan memperbarui data yang terdapat dalam sistem manajemen basis data relasional, ...
Replikasi Layanan untuk Data Warehousing - dummies
Layanan middleware replikasi menggabungkan seleksi dan ekstraksi, pergerakan, dan pemuatan dari satu database ke satu atau lebih lainnya, biasanya dikelola oleh produk DBMS tunggal. (Sumber database dan semua targetnya adalah semua Oracle, semua Sybase, atau semua Microsoft SQL Server, misalnya.) Meskipun kemampuan layanan replikasi bervariasi di antara produk DBMS, secara tradisional, mereka telah ...
RDBMS di Data Besar Lingkungan - dummies
Data besar menjadi elemen penting dalam cara organisasi memanfaatkan yang tinggi. -volume data pada kecepatan yang tepat untuk memecahkan masalah data tertentu. Sistem Manajemen Database Relasional penting untuk volume tinggi ini. Data besar tidak hidup terpisah. Agar efektif, perusahaan seringkali harus dapat menggabungkan hasil ...
Arsitektur Berorientasi Layanan (SOA) - dummies
Jika Anda membuat lebih banyak integrasi data dengan menggunakan data BPO dan MDM toko, Anda juga memerlukan pesan, atau komunikasi, arsitektur untuk memungkinkan sistem yang tidak dibangun untuk berkomunikasi satu sama lain untuk melakukannya. Masukkan konsep arsitektur berorientasi layanan, atau SOA. SOA adalah metode untuk pengembangan dan integrasi sistem di mana fungsionalitas ...
Data terstruktur di lingkungan data besar - dummies
Istilah data terstruktur umumnya mengacu pada data yang memiliki definisi panjang dan format untuk data besar. Contoh data terstruktur meliputi angka, tanggal, dan kelompok kata dan angka yang disebut string. Sebagian besar ahli sepakat bahwa data semacam ini menyumbang sekitar 20 persen dari data yang ada di luar sana. Data terstruktur ...
Database spasial di database data besar - dummies
Dapat menjadi alat penting dalam proyek data besar Anda . Data spasial itu sendiri distandarisasi melalui upaya Konsorsium Geospasial Terbuka (OGC), yang menetapkan OpenGIS (Sistem Informasi Geografis) dan sejumlah standar lain untuk data spasial. Entah Anda mengetahuinya atau tidak, Anda bisa berinteraksi dengan data spasial setiap hari. ...
Cloud in the Context of Big Data - dummies
Komputasi awan adalah metode untuk menyediakan satu set sumber daya komputasi bersama dan menjadi semakin penting untuk inisiatif data besar Anda. Awan mencakup platform aplikasi, komputasi, penyimpanan, jaringan, pengembangan, dan penerapan, serta proses bisnis. Komputasi awan mengubah aset komputasi siled tradisional menjadi kumpulan sumber daya bersama berdasarkan pada ...
Sepuluh Keterampilan Wajib untuk Konsultan Pergudangan Data - dummies
Konsultan pergudangan data yang baik memiliki kemampuan tertentu dalam menangani dengan orang dan pengetahuan tentang berbagai aspek pergudangan data. Daftar ini memungkinkan Anda memperoleh beberapa keterampilan yang dibutuhkan semua konsultan pergudangan data. Visi yang luas Bahkan seorang konsultan pergudangan data yang ahli di bidang tertentu (desain skema bintang ...
Sepuluh Sumber Informasi terkini tentang Data Warehousing - dummies
Anda mungkin tidak akan terkejut mendengar bahwa istilah up-to-date informasi tentang data warehousing berarti "go look on the Internet. "Perlu waktu Anda untuk memeriksa situs Web di bab ini. The Data Warehousing Institute Di situs komprehensif Warehouse Data Warehousing, Anda dapat menemukan barang-barang ini: Informasi Pendidikan Upcoming events White ...
Pembuatan Struktur Data Besar yang Dapat dikelola - dummies
Saat komputasi bergerak ke pasar komersial, data disimpan di flat file yang tidak memaksakan struktur. Saat ini, data besar memerlukan struktur data yang dapat diatur. Ketika perusahaan perlu mencapai tingkat pemahaman rinci tentang pelanggan, mereka harus menerapkan metode brute force, termasuk model pemrograman yang sangat rinci untuk menciptakan beberapa nilai. Kemudian di ...
Text Analytics for Unstructured Big Data - dummies
Banyak metode yang ada untuk menganalisis data tidak terstruktur untuk inisiatif data besar Anda. Secara historis, teknik ini keluar dari bidang teknis seperti Natural Language Processing (NLP), penemuan pengetahuan, data mining, pencarian informasi, dan statistik. Analisis teks adalah proses menganalisis teks tidak terstruktur, mengekstrak informasi yang relevan, dan mengubahnya menjadi informasi terstruktur yang kemudian dapat ...
Data Warehouse Deluxe - dummies
Kemungkinan besar akan memusatkan sebagian besar data Anda terkait aktivitas pergudangan pada data warehouse lingkungan mewah, seperti yang ditunjukkan pada gambar ini. Data dari berbagai sumber berkumpul di gudang data "sebenarnya" ini, yang menyediakan banyak pilihan arsitektural yang dapat Anda jadikan sesuai untuk memenuhi kebutuhan spesifik Anda. Bidang subjek dan isi data ...
Data Warehouse Supreme - dummies
Gudang data mutakhir sekarang tampak seperti gudang data yang rumit. . Data warehouse besok, meskipun - data warehouse tertinggi - akan terlihat sangat berbeda. Ada beberapa perusahaan yang telah berkelana ke arah ini, walaupun karena biaya dan kapabilitas keseluruhan, masih jarang ditemukan banyak data warehouse. ...
Sepuluh Tanda-tanda Proyek Pergudangan Data di Trouble-dummies
Anda dapat dengan mudah mengetahui bahwa data Anda Proyek pergudangan bermasalah jika Anda tidak memiliki apa-apa untuk ditunjukkan atas usaha Anda saat Anda mengira akan melakukannya. Cobalah untuk mendapatkan beberapa indikasi bahwa masalah pembuatan bir, bagaimanapun, sebelum Anda mencapai titik itu. Daftar ini berisi sepuluh tanda peringatan dini. Tahap lingkup proyek berakhir dengan ...
Model Evolusi Penerapan di Era Data Besar - dummies
Dengan munculnya data besar , model penyebaran untuk mengelola data berubah. Gudang data tradisional biasanya diimplementasikan pada sistem tunggal dan besar di dalam pusat data. Biaya model ini telah menyebabkan organisasi mengoptimalkan gudang ini dan membatasi cakupan dan ukuran data yang dikelola. Namun, ketika ...
Sepuluh Bidang Keahlian Cover dengan Data Warehousing Vendors - dummies
Berikut adalah sepuluh bidang studi yang harus Anda diskusikan dengan vendor produk pergudangan data, tidak peduli kategori produk apa (alat intelijen bisnis, alat middleware, atau RDBMS, misalnya), Anda mempertimbangkan untuk membeli. Ada juga pertanyaan spesifik yang mungkin ingin Anda tanyakan. Semua pertanyaan ini agak aneh karena tidak ada hubungannya dengan ...
Masa Depan Gudang Data di Era Data Besar - dummies
Pasar data warehouse memang mulai berubah dan berkembang seiring dengan kemunculan data besar. Di masa lalu, tidak ekonomis bagi perusahaan untuk menyimpan sejumlah besar data dari sejumlah besar sistem rekam. Kurangnya arsitektur komputasi terdistribusi yang praktis dan praktis berarti data ...
Kategori Utama Intelijen Bisnis - dummies
Pada awal proyek pergudangan data Anda, jangan fokus pada jenis alat yang Anda butuhkan - belum. Sebagai gantinya, berkonsentrasilah untuk mencari tahu jenis pertanyaan yang akan diajukan pengguna terhadap konten gudang data, jenis laporan yang akan dijalankan dan untuk tujuan apa, dan model umum pemrosesan yang ...
Hubungan antara Panel Kontrol, Scorecard, dan Bagian Lain Intelijen Bisnis - dummies
Dashboard dan kartu skor sering dikaitkan dengan hasil dari alat intelijen bisnis lainnya, yang mewakili mekanisme presentasi, dan bukan mekanisme analisis. Misalnya, Anda bisa membuat "halaman" dari sebuah buku briefing dari hasil berbagai laporan standar (berjalan dari alat pelaporan) di samping analisis multidimensi yang tidak sempurna dari organisasi ...
Kecerdasan intelijen bisnis kolaboratif
Benar-benar nyata dalam banyak situasi konsumen. eBay, Amazon, dan Google semua memanfaatkan data kunci untuk menyajikan informasi kepada Anda, konsumen. Perusahaan seperti eBay bahkan merenungkan produk di bidang pergudangan data dan intelijen bisnis untuk membantu vendor dalam produk bergerak lebih baik melalui platform mereka. Tapi teknologi ini membutuhkan ...
Evolusi Komputasi Terdistribusi untuk Data Big - dummies
Di balik semua tren penting selama dekade terakhir, termasuk orientasi layanan, komputasi awan, virtualisasi, dan data besar, adalah teknologi dasar yang disebut komputasi terdistribusi. Sederhananya, tanpa mendistribusikan komputasi, tidak satu pun dari kemajuan ini yang mungkin dilakukan. Komputasi terdistribusi adalah teknik yang memungkinkan komputer individu dihubungkan ke seluruh wilayah geografis seolah-olah ...
Dasar-dasar Integrasi Data Besar - dummies
Elemen fundamental dari platform data besar mengelola data dengan cara baru dibandingkan dengan database relasional tradisional. Hal ini karena kebutuhan untuk memiliki skalabilitas dan kinerja tinggi yang dibutuhkan untuk mengelola data terstruktur dan tidak terstruktur. Komponen dari ekosistem data besar mulai dari Hadoop sampai NoSQL DB, MongoDB, Cassandra, ...
Tiga Aspek Intelijen Bisnis Kolaborasi - dummies
Intelijen bisnis kolaboratif adalah lingkungan di mana pengguna dapat dengan mudah berkolaborasi dan berkomunikasi satu sama lain, berbagi gagasan, informasi, dan pengambilan keputusan di dalam komunitas mereka. Retensi Pengetahuan Setiap hari, tidak ada yang menangkap jutaan item kekayaan intelektual (percakapan, e-mail, dan panggilan telepon) di berbagai organisasi di seluruh dunia. Menggunakan perangkat lunak kolaboratif untuk ...
Top-down, Quick-Strike Data Marts - dummies
Kadang-kadang, Anda tidak punya sebuah gudang data untuk mendapatkan data untuk data mart Anda, jadi Anda harus mencari data dari aplikasi Anda sendiri. Dalam banyak (mungkin sebagian besar) situasi ini, Anda membuat data mart pemogokan cepat - yang berlaku, sebuah gudang data miniatur namun dibangun untuk memenuhi tuntutan ...