Rumah Keuangan Pribadi Memodifikasi Produk Intelijen Bisnis untuk Menangani Produk Data intelijen besar

Memodifikasi Produk Intelijen Bisnis untuk Menangani Produk Data intelijen besar

Daftar Isi:

Video: IOHK | Cardano whiteboard; overview with Charles Hoskinson 2024

Video: IOHK | Cardano whiteboard; overview with Charles Hoskinson 2024
Anonim

Produk intelijen bisnis tradisional tidak benar-benar dirancang untuk menangani data yang besar, sehingga mungkin memerlukan beberapa modifikasi. Mereka dirancang untuk bekerja dengan data yang sangat terstruktur dan dipahami dengan baik, sering disimpan dalam gudang data relasional dan ditampilkan di komputer desktop atau laptop Anda. Analisis intelijen bisnis tradisional ini biasanya diterapkan pada snapshot data daripada keseluruhan jumlah data yang tersedia. Apa bedanya dengan analisa data yang besar?

Data besar terdiri dari data terstruktur, semi terstruktur, dan tidak terstruktur. Anda sering memiliki banyak, dan itu bisa sangat kompleks. Bila Anda memikirkan untuk menganalisanya, Anda perlu mengetahui karakteristik potensial dari data Anda:

Itu bisa berasal dari sumber yang tidak tepercaya.

  • Analisis data yang besar sering melibatkan penggabungan data dari berbagai sumber. Ini mungkin termasuk sumber data internal dan eksternal. Seberapa terpercaya sumber informasi eksternal ini? Misalnya, bagaimana bisa dipercaya adalah data media sosial seperti tweet? Informasi mungkin berasal dari sumber yang tidak terverifikasi. Integritas data ini perlu dipertimbangkan dalam analisis.

    Bisa kotor.
  • Data kotor mengacu pada data yang tidak akurat, tidak lengkap, atau salah. Ini mungkin termasuk salah mengeja kata-kata; sebuah sensor yang rusak, tidak dikalibrasi dengan benar, atau rusak dalam beberapa cara; atau bahkan data terduplikasi. Data ilmuwan berdebat tentang tempat untuk membersihkan data - baik yang dekat dengan sumber maupun secara real time. Tentu saja, salah satu aliran pemikiran mengatakan bahwa data kotor seharusnya tidak dibersihkan sama sekali karena mungkin mengandung outlier yang menarik. Strategi pembersihan mungkin tergantung pada sumber dan jenis data dan tujuan analisis Anda. Misalnya, jika Anda mengembangkan filter spam, sasarannya adalah mendeteksi elemen buruk dalam data, jadi Anda tidak ingin membersihkannya.

    Rasio signal-to-noise bisa rendah.

    Dengan kata lain, sinyal (informasi yang dapat digunakan) mungkin hanya sebagian kecil dari data; Kebisingan adalah sisanya. Mampu mengekstrak sinyal kecil dari data berisik merupakan bagian dari analisis data yang besar, namun Anda harus sadar bahwa sinyal mungkin memang kecil.
  • Ini bisa real-time. Dalam banyak kasus, Anda akan mencoba menganalisis aliran data real-time.

  • Tata kelola data yang besar akan menjadi bagian penting dari persamaan analisis. Di bawah analisis bisnis, penyempurnaan perlu dilakukan pada solusi tata kelola untuk memastikan kebenaran yang diperoleh dari sumber data baru, terutama karena digabungkan dengan data terpercaya yang ada yang tersimpan di gudang.Keamanan data dan solusi privasi juga perlu ditingkatkan untuk mendukung pengelolaan / pengelolaan data besar yang tersimpan dalam teknologi baru. Analisis data analitis besar

Bila Anda mempertimbangkan analisis data yang besar, Anda harus sadar bahwa ketika Anda meluaskan melampaui desktop, algoritme yang Anda gunakan sering perlu

refactored,

mengubah kode internal tanpa mempengaruhi fungsi eksternalnya. Keindahan infrastruktur data yang besar adalah Anda bisa menjalankan model yang biasa berjam-jam atau berhari-hari dalam hitungan menit. Ini memungkinkan Anda mengulangi model ratusan kali. Namun, jika Anda menjalankan regresi pada satu miliar baris data di lingkungan terdistribusi, Anda perlu mempertimbangkan persyaratan sumber daya yang berkaitan dengan volume data dan lokasinya di cluster. Algoritma Anda perlu disadari data. Selain itu, vendor mulai menawarkan analisis baru yang dirancang agar ditempatkan dekat dengan sumber data yang besar untuk menganalisis data yang ada. Pendekatan analisis berjalan ini mendekati sumber data meminimalkan jumlah data yang tersimpan dengan hanya mempertahankan data bernilai tinggi. Hal ini juga memungkinkan Anda untuk menganalisis data lebih cepat, yang penting untuk pengambilan keputusan secara real-time.

Tentu saja, analytics akan terus berkembang. Misalnya, Anda mungkin memerlukan kemampuan visualisasi real-time untuk menampilkan data real-time yang terus berubah. Bagaimana Anda bisa merencanakan satu miliar poin di plot grafik? Atau, bagaimana Anda bekerja dengan algoritma prediktif sehingga mereka melakukan analisis cukup cepat dan cukup dalam untuk memanfaatkan kumpulan data kompleks yang terus berkembang? Ini adalah bidang penelitian aktif.

Dukungan infrastruktur data yang besar

Cukuplah dikatakan bahwa jika Anda mencari platform, perlu untuk mencapai hal-hal berikut:

Mengintegrasikan teknologi:

Infrastruktur perlu mengintegrasikan teknologi data baru yang besar dengan teknologi tradisional untuk dapat memproses semua jenis data besar dan membuatnya dapat dikonsumsi oleh analisis tradisional.

  • Simpan data dalam jumlah besar yang berbeda: Sistem Hadoop yang mengeras perusahaan mungkin diperlukan yang dapat memproses / menyimpan / mengelola sejumlah besar data saat istirahat, apakah terstruktur, semi terstruktur, atau tidak terstruktur.

  • Mengolah data yang sedang berjalan: Kemampuan komputasi arus mungkin diperlukan untuk memproses data dalam gerak yang terus dihasilkan oleh sensor, perangkat cerdas, video, audio, dan log untuk mendukung pengambilan keputusan secara real-time.

  • Data gudang: Anda mungkin memerlukan solusi yang dioptimalkan untuk beban kerja analitik operasional atau dalam untuk menyimpan dan mengelola data terpercaya yang terus bertambah.

  • Dan tentu saja, Anda memerlukan kemampuan untuk mengintegrasikan data yang telah Anda miliki beserta hasil analisis data yang besar.

Memodifikasi Produk Intelijen Bisnis untuk Menangani Produk Data intelijen besar

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...