Rumah Keuangan Pribadi Memastikan Kualitas Data Eksternal yang Masuk

Memastikan Kualitas Data Eksternal yang Masuk

Video: Amazon, Jeff Bezos and collecting data | DW Documentary 2024

Video: Amazon, Jeff Bezos and collecting data | DW Documentary 2024
Anonim

Saat Anda merancang gudang data dan Anda menentukan data eksternal yang Anda butuhkan, Anda cukup melakukan pemesanan (mirip dengan memesan pakaian atau keranjang buah dari situs online). Setelah Anda mulai menerima data melalui arus, transfer file, atau cara lain, itu berlayar mulus - atau bukan?

Bagaimana dengan kualitas data yang masuk? Anda benar-benar harus menerapkan seperangkat prosedur penjaminan mutu (QA) yang sama untuk data yang disediakan secara eksternal yang Anda lakukan terhadap data yang berasal dari sistem internal Anda sendiri. Hanya karena Anda membeli informasi di pasar terbuka tidak menjamin bahwa datanya tidak sempurna.

Terapkan prosedur QA ke setiap data batch yang masuk dengan mengikuti langkah-langkah berikut:

  1. Cari tahu apakah data yang masuk memiliki nilai cek yang ditambahkan ke file.

    Beberapa contoh nilai cek adalah jumlah record di setiap file, nilai total setiap kolom numerik (jumlah total penjualan untuk semua record dan total unit yang terjual untuk semua record, misalnya), dan himpunan bagian dari total nilai kolom (jumlah total penjualan dan unit oleh negara, misalnya).

    Jika nilai cek diberikan, maka harus disimpan dan digunakan sebagai bagian dari prosedur pemuatan end-to-end. Tidak ada yang harus secara resmi memperbarui isi gudang sampai jumlah cek sesuai dengan perhitungan yang Anda buat saat menyiapkan data untuk pemuatan.

  2. Jika tidak ada nilai cek yang diberikan, mintalah mereka.

    Meskipun permintaan tersebut memerlukan beberapa siklus (beberapa minggu atau bulan, misalnya) untuk mengisi, setiap penyedia data yang tertarik untuk menyediakan layanan pelanggan tingkat tinggi memerlukan jenis permintaan ini dengan serius dan berusaha membuat informasi kontrol yang diminta tersedia.

  3. Selama prosedur pemuatan Anda, saring setiap baris.

    Pastikan bahwa kondisi berikut ini benar:

    1. Kunci (pengenal unik untuk setiap rekaman) benar di semua informasi. Misalnya, jika setiap record dalam kelompok data SalesMasterRecord harus memiliki persis 12 catatan terkait di SalesDetailRecord (satu untuk setiap bulan), pastikan semua catatan detail ada dengan membandingkan nilai kunci rekam.

    2. Kisaran nilai sudah benar. Penjualan produk per bulan, misalnya, harus berada dalam batas yang wajar untuk jenis produk tersebut (pesawat terbang berbeda dari baut, misalnya).

    3. Bidang informasi yang hilang (kemungkinan - hampir tak terelakkan - kejadian dengan data yang disediakan secara eksternal) tidak merusak makna data yang masuk.

      Misalnya, walaupun tidak adanya potongan data tambahan (ditentukan menurut peraturan bisnis untuk industri atau organisasi spesifik Anda) mungkin tidak terlalu serius, jika setengah catatan masuk memiliki ruang kosong di mana UnitsSold, TotalSalesPrice, atau beberapa jenis informasi penting lainnya, nilai data paling dipertanyakan.

    4. Terutama pada tahap awal mendapatkan data eksternal (tiga atau empat bulan pertama, misalnya), gunakan alat analisis Anda, seperti yang dijelaskan di Bab 10, untuk melakukan analisis kualitas data sebelum pengguna Anda menggunakan alat yang sama untuk melakukan bisnis. analisis.

      Mencari keanehan, anomali, hasil yang membingungkan, ketidakkonsistenan, paradoks nyata, dan hal lain yang terlihat aneh. Kemudian, tiriskan ke akar data untuk memeriksa sumber keanehan.

      Ingatlah bahwa Anda mungkin berurusan dengan jutaan baris data masuk: Selain tidak dapat secara pribadi memeriksa setiap baris, Anda mungkin mengalami kesulitan untuk menyiapkan kriteria pemeriksaan pemfilteran dan QA untuk setiap kondisi yang mungkin terjadi.

      Siapa pun yang pernah melakukan sesuatu dengan data sumber yang disediakan secara eksternal telah menemukan semua jenis inkonsistensi aneh dan data yang hilang dalam informasi yang masuk. Dengan menempatkan diri Anda di tempat pengguna dan menggunakan alat yang sama dengan yang mereka gunakan, Anda mungkin bisa menemukan satu atau dua hal yang dapat Anda perbaiki, membuat gudang data Anda menyimpan lebih banyak informasi bisnis yang berharga.

Memastikan Kualitas Data Eksternal yang Masuk

Pilihan Editor

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Menjelajahi Alternatif untuk Jaringan Multichannel - dummies

Ada kekuatan dalam jumlah - atau begitulah kata pepatah. Hal ini dapat membantu saat mengelola saluran YouTube Anda. Pemikiran seperti inilah yang menyebabkan terbentuknya jaringan multichannel (sering disebut dengan singkatan MCNs) di YouTube. MCN pada dasarnya adalah kesepakatan kemitraan yang dibuat oleh pembuat konten independen dengan jumlah yang lebih besar ...

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Apa yang harus dilakukan jika Anda lupa kata kunci atau kata kunci YouTube

Jika Anda lupa nama pengguna atau kata sandi YouTube Anda, jangan panik YouTube memiliki alamat e-mail Anda, dan Anda dapat mengambil nama pengguna atau kata sandi yang terlupakan dari mereka. (Saat pertama kali mendaftar ke YouTube, catat nama pengguna dan kata sandi Anda, terutama jika berbeda dari yang biasa Anda gunakan di situs Web lainnya.) Buka YouTube. com ...

Apa itu YouTube Red? - dummies

Apa itu YouTube Red? - dummies

YouTube Red adalah layanan berlangganan baru yang meningkatkan pengalaman YouTube. Layanan ini mencakup langganan Google Play Musik. YouTube Red bukan hanya layanan streaming video - namun juga membuka fitur hebat membuat YouTube menjadi tempat yang tepat untuk hiburan berjam-jam. Kredit: Gambar milik YouTube. com. Layanan Red YouTube ...

Pilihan Editor

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Dua kolom Kolom Sidebar kiri Desain Gambar - dummies

Gambar cermin dari layout sidebar kanan dua kolom , desain blog dua kolom ini menampilkan konten blog utama Anda di sisi kanan dengan sidebar di sebelah kiri. Memilih sidebar di sebelah kanan pasti pilihan yang lebih umum di blogland, namun menggunakan sidebar kiri tetap bisa memberi dampak. Di sini, Anda ...

Transparansi dalam Komunitas Online - dummies

Transparansi dalam Komunitas Online - dummies

Transparansi adalah kata besar di ruang media sosial saat ini. Ini adalah istilah yang menyenangkan dan menyenangkan untuk kejujuran. Ini berarti mendapatkan kepercayaan komunitas online karena tidak ada yang perlu disembunyikan. Dengan bersikap transparan, Anda memberi pandangan publik pada cara kerja merek Anda. Anda tidak menyapu pers atau ketidakpuasan yang buruk di bawah karpet. ...

Matikan Blog Mom Anda ke Job - dummies

Matikan Blog Mom Anda ke Job - dummies

Dapatkan pekerjaan bukanlah perluasan dari Anda blog, tapi anggap itu lebih sebagai perluasan karir Anda. Beberapa blogger, termasuk ibu, telah membangun begitu banyak kepercayaan dan kredibilitas di media sosial bahwa perusahaan telah mempekerjakan mereka untuk mengisi beberapa pemasaran media sosial yang hebat dan posisi manajemen lainnya. Bila Anda ...

Pilihan Editor

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Cara membuat Lembar Kerja Prakiraan di Excel 2016 - dummies

Fitur Lembar Perkiraan baru di Excel 2016 membuatnya sangat mudah untuk mengubah lembar kerja yang berisi data keuangan historis menjadi lembar kerja ramalan visual yang luar biasa. Yang Anda lakukan adalah membuka lembar kerja dengan data historis Anda, posisi kursor sel dalam satu selnya, lalu klik tombol Forecast Sheet pada Data ...

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Cara membuat Peta Daya 3-D di Excel 2016 - dummies

Power Map adalah nama fitur analisis visual baru yang menarik di Excel 2016 yang memungkinkan Anda menggunakan data geografis, keuangan, dan jenis lainnya bersama dengan bidang tanggal dan waktu dalam model data Excel Anda untuk membuat tur peta 3D animasi. Untuk membuat animasi baru untuk tur pertama di Power ...

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Bagaimana cara Copy Formula dengan IsiOtomatis di Excel 2016 - dummies

Jika Anda hanya perlu menyalin satu formula di Excel 2016, gunakan fitur IsiOtomatis atau perintah Copy and Paste. Jenis salinan formula ini, meski lumrah, tidak bisa dilakukan dengan drag and drop. Jangan lupa pilihan Totals pada alat Quick Analysis. Anda bisa menggunakannya untuk membuat baris ...