Video: 5 Cara Mengetahui/Cek Data Ganda di Excel 2024
Data disimpan dalam berbagai cara dalam sistem yang berbeda. Jadi tidak mengherankan bila mengumpulkan dan mengkonsolidasikan data dari berbagai sumber, ada kemungkinan duplikat muncul. Secara khusus, apa yang membuat catatan individu unik berbeda untuk sistem yang berbeda.
Ringkasan akun investasi dilampirkan ke nomor rekening. Ringkasan portofolio dapat disimpan di tingkat individu atau rumah tangga. Dan sejarah perdagangan semua akun disimpan di tingkat transaksi individual.
Penting untuk menjelaskan dengan jelas apa yang seharusnya membedakan catatan unik dalam file data Anda. Misalnya, jika itu adalah file tingkat transaksi, maka nomor rekening dan nomor rumah tangga akan diduplikasi. Selama Anda memahami hal ini dan sedang melakukan analisis tingkat transaksi, Anda akan baik-baik saja.
Tetapi jika Anda tertarik untuk menggunakan data ini untuk menganalisis jumlah akun yang dimiliki oleh setiap rumah tangga, Anda akan mengalami masalah. Rumah tangga yang berdagang lebih sering memiliki catatan lebih banyak daripada yang tidak banyak diperdagangkan. Anda harus memiliki file di tingkat akun.
Menghapus duplikat catatan tidak terlalu sulit. Sebagian besar paket statistik dan sistem basis data memiliki perintah built-in yang mengelompokkan catatan bersama-sama. (Sebenarnya, dalam bahasa database SQL, perintah ini disebut Group By.)