Video: What's data aggregation? 2024
Merangkum data, menemukan total, dan menghitung rata-rata dan ukuran deskriptif lainnya mungkin bukan hal baru bagi Anda.. Bila Anda membutuhkan ringkasan Anda dalam bentuk data baru, bukan laporan, prosesnya disebut agregasi . Data gabungan dapat menjadi dasar perhitungan tambahan, digabungkan dengan kumpulan data lain, digunakan dengan cara apa pun sehingga data lain digunakan.
Berikut adalah contoh proses agregasi data. Dataset berisi informasi umum tentang lebih dari 160.000 bidang real estat. Data ini mencakup berbagai penggunaan lahan. Bagaimana jika Anda ingin melihat nilai rata-rata yang dinilai untuk lahan di setiap kategori penggunaan lahan? Inilah cara Anda melakukannya.
Anda akan menemukan alat agregasi data dalam aplikasi data mining Anda. Anda bisa menggunakan pencarian untuk menemukannya.
Anda akan menambahkan alat ini ke sebuah proses dan menghubungkannya ke dataset sumber.
Dalam alat agregasi data, Anda akan memilih variabel pengelompokan. Dalam kasus ini, ini adalah variabel Penggunaan Lahan, C_A_CLASS.
Kemudian Anda akan menentukan ringkasan yang Anda inginkan. Untuk mendapatkan nilai rata-rata nilai tanah, Anda akan memilih variabel dengan penilaian untuk meringkas dan memilih fungsi rata-rata.
Saat agregasi dijalankan, hasilnya adalah dataset baru, dengan satu baris untuk setiap jenis penggunaan lahan dan variabel baru untuk rata-rata yang dihitung.
Cepat atau lambat, Anda harus mengumpulkan keseluruhan dataset. Tetapi bila Anda ingin total atau rata-rata semua data dalam kumpulan data, Anda mungkin mengalami masalah: Apa variabel pengelompokan Anda? Caranya adalah dengan menggunakan variabel dengan nilai konstan untuk keseluruhan dataset. Jadi, buat variabel dimana setiap nilai sama, dan kemudian gunakan sebagai variabel pengelompokan Anda.