Video: Cara Membuat Struktur Organisasi 2024
Data mining memiliki persyaratan yang sangat ketat untuk organisasi data. Persyaratan mereka tidak eksotis, kompleks, atau sulit dipenuhi, tapi ketat. Angka tersebut menunjukkan contoh data yang dilihat sebagai tabel dalam perangkat lunak data mining.
Setiap baris mewakili satu bidang real estat. Informasi tentang bidang real estat diatur dalam kolom. Kolom pertama berisi nomor identifikasi pajak (TAXKEY), kolom kedua berisi nilai penilaian lahan dari penilaian sebelumnya (P_A_LAND), dan seterusnya.
Setiap entri dalam satu baris berhubungan dengan satu bidang tanah tertentu. Setiap entri dalam satu kolom adalah jenis informasi yang sama. Tidak ada baris atau kolom dibiarkan kosong karena alasan yang berkaitan dengan gaya dan keterbacaan. Data ini disusun dengan benar untuk menyelidiki perbedaan di antara bidang real estat.
Jika, alih-alih real estat, Anda menyelidiki orang, masing-masing orang akan ditunjukkan satu baris dalam data, dan semua rincian tentang orang-orang akan diatur dalam kolom. Jika Anda menyelidiki rontgen dada, masing-masing x-ray dada akan ditunjukkan oleh satu baris data, dan semua rincian tentang rontgen dada akan disusun dalam kolom.
Dalam terminologi analisis data, hal-hal yang sedang Anda pelajari - item dalam baris - disebut kasus atau . Dan rincian tentang mereka, yang ada di kolom, disebut variabel . Anda juga akan mendengar kolom yang disebut bidang , terutama dalam konteks database.
Jadi, data mining memerlukan data yang disusun dengan satu baris untuk setiap kasus dan satu kolom untuk setiap variabel. Banyak sumber data yang sudah terorganisir dengan cara ini. Ahli statistik mengatur data dengan cara ini menurut kebiasaan. Profesional database mungkin tidak menggunakan pendekatan ini untuk sebagian besar pekerjaan mereka, tapi biasanya mereka akan mengerti apa yang Anda inginkan jika Anda menyebutnya tabel datar .
Anda akan menemukan variasi struktur data yang halus. Beberapa jenis perangkat lunak menggunakan informasi deskriptif di header sebelum data, seperti format khusus tertentu yang terkait dengan aplikasi pertambangan data Orange dan Weka. Beberapa prosedur analitik yang rumit memiliki persyaratan tambahan atau sedikit bervariasi (ini sangat tidak biasa). Tapi inti dari data masih memiliki kasus dalam baris dan variabel dalam kolom.