Video: Cara Format Flashdisk Yang Benar dan Aman 2024
Manusia menggunakan pengalaman saat mereka menafsirkan data yang mereka lihat, namun komputer tidak dapat melakukannya. Perangkat lunak data mining Anda akan melakukan yang terbaik untuk mengidentifikasi jenis data di setiap kolom, namun tipe data seringkali tidak jelas.
Bila Anda melihat daftar Kode ZIP, Anda tidak mencoba menambahkan dan menguranginya. Anda tahu bahwa mereka mewakili tempat. Anda mengerti ini karena Anda memiliki banyak pengalaman dalam melihat dan mengenali Kode ZIP. Komputer mungkin menafsirkan Kode Pos sebagai ukuran integer atau kontinyu. Pada akhirnya, terserah Anda untuk menentukan format yang tepat.
Fungsi untuk mengatur format dan peran data (seperti yang menunjukkan variabel dependen untuk pemodelan) dapat dikubur dalam berbagai tempat dalam aplikasi penambangan data Anda. Anda dapat menentukan format dan peran variabel dalam file data sebelum Anda membuka aplikasi penambangan data (format data asli Orange dan Weka memungkinkan ini), sebagai bagian dari impor atau beberapa waktu kemudian dalam prosesnya.
Anda mungkin memiliki alat yang dibuat untuk tujuan ini, seperti alat yang ditunjukkan pada gambar berikut, atau Anda dapat menentukan properti ini di dalam prosedur lain.
Setiap aplikasi data mining memiliki seperangkat jenis variabel dan batasannya sendiri tentang bagaimana masing-masing jenis dapat digunakan. Beberapa batasan ini didasarkan pada teori. Misalnya, Anda hanya bisa menambahkan dan mengurangi angka, bukan huruf. Tapi yang lain mungkin hanya masalah bagaimana aplikasi itu dirancang.
Jadi, misalnya, Anda mungkin menemukan bahwa alat pemodelan tertentu dalam satu aplikasi memungkinkan Anda untuk memprediksi variabel kategoris dan kontinu, namun alat serupa pada aplikasi lain memungkinkan pemodelan hanya satu atau yang lain.