Video: Membuat Tabel Distribusi Frekuensi dengan SPSS Sangat Mudah 2024
Langkah pertama menuju pemodelan prediktif adalah menghubungkan variabel satu sama lain. Alat sederhana dan luar biasa untuk itu adalah scatterplot. Ini digunakan untuk menghubungkan satu ukuran terus menerus dengan yang lain. Penambang data kadang-kadang meregangkan peraturan dan menggunakannya dengan variabel kategoris juga.
Sumbu horisontal ( x ) dari plot mewakili nilai dari satu variabel; sumbu vertikal ( y ) mewakili variabel kedua. Anda mungkin tidak memiliki perasaan tentang variabel mana yang independen dan bergantung pada setiap pasangan variabel.
Jika Anda melakukannya, variabel independen harus berada pada sumbu horizontal. Setiap titik di plot mewakili koordinat, pasangan nilai untuk dua variabel dalam satu kasus. (Pasangan ini kadang disebut xy pair ).
Temukan alat scatterplot Anda dan buat alat scatterplot dasar dengan memilih dua variabel yang akan digunakan. Gambar berikut menunjukkan alat ini pada menu Orange; lokasi alat bervariasi menurut produk.
Contoh pada gambar berikutnya menunjukkan tampilan interaktif; scatterplot segera muncul. Di alat lain, Anda mungkin memerlukan langkah tambahan untuk mengeksekusi dan membuat bagan.
Contoh scatterplot menghubungkan jarak tempuh otomatis dengan tenaga mesin. Tenaga kuda rendah dikaitkan dengan jarak tempuh yang tinggi, dan semakin tinggi tenaga kuda, semakin rendah jarak tempuhnya. Anda dapat dengan mudah melihat pola ini dalam data. Anda mungkin melihat bentuk, tidak linier tapi agak melengkung. Ini bisa memberi petunjuk tentang tipe model apa yang akan dicoba nanti.
Aplikasi penambangan data sering memiliki beberapa fitur interaktif dalam tampilan grafik. Misalnya, gambar berikutnya menunjukkan bahwa mengarahkan kursor mouse ke titik menunjukkan nilai pasti dari dua variabel untuk titik itu. Ini lebih mudah daripada mencoba membaca nilai dari sumbu!