Rumah Keuangan Pribadi Bagaimana Menguji Model Analisis Prediktif - dummies

Bagaimana Menguji Model Analisis Prediktif - dummies

Daftar Isi:

Video: Uji Regresi dengan Variabel Moderasi MRA dalam SPSS 2024

Video: Uji Regresi dengan Variabel Moderasi MRA dalam SPSS 2024
Anonim

Untuk dapat menguji model analisis prediktif yang Anda bangun, Anda perlu membagi dataset Anda menjadi dua set: kumpulan data pelatihan dan tes. Kumpulan data ini harus dipilih secara acak dan harus merupakan representasi yang baik dari populasi sebenarnya.

  • Data serupa harus digunakan untuk dataset pelatihan dan tes.

  • Biasanya dataset pelatihan secara signifikan lebih besar daripada dataset tes.

  • Menggunakan dataset uji membantu Anda menghindari kesalahan seperti overfitting.

  • Model yang dilatih dijalankan terhadap data uji untuk melihat seberapa baik model akan tampil.

Beberapa data ilmuwan lebih memilih untuk memiliki dataset ketiga yang memiliki karakteristik yang mirip dengan dua data pertama: sebuah validation dataset . Idenya adalah bahwa jika Anda secara aktif menggunakan data pengujian untuk menyempurnakan model Anda, Anda harus menggunakan perangkat terpisah (ketiga) untuk memeriksa keakuratan model.

Memiliki dataset validasi, yang tidak digunakan sebagai bagian dari proses pengembangan model Anda, membantu memastikan perkiraan netral tentang keefektifan dan keefektifan model.

Jika Anda telah membuat beberapa model dengan menggunakan berbagai algoritma, sampel validasi juga dapat membantu Anda mengevaluasi model mana yang terbaik.

Pastikan Anda memeriksa ulang pekerjaan Anda untuk mengembangkan dan menguji modelnya. Secara khusus, bersikap skeptis jika performa atau keakuratan model nampaknya terlalu bagus untuk menjadi kenyataan. Kesalahan bisa terjadi di mana Anda paling tidak mengharapkannya. Tanggal penghitungan yang salah untuk data deret waktu, misalnya, dapat menyebabkan hasil yang keliru.

Cara menggunakan cross-validation

Cross-validation adalah teknik populer yang dapat Anda gunakan untuk mengevaluasi dan memvalidasi model Anda. Prinsip penggunaan dataset yang sama untuk pengujian dan pelatihan berlaku di sini: Data pelatihan digunakan untuk membangun model; model dijalankan terhadap pengujian yang ditetapkan untuk memprediksi data yang belum pernah dilihat sebelumnya, yang merupakan salah satu cara untuk mengevaluasi keakuratannya.

Dalam validasi silang, data historis dibagi menjadi bilangan X dari himpunan bagian. Setiap kali subset dipilih untuk digunakan sebagai data uji, sisa himpunan bagian digunakan sebagai data pelatihan. Kemudian, pada tahap berikutnya, set tes sebelumnya menjadi salah satu set pelatihan dan salah satu dari rangkaian pelatihan sebelumnya menjadi rangkaian tes.

Proses berlanjut sampai setiap subset dari jumlah set X itu telah digunakan sebagai rangkaian tes.

Sebagai contoh, bayangkan Anda memiliki kumpulan data yang telah Anda terbagi menjadi 5 set yang diberi nomor 1 sampai 5. Pada tahap pertama, Anda menggunakan set 1 sebagai set tes dan gunakan set 2, 3, 4 dan 5 sebagai set pelatihan..Kemudian, pada run kedua, Anda menggunakan set 2 sebagai set tes dan menetapkan 1, 3, 4, dan 5 sebagai set pelatihan.

Anda melanjutkan proses ini sampai setiap subset dari 5 set telah digunakan sebagai test set.

Validasi silang memungkinkan Anda menggunakan setiap titik data dalam data historis Anda untuk pelatihan dan pengujian. Teknik ini lebih efektif daripada hanya membelah data historis Anda menjadi dua set, menggunakan himpunan dengan data terbanyak untuk pelatihan, dengan menggunakan rangkaian tes lainnya, dan membiarkannya pada saat itu.

Saat Anda menyvalidasi silang data Anda, Anda melindungi diri dari data uji pemindaian secara acak yang terlalu mudah diprediksi - yang akan memberi kesan palsu bahwa model Anda akurat. Atau, jika Anda kebetulan memilih data uji yang terlalu sulit diprediksi, Anda mungkin secara keliru menyimpulkan bahwa model Anda tidak berkinerja seperti yang Anda harapkan.

Cross-validation banyak digunakan tidak hanya untuk memvalidasi keakuratan model tapi juga untuk membandingkan kinerja beberapa model.

Bagaimana menyeimbangkan bias dan varians

Bias dan varians adalah dua sumber kesalahan yang dapat terjadi saat Anda membangun model analitis Anda.

Bias adalah hasil dari membangun model yang secara signifikan menyederhanakan penyajian hubungan antara titik data dalam data historis yang digunakan untuk membangun model.

Varians adalah hasil dari membangun model yang secara eksplisit spesifik untuk data yang digunakan untuk membangun model.

Mencapai keseimbangan antara bias dan varians - dengan mengurangi varians dan toleransi beberapa bias - dapat menyebabkan model prediksi yang lebih baik. Trade-off ini biasanya mengarah pada pengembangan model prediktif yang kurang kompleks.

Banyak algoritma data mining telah dibuat untuk memperhitungkan trade-off antara bias dan varians ini.

Cara memecahkan masalah gagasan

Saat menguji model Anda dan mendapati diri Anda tidak menuju ke mana-mana, inilah beberapa gagasan yang perlu dipertimbangkan agar bisa kembali berjalan:

  • Selalu periksa kembali pekerjaan Anda. Anda mungkin telah mengabaikan sesuatu yang Anda anggap benar tapi sebenarnya tidak. Kelemahan seperti itu bisa muncul (misalnya) di antara nilai variabel prediktif dalam dataset Anda, atau dalam preprocessing yang Anda gunakan pada data.

  • Jika algoritma yang Anda pilih tidak menghasilkan hasil apapun, cobalah algoritma lain. Misalnya, Anda mencoba beberapa algoritma klasifikasi yang tersedia dan bergantung pada data dan tujuan bisnis model Anda, salah satunya mungkin berkinerja lebih baik daripada yang lain.

  • Coba pilih variabel yang berbeda atau buat variabel turunan baru. Jadilah selalu mencari variabel yang memiliki kekuatan prediktif.

  • Sering berkonsultasi dengan pakar domain bisnis yang dapat membantu Anda memahami data, memilih variabel, dan menafsirkan hasil model.

Bagaimana Menguji Model Analisis Prediktif - dummies

Pilihan Editor

Perancang Minigame Minigame - dummies

Perancang Minigame Minigame - dummies

Sebelum menulis semua kode untuk membuat Minecraft Minigame, Anda perlu merancang permainan Anda. The Gameplay Loop adalah proses sederhana yang bisa Anda ikuti untuk memastikan permainan Anda menyenangkan, menantang, dan lengkap. The Gameplay Loop memiliki empat bagian: Start: Buat adegan dasar. Tujuan: Menambahkan cara untuk menang dan ...

Menciptakan Efek Air dan Es di Minecraft - dummies

Menciptakan Efek Air dan Es di Minecraft - dummies

Satu hal yang rapi tentang Minecraft adalah bahwa beberapa fisika realistis sedang dimainkan dalam permainan. Misalnya, jika Anda memiliki air dan Anda memasukkan es ke dalamnya, itu akan membeku! Oke, mungkin di dunia nyata, menambahkan es tidak membuat air membeku, tapi memang membuatnya lebih dingin. Anda dapat melihat ini ...

Mendapatkan Minecraft Experience Points - dummies

Mendapatkan Minecraft Experience Points - dummies

Di Minecraft, experience points, XP untuk jangka pendek, dikumpulkan dari bola pengalaman bercahaya. Sebagai pemain mengumpulkan cukup bola dan meningkatkan tingkat pengalaman mereka, mereka akan dapat menggunakan tabel dan landasan yang mempesona untuk meningkatkan kemampuan banyak item seperti senjata, baju besi, dan peralatan. Jadi, bagaimana Anda bisa cepat mendapatkan ini ...

Pilihan Editor

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Bagaimana Mendidik dengan Infografis Informasi Dokumentual - dummies

Infomasi editorial sama dengan artikel berita karena tujuan utamanya adalah untuk mengirimkan informasi. Di bawah payung grafis editorial, ada beberapa tipe yang berbeda, dengan keseimbangan bias dan objektivitas yang berbeda. Berikut adalah beberapa melihat: Badai salju menghantam kota Anda. Koran lokal menciptakan grafik yang menunjukkan hujan salju ...

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bagaimana Mengimpor Sketsa ke Ilustrator untuk Menciptakan Infografis - dummies

Bahkan di dunia kabel ini, seniman masih suka sketsa Kabar baik! Sketsa kasar Anda dapat dengan mudah digunakan dalam draf infografis Anda. Anda dapat memindai sketsa atau mengambil gambar sketsa Anda dengan telepon Anda dan mengirim e-mail ke komputer Anda sendiri. Mereka tidak perlu diwarnai, cukup jelas bagi Anda untuk ...

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Bagaimana cara memasukkan ilustrasi di Infografis Anda - jeleknya

Infografis yang baik (jelas) harus mencakup seni yang bagus. Ilustrasi mempromosikan alur cerita, menentukan elemen secara visual, dan mencerahkan halaman yang mungkin diisi dengan tipe abu-abu. Ilustrasi bisa berupa gambar fisik, semacam bagan atau grafik, atau bahkan garis waktu. Kehidupan sehari-hari Anda dipenuhi dengan contoh bagaimana ilustrasi ...

Pilihan Editor

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

GED Contoh Pertanyaan: Penalaran Melalui Bahasa Seni Membaca Informasi Teknis - dummies

Tentang Penalaran Melalui bagian Seni Bahasa GED, Anda mungkin diminta untuk menjawab pertanyaan tentang bagian teknis. Ini bisa termasuk petunjuk cara melengkapi, seperti berikut. Pertanyaan dalam artikel ini mengacu pada kutipan berikut dari Russell Hart's Photography For Dummies, 2nd Edition (Wiley). Apa Rahasia Untuk ...

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

GED Contoh Pertanyaan: Pertanyaan singkat tentang Ilmu Pengetahuan - dummies

Di beberapa titik selama bagian Ilmu Pengetahuan dari Tes GEE, Anda akan diminta untuk membuat jawaban singkat. Anda akan diberi sebuah bagian dan mengajukan pertanyaan yang perlu Anda tanggapi. Buat respons Anda jelas dan ringkas. Bagian Jawaban Jawaban Semua orang mengenal keju cheddar. Orang-orang meletakkan ...

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

GED Contoh Pertanyaan: Ilmu Sosial dan Media - dummies

Di bagian Ilmu Sosial GED, Anda mungkin diminta untuk menjawab pertanyaan tentang berbagai bentuk media, termasuk siaran berita. Lihatlah contoh berikut di bawah ini. Pertanyaan dalam artikel ini mengacu pada siaran berita berikut. Berita Lingkungan Dunia Selamat malam dan selamat datang di World Environmental News. Cerita kami ini ...