Rumah Keuangan Pribadi Mengenal Batas Bias dalam Pembelajaran Mesin - dummies

Mengenal Batas Bias dalam Pembelajaran Mesin - dummies

Video: Seminar Penafsiran Alkitab oleh Dr. Bob Utley, Pelajaran 1 2024

Video: Seminar Penafsiran Alkitab oleh Dr. Bob Utley, Pelajaran 1 2024
Anonim

Pembelajaran dengan mesin sangat bergantung pada data sampel. Bagian data Anda penting karena Anda ingin menemukan sudut pandang dunia, dan seperti halnya semua sudut pandang, ini bisa salah, terdistorsi, atau hanya sebagian. Anda juga tahu bahwa Anda memerlukan contoh out-of-sample untuk memeriksa apakah proses belajar bekerja. Namun, aspek ini hanya merupakan bagian dari gambar.

Bila Anda membuat algoritma pembelajaran mesin bekerja pada data untuk menebak respons tertentu, Anda secara efektif berjudi, dan pertaruhan itu bukan hanya karena sampel yang Anda gunakan untuk belajar. Masih ada lagi. Untuk saat ini, bayangkan Anda bebas memiliki akses terhadap data sampel yang sesuai, tidak bias, sehingga data tidak menjadi masalah. Sebagai gantinya Anda perlu berkonsentrasi pada metode belajar dan memprediksi.

Pertama, Anda harus mempertimbangkan bahwa Anda bertaruh bahwa algoritma tersebut dapat menebak jawabannya dengan baik. Anda tidak bisa selalu membuat asumsi ini karena mencari jawaban pasti tidak mungkin tidak peduli apa yang Anda ketahui sebelumnya.

Misalnya, Anda tidak dapat sepenuhnya menentukan perilaku manusia dengan mengetahui sejarah dan perilaku mereka sebelumnya. Mungkin efek acak terlibat dalam proses generatif perilaku kita (bagian irasional dari kita, misalnya), atau mungkin masalahnya bermuara pada kehendak bebas (masalahnya juga filosofis / religius, dan ada banyak pendapat sumbang). Akibatnya, Anda bisa menebak hanya beberapa jenis respons, dan bagi banyak orang lainnya, seperti saat Anda mencoba memprediksi perilaku orang lain, Anda harus menerima tingkat ketidakpastian tertentu yang, dengan keberuntungan, dapat diterima untuk tujuan Anda.

Kedua, Anda harus mempertimbangkan bahwa Anda bertaruh bahwa hubungan antara informasi yang Anda miliki dan respons yang ingin Anda prediksi dapat dinyatakan sebagai rumus matematis, dan bahwa pembelajaran mesin Anda Algoritma sebenarnya mampu menebak rumus itu. Kapasitas algoritma Anda untuk menebak rumus matematika di balik respons secara intrinsik tertanam dalam mur dan baut algoritma.

Beberapa algoritma bisa menebak hampir semuanya; yang lain benar-benar memiliki seperangkat pilihan terbatas. Rentang formulasi matematis yang mungkin bisa ditebak oleh algoritme adalah kemungkinan hipotesisnya. Akibatnya, hipotesis adalah algoritma tunggal, ditentukan dalam semua parameternya dan karena itu mampu menghasilkan formulasi spesifik tunggal.

Matematika itu fantastis. Ini bisa menggambarkan sebagian besar dunia nyata dengan menggunakan beberapa notasi sederhana, dan inilah inti pembelajaran mesin karena setiap algoritma pembelajaran memiliki kemampuan tertentu untuk merepresentasikan formulasi matematis.Beberapa algoritma, seperti regresi linier, secara eksplisit menggunakan formulasi matematis yang spesifik untuk mewakili bagaimana respons (misalnya, harga rumah) berhubungan dengan seperangkat informasi prediktif (seperti informasi pasar, lokasi rumah, permukaan perkebunan, dan seterusnya).

Beberapa formulasi begitu kompleks dan rumit sehingga meski melukiskannya di atas kertas adalah mungkin, hal itu terlalu sulit dilakukan secara praktis. Beberapa algoritma canggih lainnya, seperti pohon keputusan, tidak memiliki formulasi matematis yang eksplisit, namun sangat mudah beradaptasi sehingga dapat diatur untuk mendekati berbagai macam formulasi dengan mudah. Sebagai contoh, pertimbangkan formulasi sederhana dan mudah dijelaskan. Regresi linier hanyalah garis pada ruang koordinat yang diberikan oleh respon dan semua prediktor. Dalam contoh termudah, Anda dapat memiliki respons, y, dan satu prediktor tunggal, x, dengan formulasi

y = β 1 x 1 + β 0

Dalam situasi sederhana dari sebuah respons yang diprediksi oleh satu fitur, model seperti itu sempurna saat data Anda mengatur dirinya sebagai sebuah garis. Namun, apa yang terjadi jika tidak dan malah membentuk dirinya seperti kurva? Untuk mewakili situasinya, cukup amati representasi bidimensional berikut ini.

Contoh model linier yang berjuang untuk memetakan fungsi kurva.

Bila titik menyerupai garis atau awan, beberapa kesalahan terjadi saat Anda mengetahui bahwa hasilnya adalah garis lurus; Oleh karena itu pemetaan yang diberikan oleh formulasi sebelumnya entah bagaimana tidak tepat. Namun, kesalahan itu tidak muncul secara sistematis tapi agak acak karena beberapa poin berada di atas garis yang dipetakan dan yang lainnya ada di bawahnya. Situasi dengan melengkung, berbentuk awan poin berbeda, karena kali ini, garis kadang tepat tapi pada saat lain secara sistematik salah. Terkadang poin selalu di atas garis; Terkadang mereka berada di bawahnya.

Mengingat kesederhanaan pemetaan responsnya, algoritme Anda cenderung secara sistematis melebih-lebihkan atau meremehkan peraturan sebenarnya di balik data, yang mewakili biasnya. Biasnya adalah karakteristik dari algoritma sederhana yang tidak dapat mengekspresikan formulasi matematika yang kompleks.

Mengenal Batas Bias dalam Pembelajaran Mesin - dummies

Pilihan Editor

Membuat Kartu Ucapan di Microsoft Word 2003 - dummies

Membuat Kartu Ucapan di Microsoft Word 2003 - dummies

Jika Anda ingin membuat sesuatu di Word yang hanya akan menyilaukan seseorang, coba tangan Anda dengan kartu ucapan yang disesuaikan. Untuk mengatur Word agar membuat kartu ucapan dari satu lembar kertas ukuran standar, ikuti langkah-langkah ini: 1. Pilih File -> Page Setup. 2. Klik tab Margins. 3. Pilih Landscape ...

Membuat Index of Word 2007 Document - dummies

Membuat Index of Word 2007 Document - dummies

Jika Anda ingin membuat indeks untuk Word Anda Dokumen 2007, tugas pertama adalah menandai kata atau frasa yang ingin Anda sertakan dalam indeks. Cara yang paling umum untuk melakukannya adalah dengan memasukkan penanda indeks dalam dokumen pada setiap kemunculan setiap item yang ingin Anda tampilkan ...

Editing di Word 2007: Melacak Perubahan dan Review - dummies

Editing di Word 2007: Melacak Perubahan dan Review - dummies

Menulis adalah seni yang sepi ... yaitu , sampai editor muncul. Mereka akan membuat revisi dengan menambahkan karya tulis Anda dengan hati-hati, memindahkan barang-barang, dan menghapus teks (Aduh!). Tidak ada cara untuk mengidentifikasi teks asli Anda dari teks yang dimodifikasi - kecuali jika Anda menggunakan alat Pelacakan Lagu Word 2007. Pelacakan perubahan sebagai ...

Pilihan Editor

Bagaimana Menonaktifkan dan Mengaktifkan Halaman di Squarespace - dummies

Bagaimana Menonaktifkan dan Mengaktifkan Halaman di Squarespace - dummies

Saat Anda melakukan pemeliharaan situs, kemungkinan besar Anda ingin menonaktifkan halaman situs Anda yang sedang dibangun. Squarespace memungkinkan Anda untuk dengan mudah menonaktifkan dan mengaktifkan kembali halaman. Bagaimana cara menonaktifkan halaman di Squarespace Jika Anda ingin menonaktifkan halaman di situs Anda, Anda dapat melakukannya di ...

Bagaimana Menentukan Navigasi Situs Anda di Squarespace - dummies

Bagaimana Menentukan Navigasi Situs Anda di Squarespace - dummies

Template yang Anda pilih di Squarespace mendikte berbagai area navigasi yang Anda miliki di situs Anda. Template Anda mungkin menyediakan area navigasi berikut di Pengelola Konten: Atas / Utama: Semua template memiliki navigasi teratas atau utama. Sekunder: Halaman yang ditambahkan ke area navigasi ini bukan fokus utama situs Anda. Footer: Beberapa template memiliki ...

Bagaimana Menemukan Editor Gaya Squarespace - dummies

Bagaimana Menemukan Editor Gaya Squarespace - dummies

Anda menggunakan Editor Gaya di Squarespace kapan saja Anda perlu memodifikasi desain situs Anda atau elemen tertentu di situs Anda. Style Editor adalah bagian dari mode Style, yang Anda akses di area Preview. Ikuti langkah-langkah ini untuk memuat Editor Gaya di browser Anda: Masuk ke situs web Anda. Anda ...

Pilihan Editor

Bagaimana Memodifikasi Master Slide di PowerPoint 2016 - dummies

Bagaimana Memodifikasi Master Slide di PowerPoint 2016 - dummies

Jika Anda tidak menyukai tata letak dari slide Anda dalam presentasi PowerPoint 2016, hubungi Master Slide dan lakukan sesuatu tentang hal itu, seperti yang ditunjukkan pada langkah-langkah ini: Buka Slide Master View dengan membuka tab View pada Ribbon dan kemudian klik tombol Slide Master, yang terdapat dalam Presentasi Grup tampilan Sebagai alternatif, ...

Bagaimana Memodifikasi Grafis SmartArt di PowerPoint - dummies

Bagaimana Memodifikasi Grafis SmartArt di PowerPoint - dummies

Setelah membuat grafik SmartArt dalam presentasi PowerPoint Anda, Anda mungkin ingin mengubahnya. Modifikasi dapat mencakup perubahan jenis atau tata letak grafis, menambah atau menghapus bentuk, dan mengubah urutan bentuk bentuk. Pada slide 1, klik bingkai grafis SmartArt untuk memilih keseluruhan grafik. Klik SmartArt Tools ...