Rumah Keuangan Pribadi Batas Data Peringkat dalam Mesin Belajar - dummies

Batas Data Peringkat dalam Mesin Belajar - dummies

Video: Cara kerja Vbdata 2024

Video: Cara kerja Vbdata 2024
Anonim

Data penilaian memiliki keterbatasan dalam pembelajaran mesin. Agar sistem recommender bekerja dengan baik, mereka perlu mengetahui tentang Anda dan juga orang lain, keduanya menyukai Anda dan berbeda dari Anda Memperoleh data rating memungkinkan sistem recommender untuk belajar dari pengalaman beberapa pelanggan. Data penilaian dapat diturunkan dari penilaian (seperti menilai produk menggunakan bintang atau angka) atau fakta (biner 1/0 yang sederhana menyatakan bahwa Anda membeli produk, melihat film, atau berhenti browsing di halaman web tertentu).

Tidak peduli sumber data atau jenisnya, data pemeringkatan selalu tentang perilaku. Untuk menilai film, Anda harus memutuskan untuk melihatnya, menontonnya, dan kemudian menilai berdasarkan pengalaman menonton film. Sistem rekomendasi yang sebenarnya belajar dari data penilaian dengan berbagai cara:

  • Penyaringan kolaboratif: Cocok Penilai berdasarkan kemiripan film atau produk yang digunakan di masa lalu. Anda bisa mendapatkan rekomendasi berdasarkan item disukai oleh orang-orang yang mirip dengan Anda atau barang serupa dengan yang Anda sukai.
  • Penyaringan berbasis konten: Melampaui kenyataan bahwa Anda menonton film. Ini memeriksa fitur yang relatif terhadap Anda dan film untuk menentukan apakah ada kecocokan berdasarkan kategori yang lebih besar yang mewakili fitur. Misalnya, jika Anda adalah wanita yang menyukai film laga, recommender akan mencari saran yang mencakup persimpangan dua kategori ini.
  • Rekomendasi berbasis pengetahuan: Berdasarkan metadata, seperti preferensi yang diungkapkan oleh pengguna dan deskripsi produk. Ini bergantung pada pembelajaran mesin dan efektif bila Anda tidak memiliki cukup data perilaku untuk menentukan karakteristik pengguna atau produk. Ini disebut cold start dan merupakan salah satu tugas recommender yang paling sulit karena Anda tidak memiliki akses ke pemfilteran kolaboratif atau penyaringan berbasis konten.

Bila menggunakan penyaringan kolaboratif, Anda perlu menghitung kesamaan. Terlepas dari jarak Euclidean, Manhattan, dan Chebyshev, sisa informasi ini membahas kesamaan kosinus. Kesamaan kosinus mengukur jarak kosinus sudut antara dua vektor, yang mungkin tampak seperti konsep yang sulit dipahami namun hanyalah cara untuk mengukur sudut pada ruang data.

Bayangkan sebuah ruang yang terbuat dari fitur dan memiliki dua titik. Anda bisa mengukur jarak antar titik. Misalnya, Anda bisa menggunakan jarak Euclidean, yang merupakan pilihan tepat saat Anda memiliki beberapa dimensi, namun gagal total bila Anda memiliki banyak dimensi karena kutukan dimensi.

Gagasan di balik jarak kosinus adalah dengan menggunakan sudut yang diciptakan oleh dua titik yang terhubung ke asal ruang (titik di mana semua dimensi adalah nol). Jika titik-titik di dekat, sudutnya sempit, tidak peduli berapa banyak dimensi yang ada. Jika jaraknya jauh, sudutnya cukup besar. Kesamaan kosinus menerapkan jarak kosinus sebagai persentase dan cukup efektif untuk mengetahui apakah pengguna mirip dengan yang lain atau apakah sebuah film dapat dikaitkan ke yang lain karena pengguna yang sama mendukungnya. Contoh berikut menempatkan film yang merupakan film yang paling mirip dengan film 50, Star Wars. print (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- kesamaan (MovieLense [50],

MovieLense [-50],

yang = "item")

colnames (similar_movies) [yang (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "Kekaisaran Kembali, The (1980)"

[3] "Raiders of the Lost Ark (1981)"

"Kembalinya Jedi (1983)"

Batas Data Peringkat dalam Mesin Belajar - dummies

Pilihan Editor

Bagaimana membuat halaman depan situs Anda - dummies

Bagaimana membuat halaman depan situs Anda - dummies

Untuk sebagian besar, ketika Anda kunjungi blog yang didukung oleh WordPress, blog ada di halaman utama. Blog pribadi ini, didukung oleh WordPress (tentu saja), menampilkan posting blog terbaru di halaman depan. Pengaturan ini khas dari situs yang dijalankan oleh WordPress. Tapi halaman depan situs bisnis ini, webdevstudios. com, ...

Bagaimana Menemukan Pengencer untuk Konten WordPress Anda - dummies

Bagaimana Menemukan Pengencer untuk Konten WordPress Anda - dummies

Influencer dapat menjadi cara yang berguna untuk promosikan konten WordPress anda Setelah Anda menyusun daftar situs yang ingin Anda targetkan, Anda dapat mulai memecah daftar dan menentukan siapa influencer di niche Anda, termasuk influencer yang tersembunyi. Penyerang tersembunyi adalah orang-orang yang memiliki jejak sosial yang besar yang tidak harus ...

Cara Mengaktifkan WordPress. com Theme - dummies

Cara Mengaktifkan WordPress. com Theme - dummies

Pilih tema untuk WordPress Anda. com blog, lalu aktifkan. WordPress. Tema com (juga disebut design atau template) yang Anda pilih mempengaruhi tata letak visual dan tampilan blog Anda.

Pilihan Editor

Bagaimana Membuat Penunjukan dengan Outlook. com - dummies

Bagaimana Membuat Penunjukan dengan Outlook. com - dummies

Perlu membuat janji temu di Outlook. com? Jika Anda adalah pejuang jalan berat, Anda mungkin menyimpan kalender Anda di smartphone untuk referensi Anda sendiri, tapi untuk orang lain, janji dan rapat tersebut sangat mungkin terjadi pada Kalender Outlook. Janji dan rapat yang Anda poskan di Outlook terkait dengan Outlook. com, jadi dari apapun ...

Pilihan Editor

Desain Media Sosial: Cara Menggunakan Alat Wandel Magic Photoshop - dummies

Desain Media Sosial: Cara Menggunakan Alat Wandel Magic Photoshop - dummies

The Magic Wand Alat bisa menjadi alat yang baik untuk memanipulasi foto agar bisa digunakan di situs media sosial Anda. Alat Magic Wand di Photoshop telah menjadi subyek banyak cemoohan dari para profesional pengedit foto, yang menganggapnya sebagai jenis hal yang disalahgunakan oleh orang-orang baru yang menghasilkan pilihan bergerigi bergerigi yang membuat ...

Desain Media Sosial: Opsi Gambar Twitter - dummies

Desain Media Sosial: Opsi Gambar Twitter - dummies

Tantangan terbesar dengan desain Twitter adalah mencari tahu bagaimana caranya. menyulap batasan ruang dan cara terbaik untuk memposisikan tiga gambar terpisah yang diizinkan Anda gunakan di profil Twitter Anda.

Social Media Optimization: Menampilkan Tweet secara Otomatis ke Profil Facebook Anda - dummies

Social Media Optimization: Menampilkan Tweet secara Otomatis ke Profil Facebook Anda - dummies

Datang dengan Hal baru untuk dikirim ke Facebook bisa menjadi tugas yang cukup. Untungnya, ada trik Anda bisa mengoptimalkan situs media sosial ini. Jika Anda dapat memanfaatkan cross-posting konten antar layanan, Anda dapat menghemat waktu. Twitter memberi Anda kemampuan untuk menghubungkan profil Anda dengan layanan lainnya. Ada, ...