Rumah Keuangan Pribadi Mengukur kesamaan antara Vektor untuk Pembelajaran Mesin - dummies

Mengukur kesamaan antara Vektor untuk Pembelajaran Mesin - dummies

Daftar Isi:

Video: Belajar Fisika Dasar: Besar dan Arah Vektor (seri 015) 2024

Video: Belajar Fisika Dasar: Besar dan Arah Vektor (seri 015) 2024
Anonim

Anda dapat dengan mudah membandingkan contoh dari data Anda dengan menggunakan perhitungan jika Anda menganggapnya sebagai vektor. Informasi berikut ini menjelaskan bagaimana mengukur kesamaan antara vektor untuk melakukan tugas seperti menghitung jarak antara vektor untuk tujuan pembelajaran.

Memahami kesamaan

Dalam bentuk vektor, Anda dapat melihat setiap variabel dalam contoh Anda sebagai serangkaian koordinat, dengan masing-masing menunjuk ke posisi dalam dimensi ruang yang berbeda. Jika sebuah vektor memiliki dua elemen, artinya hanya ada dua variabel, yang bekerja dengannya sama seperti mencentang posisi item di peta dengan menggunakan nomor pertama untuk posisi di sumbu Timur-Barat dan yang kedua di Utara- Sumbu selatan

Contoh nilai diplot sebagai titik pada bagan.

Misalnya, angka di antara tanda kurung (1, 2) (3, 2), dan (3, 3) adalah contoh titik. Setiap contoh adalah daftar nilai yang diurutkan (disebut tuple) yang dapat dengan mudah ditemukan dan dicetak pada peta dengan menggunakan nilai pertama dari daftar untuk x (sumbu horizontal) dan yang kedua untuk y (sumbu vertikal). Hasilnya adalah scatterplot.

Jika kumpulan data Anda, dalam bentuk matriks, memiliki banyak fitur numerik (kolom), idealnya jumlah fitur tersebut mewakili dimensi ruang data, sedangkan baris (contohnya) mewakili masing-masing titik, yang secara matematis adalah vektor. Bila vektor Anda memiliki lebih dari dua elemen, visualisasi menjadi merepotkan karena mewakili dimensi di atas yang ketiga tidak mudah (setelah semua, kita hidup di dunia tiga dimensi).

Namun, Anda dapat berusaha untuk menyampaikan lebih banyak dimensi dengan beberapa cara, seperti dengan menggunakan ukuran, bentuk, atau warna untuk dimensi lainnya. Jelas, itu bukan tugas yang mudah, dan seringkali hasilnya jauh dari intuitif. Namun, Anda dapat memahami gagasan tentang di mana titik-titiknya berada di ruang data Anda dengan mencetak secara sistematis banyak grafik sambil mempertimbangkan dimensi dua per dua. Plot semacam itu disebut matriks scatterplots.

Jangan khawatir tentang multidimensionalitas. Anda memperpanjang aturan yang Anda pelajari dalam dua atau tiga dimensi ke banyak dimensi, jadi jika sebuah peraturan bekerja di ruang bidimensional, ini juga bekerja pada kelas ganda. Oleh karena itu semua contoh pertama mengacu pada contoh bidimensional.

Komputasi jarak belajar

Algoritma dapat dipelajari dengan menggunakan vektor angka yang menggunakan pengukuran jarak. Seringkali ruang yang tersirat oleh vektor Anda adalah metrik yang merupakan ruang yang jaraknya menghinggapi kondisi spesifik tertentu:

  • Tidak ada jarak negatif yang ada, dan jarak Anda nol hanya jika titik awal dan titik akhir bertepatan (disebut nonnegativitas).
  • Jaraknya sama dari satu titik ke titik lain dan sebaliknya (disebut simetri).
  • Jarak antara titik awal dan titik akhir selalu lebih besar dari, atau lebih buruk sama dengan, jarak dari titik awal ke titik ketiga dan dari sana ke titik akhir (disebut segitiga ketidaksetaraan < - yang berarti tidak ada jalan pintas). Jarak yang mengukur ruang metrik adalah jarak Euclidean, jarak Manhattan, dan jarak Chebyshev. Ini semua jarak yang bisa diaplikasikan pada vektor numerik.

Jarak Euclidean

Yang paling umum adalah jarak Euclidean, juga digambarkan sebagai norma l2 dari dua vektor (baca pembahasan norma l1, l2, dan linfinity ini). Dalam bidang bidimensional, jarak Euclidean merefleksikan garis lurus yang menghubungkan dua titik, dan Anda menghitungnya sebagai akar kuadrat dari jumlah perbedaan kuadrat antara elemen dua vektor. Pada plot sebelumnya, jarak Euclidean antara titik (1, 2) dan (3, 3) dapat dihitung dalam R as sqrt ((1-3) ^ 2 + (2-3) ^ 2), yang menghasilkan jarak sekitar 2. 236.

jarak Manhattan

Ukuran lain yang berguna adalah jarak Manhattan (juga digambarkan sebagai norma l1 dari dua vektor). Anda menghitung jarak Manhattan dengan menjumlahkan nilai absolut dari perbedaan antara elemen vektor. Jika jarak Euclidean menandai rute terpendek, jarak Manhattan menandai rute terpanjang, menyerupai arah taksi yang bergerak di kota. (Jarak juga dikenal sebagai jarak taksir atau jarak blok kota).

Misalnya, jarak Manhattan antara titik (1, 2) dan (3, 3) adalah abs (1-3) dan abs (2-3), yang menghasilkan jarak di Chebyshev

Jarak Chebyshev atau metrik maksimum mengambil selisih maksimum antara elemen vektor. Ini adalah ukuran jarak yang bisa mewakili bagaimana seorang raja bergerak dalam permainan catur atau, dalam logistik gudang, operasi yang dibutuhkan oleh sebuah derek overhead untuk memindahkan peti dari satu tempat ke tempat lain.

Dalam pembelajaran mesin, jarak Chebyshev dapat berguna bila Anda memiliki banyak dimensi untuk dipertimbangkan dan kebanyakan hanya tidak relevan atau berlebihan (di Chebyshev, Anda hanya memilih orang yang perbedaan absolutnya adalah yang terbesar). Pada contoh yang digunakan di atas, jaraknya hanya 2, max antara (1-3) dan abs (2-3).

Mengukur kesamaan antara Vektor untuk Pembelajaran Mesin - dummies

Pilihan Editor

Bagaimana membuat halaman depan situs Anda - dummies

Bagaimana membuat halaman depan situs Anda - dummies

Untuk sebagian besar, ketika Anda kunjungi blog yang didukung oleh WordPress, blog ada di halaman utama. Blog pribadi ini, didukung oleh WordPress (tentu saja), menampilkan posting blog terbaru di halaman depan. Pengaturan ini khas dari situs yang dijalankan oleh WordPress. Tapi halaman depan situs bisnis ini, webdevstudios. com, ...

Bagaimana Menemukan Pengencer untuk Konten WordPress Anda - dummies

Bagaimana Menemukan Pengencer untuk Konten WordPress Anda - dummies

Influencer dapat menjadi cara yang berguna untuk promosikan konten WordPress anda Setelah Anda menyusun daftar situs yang ingin Anda targetkan, Anda dapat mulai memecah daftar dan menentukan siapa influencer di niche Anda, termasuk influencer yang tersembunyi. Penyerang tersembunyi adalah orang-orang yang memiliki jejak sosial yang besar yang tidak harus ...

Cara Mengaktifkan WordPress. com Theme - dummies

Cara Mengaktifkan WordPress. com Theme - dummies

Pilih tema untuk WordPress Anda. com blog, lalu aktifkan. WordPress. Tema com (juga disebut design atau template) yang Anda pilih mempengaruhi tata letak visual dan tampilan blog Anda.

Pilihan Editor

Bagaimana Membuat Penunjukan dengan Outlook. com - dummies

Bagaimana Membuat Penunjukan dengan Outlook. com - dummies

Perlu membuat janji temu di Outlook. com? Jika Anda adalah pejuang jalan berat, Anda mungkin menyimpan kalender Anda di smartphone untuk referensi Anda sendiri, tapi untuk orang lain, janji dan rapat tersebut sangat mungkin terjadi pada Kalender Outlook. Janji dan rapat yang Anda poskan di Outlook terkait dengan Outlook. com, jadi dari apapun ...

Pilihan Editor

Desain Media Sosial: Cara Menggunakan Alat Wandel Magic Photoshop - dummies

Desain Media Sosial: Cara Menggunakan Alat Wandel Magic Photoshop - dummies

The Magic Wand Alat bisa menjadi alat yang baik untuk memanipulasi foto agar bisa digunakan di situs media sosial Anda. Alat Magic Wand di Photoshop telah menjadi subyek banyak cemoohan dari para profesional pengedit foto, yang menganggapnya sebagai jenis hal yang disalahgunakan oleh orang-orang baru yang menghasilkan pilihan bergerigi bergerigi yang membuat ...

Desain Media Sosial: Opsi Gambar Twitter - dummies

Desain Media Sosial: Opsi Gambar Twitter - dummies

Tantangan terbesar dengan desain Twitter adalah mencari tahu bagaimana caranya. menyulap batasan ruang dan cara terbaik untuk memposisikan tiga gambar terpisah yang diizinkan Anda gunakan di profil Twitter Anda.

Social Media Optimization: Menampilkan Tweet secara Otomatis ke Profil Facebook Anda - dummies

Social Media Optimization: Menampilkan Tweet secara Otomatis ke Profil Facebook Anda - dummies

Datang dengan Hal baru untuk dikirim ke Facebook bisa menjadi tugas yang cukup. Untungnya, ada trik Anda bisa mengoptimalkan situs media sosial ini. Jika Anda dapat memanfaatkan cross-posting konten antar layanan, Anda dapat menghemat waktu. Twitter memberi Anda kemampuan untuk menghubungkan profil Anda dengan layanan lainnya. Ada, ...