Rumah Keuangan Pribadi Mengukur kesamaan antara Vektor untuk Pembelajaran Mesin - dummies

Mengukur kesamaan antara Vektor untuk Pembelajaran Mesin - dummies

Daftar Isi:

Video: Belajar Fisika Dasar: Besar dan Arah Vektor (seri 015) 2024

Video: Belajar Fisika Dasar: Besar dan Arah Vektor (seri 015) 2024
Anonim

Anda dapat dengan mudah membandingkan contoh dari data Anda dengan menggunakan perhitungan jika Anda menganggapnya sebagai vektor. Informasi berikut ini menjelaskan bagaimana mengukur kesamaan antara vektor untuk melakukan tugas seperti menghitung jarak antara vektor untuk tujuan pembelajaran.

Memahami kesamaan

Dalam bentuk vektor, Anda dapat melihat setiap variabel dalam contoh Anda sebagai serangkaian koordinat, dengan masing-masing menunjuk ke posisi dalam dimensi ruang yang berbeda. Jika sebuah vektor memiliki dua elemen, artinya hanya ada dua variabel, yang bekerja dengannya sama seperti mencentang posisi item di peta dengan menggunakan nomor pertama untuk posisi di sumbu Timur-Barat dan yang kedua di Utara- Sumbu selatan

Contoh nilai diplot sebagai titik pada bagan.

Misalnya, angka di antara tanda kurung (1, 2) (3, 2), dan (3, 3) adalah contoh titik. Setiap contoh adalah daftar nilai yang diurutkan (disebut tuple) yang dapat dengan mudah ditemukan dan dicetak pada peta dengan menggunakan nilai pertama dari daftar untuk x (sumbu horizontal) dan yang kedua untuk y (sumbu vertikal). Hasilnya adalah scatterplot.

Jika kumpulan data Anda, dalam bentuk matriks, memiliki banyak fitur numerik (kolom), idealnya jumlah fitur tersebut mewakili dimensi ruang data, sedangkan baris (contohnya) mewakili masing-masing titik, yang secara matematis adalah vektor. Bila vektor Anda memiliki lebih dari dua elemen, visualisasi menjadi merepotkan karena mewakili dimensi di atas yang ketiga tidak mudah (setelah semua, kita hidup di dunia tiga dimensi).

Namun, Anda dapat berusaha untuk menyampaikan lebih banyak dimensi dengan beberapa cara, seperti dengan menggunakan ukuran, bentuk, atau warna untuk dimensi lainnya. Jelas, itu bukan tugas yang mudah, dan seringkali hasilnya jauh dari intuitif. Namun, Anda dapat memahami gagasan tentang di mana titik-titiknya berada di ruang data Anda dengan mencetak secara sistematis banyak grafik sambil mempertimbangkan dimensi dua per dua. Plot semacam itu disebut matriks scatterplots.

Jangan khawatir tentang multidimensionalitas. Anda memperpanjang aturan yang Anda pelajari dalam dua atau tiga dimensi ke banyak dimensi, jadi jika sebuah peraturan bekerja di ruang bidimensional, ini juga bekerja pada kelas ganda. Oleh karena itu semua contoh pertama mengacu pada contoh bidimensional.

Komputasi jarak belajar

Algoritma dapat dipelajari dengan menggunakan vektor angka yang menggunakan pengukuran jarak. Seringkali ruang yang tersirat oleh vektor Anda adalah metrik yang merupakan ruang yang jaraknya menghinggapi kondisi spesifik tertentu:

  • Tidak ada jarak negatif yang ada, dan jarak Anda nol hanya jika titik awal dan titik akhir bertepatan (disebut nonnegativitas).
  • Jaraknya sama dari satu titik ke titik lain dan sebaliknya (disebut simetri).
  • Jarak antara titik awal dan titik akhir selalu lebih besar dari, atau lebih buruk sama dengan, jarak dari titik awal ke titik ketiga dan dari sana ke titik akhir (disebut segitiga ketidaksetaraan < - yang berarti tidak ada jalan pintas). Jarak yang mengukur ruang metrik adalah jarak Euclidean, jarak Manhattan, dan jarak Chebyshev. Ini semua jarak yang bisa diaplikasikan pada vektor numerik.

Jarak Euclidean

Yang paling umum adalah jarak Euclidean, juga digambarkan sebagai norma l2 dari dua vektor (baca pembahasan norma l1, l2, dan linfinity ini). Dalam bidang bidimensional, jarak Euclidean merefleksikan garis lurus yang menghubungkan dua titik, dan Anda menghitungnya sebagai akar kuadrat dari jumlah perbedaan kuadrat antara elemen dua vektor. Pada plot sebelumnya, jarak Euclidean antara titik (1, 2) dan (3, 3) dapat dihitung dalam R as sqrt ((1-3) ^ 2 + (2-3) ^ 2), yang menghasilkan jarak sekitar 2. 236.

jarak Manhattan

Ukuran lain yang berguna adalah jarak Manhattan (juga digambarkan sebagai norma l1 dari dua vektor). Anda menghitung jarak Manhattan dengan menjumlahkan nilai absolut dari perbedaan antara elemen vektor. Jika jarak Euclidean menandai rute terpendek, jarak Manhattan menandai rute terpanjang, menyerupai arah taksi yang bergerak di kota. (Jarak juga dikenal sebagai jarak taksir atau jarak blok kota).

Misalnya, jarak Manhattan antara titik (1, 2) dan (3, 3) adalah abs (1-3) dan abs (2-3), yang menghasilkan jarak di Chebyshev

Jarak Chebyshev atau metrik maksimum mengambil selisih maksimum antara elemen vektor. Ini adalah ukuran jarak yang bisa mewakili bagaimana seorang raja bergerak dalam permainan catur atau, dalam logistik gudang, operasi yang dibutuhkan oleh sebuah derek overhead untuk memindahkan peti dari satu tempat ke tempat lain.

Dalam pembelajaran mesin, jarak Chebyshev dapat berguna bila Anda memiliki banyak dimensi untuk dipertimbangkan dan kebanyakan hanya tidak relevan atau berlebihan (di Chebyshev, Anda hanya memilih orang yang perbedaan absolutnya adalah yang terbesar). Pada contoh yang digunakan di atas, jaraknya hanya 2, max antara (1-3) dan abs (2-3).

Mengukur kesamaan antara Vektor untuk Pembelajaran Mesin - dummies

Pilihan Editor

Bagaimana Menutup presentasi PowerPoint 2007 Presentation - dummies

Bagaimana Menutup presentasi PowerPoint 2007 Presentation - dummies

Menutup presentasi PowerPoint seperti memasukkannya ke dalam folder, dan menyimpan folder di laci yang tepat. Ada tiga cara yang berbeda untuk menutup presentasi PowerPoint:

Bagaimana Bandingkan Fitur PowerPoint 2013 Presentation - dummies

Bagaimana Bandingkan Fitur PowerPoint 2013 Presentation - dummies

Bandingkan fitur di PowerPoint 2013 memungkinkan Anda membandingkan perbedaan antara dua versi dari sebuah presentasi dan menerima atau menolak perbedaan. Fitur ini berguna jika Anda telah mengirimkan salinan presentasi ke reviewer dan Anda ingin secara selektif menggabungkan perubahan resensi. Menggunakan fitur Compare sangatlah mudah. Berikut adalah ...

Bagaimana Mengompres Gambar Anda di PowerPoint 2013 - dummies

Bagaimana Mengompres Gambar Anda di PowerPoint 2013 - dummies

PowerPoint 2013 mencakup perintah Compress Pictures yang dapat menghilangkan detail asing di gambar Anda dan dengan demikian mengurangi ukuran file presentasi Anda. Untuk menghemat lebih banyak ruang, perintah Compress Pictures juga akan menghapus bagian gambar Anda yang telah dipotong. Anda bisa menggunakan perintah ini untuk memampatkan hanya satu ...

Pilihan Editor

Cara Menggunakan NaturallySpeaking dengan Kotak Dialog Umum - dummies

Cara Menggunakan NaturallySpeaking dengan Kotak Dialog Umum - dummies

Secara alamiSpeaking dapat membantu Anda mengendalikan kotak dialog. Ini adalah & ldquo; Lihat Ma, tidak ada tangan & rdquo; contoh. Semuanya dilakukan dengan perintah suara. Tentu, terkadang Anda bisa menyelesaikan tugas lebih cepat dengan mematuk kunci atau menggerakkan mouse Anda. Seiring waktu, Anda akan menyelesaikan kompromi Anda sendiri antara perintah suara dan perintah mouse dan keyboard. Untuk pencarian berikut, NaturallySpeaking ...

Bagaimana Menggunakan "Klik" Command di NaturallySpeaking - dummies

Bagaimana Menggunakan "Klik" Command di NaturallySpeaking - dummies

Para insinyur di Nuance dapat ' t mengantisipasi setiap perintah yang mungkin digunakan oleh aplikasi nyasar, jadi mereka telah melakukan hal terbaik berikutnya: Mereka membuat perintah "Klik" untuk mengubah menu aplikasi menjadi perintah suara. Begini cara menggunakannya: Katakan, "Klik " untuk memperluas menu. Setiap judul yang muncul pada aplikasi ...

Bagaimana Menggunakan Mikrofon Profesional Naga Secara Pribadi:" Apakah Hal Ini Aktif? " - dummies

Bagaimana Menggunakan Mikrofon Profesional Naga Secara Pribadi:" Apakah Hal Ini Aktif? " - dummies

Dapat menjadi lucu saat Anda menyadari bahwa mikrofon Profesional Dragon Professional Anda telah berada di sepanjang waktu Anda menerima telepon terakhir Anda. Kata-kata yang Anda didiktekan tidak akan terlihat seperti apa yang Anda katakan. Ada jeda; Anda membuang muka dan mungkin mikrofon ditekan di bawah dagu Anda. Segera hapus ...

Pilihan Editor

10 Hal yang sering terjadi pada PowerPoint 2016 - dummies

10 Hal yang sering terjadi pada PowerPoint 2016 - dummies

Jumlah sebenarnya dari hal-hal yang dapat terjadi Salah saat bekerja dengan PowerPoint 2016 mungkin mendekati 10.000, tapi sepuluh di antaranya adalah yang paling sering salah. Anda tidak dapat menemukan file Anda Entah Anda menyimpan file dalam folder yang berbeda, atau Anda menggunakan nama file yang berbeda untuk menyimpannya ...

Menerapkan Style to a Table pada PowerPoint 2007 - dummies

Menerapkan Style to a Table pada PowerPoint 2007 - dummies

Setelah Anda membuat sebuah tabel di slide PowerPoint, gunakan kontrol di bawah Table Tools pada PowerPoint Ribbon untuk memformatnya. PowerPoint menawarkan beberapa gaya tabel yang telah ditentukan. Sebelum Anda menerapkan sebuah gaya, gunakan kotak centang yang muncul di sisi kiri tab Desain di bawah Table Tools on the Ribbon. Header ...

5 Trik bagus untuk PowerPoint 2016 - dummies

5 Trik bagus untuk PowerPoint 2016 - dummies

Ada banyak hal yang menyukai PowerPoint 2016, terutama jika Anda tahu caranya untuk menggunakan semua lonceng dan peluit. Berikut adalah beberapa tip dan trik yang perlu diingat: Skala ukuran slide ke dimensi monitor Ada dua rasio aspek dasar untuk layar komputer: standar (4: 3) dan lebar (16: 9). Angka-angka ini ...