Daftar Isi:
Video: Belajar Fisika Dasar: Besar dan Arah Vektor (seri 015) 2024
Anda dapat dengan mudah membandingkan contoh dari data Anda dengan menggunakan perhitungan jika Anda menganggapnya sebagai vektor. Informasi berikut ini menjelaskan bagaimana mengukur kesamaan antara vektor untuk melakukan tugas seperti menghitung jarak antara vektor untuk tujuan pembelajaran.
Memahami kesamaan
Dalam bentuk vektor, Anda dapat melihat setiap variabel dalam contoh Anda sebagai serangkaian koordinat, dengan masing-masing menunjuk ke posisi dalam dimensi ruang yang berbeda. Jika sebuah vektor memiliki dua elemen, artinya hanya ada dua variabel, yang bekerja dengannya sama seperti mencentang posisi item di peta dengan menggunakan nomor pertama untuk posisi di sumbu Timur-Barat dan yang kedua di Utara- Sumbu selatan
Misalnya, angka di antara tanda kurung (1, 2) (3, 2), dan (3, 3) adalah contoh titik. Setiap contoh adalah daftar nilai yang diurutkan (disebut tuple) yang dapat dengan mudah ditemukan dan dicetak pada peta dengan menggunakan nilai pertama dari daftar untuk x (sumbu horizontal) dan yang kedua untuk y (sumbu vertikal). Hasilnya adalah scatterplot.
Jika kumpulan data Anda, dalam bentuk matriks, memiliki banyak fitur numerik (kolom), idealnya jumlah fitur tersebut mewakili dimensi ruang data, sedangkan baris (contohnya) mewakili masing-masing titik, yang secara matematis adalah vektor. Bila vektor Anda memiliki lebih dari dua elemen, visualisasi menjadi merepotkan karena mewakili dimensi di atas yang ketiga tidak mudah (setelah semua, kita hidup di dunia tiga dimensi).
Namun, Anda dapat berusaha untuk menyampaikan lebih banyak dimensi dengan beberapa cara, seperti dengan menggunakan ukuran, bentuk, atau warna untuk dimensi lainnya. Jelas, itu bukan tugas yang mudah, dan seringkali hasilnya jauh dari intuitif. Namun, Anda dapat memahami gagasan tentang di mana titik-titiknya berada di ruang data Anda dengan mencetak secara sistematis banyak grafik sambil mempertimbangkan dimensi dua per dua. Plot semacam itu disebut matriks scatterplots.
Jangan khawatir tentang multidimensionalitas. Anda memperpanjang aturan yang Anda pelajari dalam dua atau tiga dimensi ke banyak dimensi, jadi jika sebuah peraturan bekerja di ruang bidimensional, ini juga bekerja pada kelas ganda. Oleh karena itu semua contoh pertama mengacu pada contoh bidimensional.
Komputasi jarak belajar
Algoritma dapat dipelajari dengan menggunakan vektor angka yang menggunakan pengukuran jarak. Seringkali ruang yang tersirat oleh vektor Anda adalah metrik yang merupakan ruang yang jaraknya menghinggapi kondisi spesifik tertentu:
- Tidak ada jarak negatif yang ada, dan jarak Anda nol hanya jika titik awal dan titik akhir bertepatan (disebut nonnegativitas).
- Jaraknya sama dari satu titik ke titik lain dan sebaliknya (disebut simetri).
- Jarak antara titik awal dan titik akhir selalu lebih besar dari, atau lebih buruk sama dengan, jarak dari titik awal ke titik ketiga dan dari sana ke titik akhir (disebut segitiga ketidaksetaraan < - yang berarti tidak ada jalan pintas). Jarak yang mengukur ruang metrik adalah jarak Euclidean, jarak Manhattan, dan jarak Chebyshev. Ini semua jarak yang bisa diaplikasikan pada vektor numerik.
Jarak Euclidean
Yang paling umum adalah jarak Euclidean, juga digambarkan sebagai norma l2 dari dua vektor (baca pembahasan norma l1, l2, dan linfinity ini). Dalam bidang bidimensional, jarak Euclidean merefleksikan garis lurus yang menghubungkan dua titik, dan Anda menghitungnya sebagai akar kuadrat dari jumlah perbedaan kuadrat antara elemen dua vektor. Pada plot sebelumnya, jarak Euclidean antara titik (1, 2) dan (3, 3) dapat dihitung dalam R as sqrt ((1-3) ^ 2 + (2-3) ^ 2), yang menghasilkan jarak sekitar 2. 236.
jarak Manhattan
Ukuran lain yang berguna adalah jarak Manhattan (juga digambarkan sebagai norma l1 dari dua vektor). Anda menghitung jarak Manhattan dengan menjumlahkan nilai absolut dari perbedaan antara elemen vektor. Jika jarak Euclidean menandai rute terpendek, jarak Manhattan menandai rute terpanjang, menyerupai arah taksi yang bergerak di kota. (Jarak juga dikenal sebagai jarak taksir atau jarak blok kota).
Misalnya, jarak Manhattan antara titik (1, 2) dan (3, 3) adalah abs (1-3) dan abs (2-3), yang menghasilkan jarak di Chebyshev
Jarak Chebyshev atau metrik maksimum mengambil selisih maksimum antara elemen vektor. Ini adalah ukuran jarak yang bisa mewakili bagaimana seorang raja bergerak dalam permainan catur atau, dalam logistik gudang, operasi yang dibutuhkan oleh sebuah derek overhead untuk memindahkan peti dari satu tempat ke tempat lain.