Video: 3000+ Portuguese Words with Pronunciation 2024
Tujuan algoritma clustering dan klasifikasi adalah untuk memahami dan mengekstrak nilai dari kumpulan data terstruktur dan tidak terstruktur. Jika Anda bekerja dengan volume data tidak terstruktur yang besar, hanya masuk akal untuk mencoba memecah data menjadi semacam pengelompokan logis sebelum mencoba menganalisisnya. Clustering dan klasifikasi memungkinkan Anda untuk melihat sekilas data Anda secara massal, dan kemudian membentuk beberapa struktur logis berdasarkan pada apa yang Anda temukan di sana sebelum mempelajari lebih dalam analisis mur dan baut.
cluster
adalah kumpulan titik data yang memiliki atribut serupa, dan algoritma pengelompokan adalah metode yang mengelompokkan titik data ini menjadi berbeda. kelompok berdasarkan kesamaan mereka. Anda akan melihat algoritma pengelompokan yang digunakan untuk klasifikasi penyakit dalam ilmu kedokteran, namun Anda juga akan melihatnya digunakan untuk klasifikasi pelanggan dalam riset pemasaran dan penilaian risiko kesehatan lingkungan dalam rekayasa lingkungan.
-
Anda mungkin pernah mendengar tentang klasifikasi dan berpikir bahwa klasifikasi itu sama dengan pengelompokan. Banyak orang melakukannya, tapi bukan itu masalahnya. Dalam klasifikasi, sebelum Anda memulai, Anda sudah mengetahui jumlah kelas tempat data Anda harus dikelompokkan dan Anda sudah tahu kelas yang Anda inginkan agar setiap titik data ditugaskan. Dalam klasifikasi, data dalam dataset yang dipelajari diberi label. Bila Anda menggunakan algoritma pengelompokan, di sisi lain, Anda tidak memiliki konsep yang telah ditetapkan untuk berapa banyak cluster yang sesuai untuk data Anda, dan Anda bergantung pada algoritma pengelompokan untuk mengurutkan dan mengelompokkan data dengan cara yang paling tepat. Dengan teknik pengelompokan, Anda belajar dari data yang tidak berlabel.
-
Untuk lebih menggambarkan sifat klasifikasi, lihatlah Twitter dan sistem pemberian tag hashnya.Katakanlah Anda baru saja memegang minuman favorit Anda di seluruh dunia: latte karamel es dari Starbucks. Anda sangat senang minum minuman Anda sehingga Anda memutuskan untuk menciakinya dengan foto dan ungkapan "Ini adalah latte terbaik yang pernah ada! #StarbucksRocks. "Well, tentu saja, Anda memasukkan" #StarbucksRocks "di tweet Anda sehingga tweet masuk ke arus #StarbucksRocks dan dikelompokkan bersama dengan semua tweet lainnya yang telah diberi label sebagai #StarbucksRocks. Penggunaan label hashtag Anda di tweet Anda memberi tahu Twitter bagaimana mengklasifikasikan data Anda ke grup yang dapat dikenali dan mudah diakses, atau cluster