Rumah Keuangan Pribadi Dasar-dasar Data Cluster dalam Analisis Prediktif - dummies

Dasar-dasar Data Cluster dalam Analisis Prediktif - dummies

Video: Cara Mudah Uji Validitas Menggunakan SPSS - Full Tutorial 2025

Video: Cara Mudah Uji Validitas Menggunakan SPSS - Full Tutorial 2025
Anonim

A dataset < (atau pengumpulan data) adalah seperangkat item dalam analisis prediktif. Sebagai contoh, satu set dokumen adalah dataset dimana item data adalah dokumen. Satu set informasi pengguna jaringan sosial (nama, usia, daftar teman, foto, dan sebagainya) adalah kumpulan data dimana data adalah profil pengguna jaringan sosial. Pengelompokkan data

adalah pembagian dataset menjadi himpunan bagian dari item serupa. Item juga dapat disebut sebagai contoh, observasi, entitas atau objek data. Dalam kebanyakan kasus, kumpulan data terwakili dalam format tabel - matriks data . Matriks data adalah tabel angka, dokumen, atau ungkapan, yang ditunjukkan dalam baris dan kolom sebagai berikut:

Setiap baris sesuai dengan item tertentu dalam kumpulan data.
  • Baris terkadang disebut item, objek, contoh, atau observasi

    . Setiap kolom mewakili karakteristik tertentu dari sebuah item.

  • Kolom disebut sebagai fitur atau atribut

    . Menerapkan pengelompokkan data ke kumpulan data menghasilkan kelompok item data serupa. Kelompok ini disebut cluster

- kumpulan item data serupa.

Similar

item memiliki hubungan yang kuat dan terukur di antara mereka - sayuran segar, misalnya, lebih mirip satu sama lain daripada makanan beku - dan teknik pengelompokan menggunakan hubungan tersebut dengan kelompok barang-barang. Kekuatan hubungan antara dua atau lebih item dapat dihitung sebagai ukuran kemiripan

: Fungsi matematika menghitung korelasi antara dua item data. Hasil perhitungan tersebut, yang disebut nilai kesamaan, pada dasarnya membandingkan item data tertentu dengan semua item lainnya dalam kumpulan data. Item lainnya akan lebih mirip atau kurang mirip dibandingkan dengan item tertentu.

Persamaan yang dihitung memainkan peran utama dalam menugaskan item ke grup (

cluster ). Setiap kelompok memiliki item yang paling mewakili; Item ini disebut sebagai perwakilan cluster . Pertimbangkan kumpulan data yang terdiri dari beberapa jenis buah dalam keranjang. Keranjang memiliki buah dari berbagai jenis seperti apel, pisang, lemon, dan pir. Dalam hal ini, buah adalah item data. Proses pengelompokan data mengekstrak kelompok buah serupa dari kumpulan data ini (keranjang buah yang berbeda).

Langkah pertama dalam proses pengelompokkan data adalah menerjemahkan dataset ini ke dalam matriks data: Salah satu cara untuk memodelkan dataset ini adalah dengan memiliki baris yang mewakili item dalam kumpulan data (buah); dan kolom mewakili karakteristik, atau fitur, yang menggambarkan item.

Misalnya, fitur buah bisa berupa buah (seperti pisang atau apel), berat, warna, atau harga. Dalam dataset contoh ini, item memiliki tiga fitur: jenis buah, warna, dan berat.

Dalam kebanyakan kasus, menerapkan teknik pengelompokkan data ke kumpulan buah seperti yang dijelaskan di atas memungkinkan Anda untuk

Ambil kelompok (kelompok) item serupa.

  • Anda dapat mengetahui bahwa buah Anda terdiri dari beberapa kelompok. Setelah itu, jika Anda memilih buah acak, Anda akan dapat membuat pernyataan tentang item itu sebagai bagian dari salah satu grup N. Ambil perwakilan kelompok dari masing-masing kelompok.

  • Dalam contoh ini, perwakilan cluster akan memilih satu jenis buah dari keranjang dan menyingkirkannya. Ciri khas buah ini adalah buah yang paling mewakili gugusnya. Setelah selesai berkerumun, kumpulan data Anda diatur dan dibagi menjadi pengelompokan alami.

Pengelompokan data menunjukkan struktur dalam data dengan mengekstrak pengelompokan alami dari kumpulan data. Oleh karena itu, menemukan kumpulan merupakan langkah penting untuk merumuskan gagasan dan hipotesis tentang struktur data Anda dan mendapatkan wawasan untuk memahaminya dengan lebih baik.

Pengelompokan data juga bisa menjadi cara untuk memodelkan data: Ini mewakili kumpulan data yang lebih besar oleh cluster atau perwakilan cluster.

Selain itu, analisis Anda mungkin berusaha memisahkan data ke dalam kelompok item serupa - seperti ketika

segmentasi pasar memproyeksikan data pasar sasaran ke dalam kelompok seperti Konsumen yang memiliki minat yang sama seperti masakan Mediterania)

  • Konsumen yang memiliki kebutuhan bersama (misalnya, mereka yang alergi makanan tertentu)

  • Mengidentifikasi kelompok pelanggan serupa dapat membantu Anda mengembangkan strategi pemasaran yang memenuhi kebutuhan kelompok tertentu.

Selain itu, pengelompokkan data juga dapat membantu Anda mengidentifikasi, mempelajari, atau memprediksi sifat item data baru - terutama bagaimana data baru dapat dikaitkan dengan pembuatan prediksi. Misalnya, dalam

pengenalan pola , menganalisis pola dalam data (seperti pola beli di wilayah atau kelompok usia tertentu) dapat membantu Anda mengembangkan analisis prediktif - dalam hal ini, memprediksi sifat item data masa depan yang dapat cocok dengan pola yang mapan. Contoh keranjang buah menggunakan pengelompokan data untuk membedakan antara item data yang berbeda. Misalkan bisnis Anda merakit keranjang buah yang spesial, dan buah baru yang tidak dikenal diperkenalkan ke pasar. Anda ingin mempelajari atau memprediksi kumpulan item baru yang akan dimiliki jika Anda menambahkannya ke keranjang buah.

Karena Anda telah menerapkan pengelompokkan data ke kumpulan buah, Anda memiliki empat kelompok - yang membuatnya lebih mudah untuk memprediksi cluster mana (jenis buah tertentu) yang sesuai untuk item baru. Yang harus Anda lakukan adalah membandingkan buah yang tidak diketahui ke empat cluster lainnya dan mengidentifikasi cluster mana yang paling sesuai.

Meskipun proses ini mungkin tampak jelas bagi seseorang yang bekerja dengan kumpulan data kecil, ini tidak begitu jelas dalam skala yang lebih besar - bila Anda harus mengumpulkan jutaan item tanpa memeriksa masing-masing.Kompleksitas menjadi eksponensial saat dataset berukuran besar, beragam, dan relatif tidak koheren - itulah sebabnya algoritma clustering ada: Komputer melakukan jenis pekerjaan terbaik.

Dasar-dasar Data Cluster dalam Analisis Prediktif - dummies

Pilihan Editor

Asisten Dokter Ujian: Tipe 1 dan Tipe 2 Diabetes - dummies

Asisten Dokter Ujian: Tipe 1 dan Tipe 2 Diabetes - dummies

Sebagai masalah yang lebih umum , Asisten Dokter Ujian (PANCE) akan mengharapkan Anda untuk mengetahui perbedaan antara diabetes tipe 1 dan tipe 2. Diabetes mellitus (DM) adalah karena metabolisme insulin yang abnormal di dalam tubuh. Pada diabetes mellitus tipe 1, pankreas tidak memproduksi insulin, dan pada tipe 2, tubuh menahan tindakan ...

Asisten Dokter Asisten: Testis dan Sekitarnya - dummies

Asisten Dokter Asisten: Testis dan Sekitarnya - dummies

Banyak kondisi kesehatan dapat mempengaruhi testis dan ini akan dibahas di Asisten Dokter Ujian. Tidak hanya kondisi penting secara klinis, tapi juga hasil tinggi untuk tes. Dari torsi hingga kanker hingga infeksi, waspadai kondisi ini. Torsion Testicular torsion adalah kondisi yang tidak Anda inginkan pada kondisi terburuk Anda ...

Praktek Pertanyaan Dermatologi pada Asisten Dokter - dummies

Praktek Pertanyaan Dermatologi pada Asisten Dokter - dummies

Dari ruam sampai eksim dan infeksi bakteri terhadap virus exanthems, pertanyaan latihan ini serupa dengan pertanyaan dermatologi pada Physician Assistant Exam (PANCE). Contoh Pertanyaan PANCE Salah satu dari berikut ini dapat berkembang menjadi karsinoma sel skuamosa dari waktu ke waktu? (A) Onikomikosis (B) Keratosis aktinik (C) Keratosis seboroik (D) Psoriasis (E) Impetigo Anda sedang mengevaluasi ...

Pilihan Editor

GED Test Prep: Penalaran Melalui Bahasa Membaca Seni Pertanyaan Drag-and-Drop

GED Test Prep: Penalaran Melalui Bahasa Membaca Seni Pertanyaan Drag-and-Drop

Bagian Penalaran Melalui Bahasa Seni GED menggunakan jenis pertanyaan drag-and-drop, antara lain. Item ini mengharuskan Anda menyeret dan melepaskan informasi dari satu lokasi ke layar lainnya. Biasanya, tujuannya adalah agar Anda menyusun ulang sesuatu dari yang paling tidak penting bagi kebanyakan orang, untuk menempatkan peristiwa ke dalam urutan, atau hanya ...

Tips Uji GED: Pertanyaan Mengatasi dan Menjawab - dummies

Tips Uji GED: Pertanyaan Mengatasi dan Menjawab - dummies

Saat Anda memulai GED, Anda ingin memiliki rencana permainan di tempat untuk bagaimana menjawab pertanyaan. Ingatlah tips berikut ini untuk membantu Anda mengatasi setiap pertanyaan: Kapan pun Anda membaca sebuah pertanyaan, tanyakan pada diri Anda, "Apa yang saya minta? "Melakukannya membantu Anda tetap fokus pada apa yang Anda butuhkan ...

GED Test Prep: Penalaran Melalui Bahasa Penulisan Seni Pertanyaan Tanggapan yang Diperluas - dummies

GED Test Prep: Penalaran Melalui Bahasa Penulisan Seni Pertanyaan Tanggapan yang Diperluas - dummies

Ketika Anda menyelesaikan bagian pertama dari bagian Reasoning Through Language Arts (RLA) dari GED, Anda memulai Respons Extended-di mana Anda menulis esai dengan menganalisis argumen yang disajikan dalam dua lembar teks contoh. Anda mendapatkan 45 menit untuk mengerjakan bagian RLA ini, dan Anda tidak dapat melakukannya ...

Pilihan Editor

Cara Melacak Konten dan Membuat Laporan untuk Otomasi Pemasaran - dummies

Cara Melacak Konten dan Membuat Laporan untuk Otomasi Pemasaran - dummies

Setelah Anda memiliki konten untuk kampanye otomasi pemasaran, saatnya belajar mengelolanya. Melacak konten Anda - mengetahui siapa yang terlibat dengannya dan di mana dia terlibat dengan-membantu Anda mengetahui bagaimana menyajikannya dengan lebih baik pada kesempatan berikutnya. Otomatisasi pemasaran membuat manajemen konten sangat berbeda dari bagaimana ...

Bagaimana Menggunakan Otomasi Pemasaran untuk Melacak Prospek Pemasaran Bergerak - dummies

Bagaimana Menggunakan Otomasi Pemasaran untuk Melacak Prospek Pemasaran Bergerak - dummies

Banyak pemasar diukur pada berapa banyak prospek yang mereka berikan pada penjualan dan persentase prospek tersebut diubah menjadi peluang. Untungnya, otomatisasi pemasaran dapat membantu Anda mengembangkan cara untuk mengukur prospek. Mendapatkan visibilitas ke prospek setelah mengirimkannya ke tim penjualan merupakan kutukan bagi banyak departemen pemasaran. Setelah menerapkan ...

Bagaimana Menggunakan Video Tertanam untuk Keterlibatan Peningkatan dalam Otomasi Pemasaran - dummies

Bagaimana Menggunakan Video Tertanam untuk Keterlibatan Peningkatan dalam Otomasi Pemasaran - dummies

Anda dapat menggunakan video khusus untuk mendorong konversi yang lebih tinggi melalui otomasi pemasaran Anda. Untuk membuat video yang lebih maju, pastikan Anda memiliki beberapa opsi dasar dengan alat video-hosting Anda: Putar otomatis: Opsi ini memungkinkan video Anda untuk mulai bermain saat seseorang mendarat di halaman. Ini bukan pilihan super canggih, tapi ...