Video: How data mining works 2024
Data yang dikumpulkan oleh organisasi besar dalam perjalanan bisnis sehari-hari biasanya disimpan di database. Namun, administrator database mungkin tidak mengizinkan pengguna penambang mengakses langsung sumber data, dan akses langsung mungkin bukan pilihan terbaik dari sudut pandang Anda. Akses langsung ke operasi operasional (digunakan untuk operasi bisnis rutin) dapat menjadi ide yang buruk karena
-
Penambang data menggunakan banyak data. > Anda bisa secara tidak sengaja mengikat sumber daya dan mengganggu operasi bisnis biasa.
-
Anda mungkin tidak sengaja melanggar undang-undang privasi data atau pengelolaan data lainnya. persyaratan jika akses data Anda tidak terkontrol dengan benar. Database operasional tidak diatur untuk data mining.
-
Anda bisa menghabiskan banyak waktu untuk mendapatkan data yang Anda butuhkan, dan tetap tidak yakin untuk melakukannya dengan benar. Bila Anda memerlukan data dari database operasional (dan Anda memiliki persetujuan yang tepat untuk menggunakan data), Anda harus mendiskusikan kebutuhan Anda dengan administrator yang bertanggung jawab atas data tersebut. Anda harus menjelaskan dengan tepat data apa yang Anda butuhkan, format yang Anda butuhkan untuk data mining, dan apakah Anda memerlukan data hanya sekali atau secara berkelanjutan.
Akses data yang sedang berjalan adalah masalah lain. Administrator mungkin tidak ingin memberikan ekstrak data berulang-ulang, dan memberi Anda akses langsung ke sistem bisnis berisiko. Solusi yang umum adalah membuat database analitik
. Ini adalah database relasional biasa yang terpisah dari sistem bisnis konvensional. Data secara rutin (dan otomatis) ditransfer dari sistem bisnis ke database analitik, dan penambang data dapat mengaksesnya kapan saja.
Jika administrator database bersikeras bahwa data tidak dapat disimpan dengan cara ini, tanyakan apakah mungkin membuat
view (kueri tersimpan yang dapat dipertanyakan seolah-olah itu adalah tabel data konvensional) dengan organisasi yang Anda butuhkan. Banyak produk data mining dapat membaca data dari database. Langkah-langkah yang diperlukan berbeda-beda berdasarkan pada
Desain aplikasi data mining
-
Struktur database sumber
-
Middleware, biasanya disebut driver
-
driver ( ODBC, driver JDBC