[go: up one dir, main page]

Academia.eduAcademia.edu

Data Mining Concept

Berisi pengertian, fungsi, penerapan, dan contoh pengaplikasian.

UNIVERSITAS GUNADARMA FAKULTAS ILMU KOMPUTER & TEKNOLOGI INFORMASI KONSEP DATA MINING Disusun Oleh : M.Augman Yandi Eko Testiono Singgih Dwi Setyo Rini Purbowati Ratna Assyurawati Tugas Kelompok Sistem Manajemen Basis Data Magister Manajemen Sistem Informasi Dosen : Dr. Romadhona Kelas : 48 MMSI - 3 JAKARTA 2016 Konsep Data Mining secara umum Data mining adalah proses menemukan informasi ditindaklanjuti dari set data yang besar. Data mining menggunakan analisis matematis untuk mendapatkan pola dan tren yang ada di data. Biasanya, pola ini tidak dapat ditemukan oleh eksplorasi data tradisional karena hubungan yang terlalu rumit atau karena terlalu banyak data. Pola-pola dan tren dapat dikumpulkan dan didefinisikan sebagai model data mining . Model pertambangan dapat diterapkan untuk skenario tertentu, seperti: Peramalan Melakukan penjualan, memprediksi beban server (server down). Resiko dan Probabilitas Pemilihan pelanggan terbaik untuk surat yang ditargetkan, menentukan titik impas kemungkinan untuk skenario risiko, menetapkan probabilitas untuk diagnosis atau hasil lainnya. Rekomendasi Menentukan produk mana yang kemungkinan akan dijual sesuai dengan tujuan bersama. Menentukan Urutan Melakukan analisa terhadap pilihan pelanggan, dan melakukan prediksi produk apa yang disukai pelanggan. Pengelompokan Melakukan pemisahan pelanggan pada item yang terkait, melakukan analisa dan memprediksi afinitas Pada proses Data Mining didefinisikan dengan menggunakan enam langkah dasar sebagai berikut : Definisi Masalah Langkah awal dalam proses data mining, seperti yang disorot dalam diagram berikut, adalah untuk secara jelas mendefinisikan masalah, dan mempertimbangkan cara-cara yang dapat dimanfaatkan data untuk memberikan jawaban untuk masalah ini. Persiapan Data Pada langkah ini bagaimana melakukan persiapan berupa konsolidasi dan pengecekan data yang telah didentifikasi pada proses pendefinisian masalah. Penjelajahan Data Langkah ketiga dalam proses data mining adalah pengeksplorasian data. Dalam penjelajahan data ini berisikan pemahaman mengenai masalah bisnis dengan memutuskan apakah dataset model berisi data cacat, kemudian melakukan perancangan strategi untuk memperbaiki masalah. Pembuatan Model Pada langkah ini menentukan dan membuat model. Pada pemrosesan data ini menerapkan algoritma matematika khusus untuk data secara terstruktur agar bisa melakukan pengekstrakan pola datasehingga menghasilkan suatu input data yang diinginkan. Validasi dan penjelajahan Model Pada langkah ini melakukan eksplorasi model yang sudah dibangun dan kemudian melakukan uji coba. Uji coba ini dilakukan untuk mengetahui seberapa baik model pada lingkungan produksi dengan membuat prediksi menggunakan alat-alat dalam desainer seperti grafik dan matriks klasifikasi. Jika ada kesalahan (error) maka akan kembali ke langkah sebelumnya dalam proses pendifinisian masalah atau melakukan riset data ulang. Penerapan dan Pembaruan Model Langkah ini bisa dijalankan apabila pada proses validasi dan penjelajahan model tidak mengalami kendala. Apabila tidak ada kendala atau masalah, maka dapat melakukan penerapan dan penyebaran model pada lingkungan produksi. Data Mining pada Sistem Data Mining (Penambangan Data) merupakan data-data yang telah diseleksi, ditransformasi, dan ditambang dengan berbagai teknik. Proses data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan fungsi-fungsi tertentu. Fungsi atau algoritma dalam data mining sangat bervariasi. Pemilihan fungsi atau algoritma yang tepat sangat bergantung pada tujuan dan proses pencaraian pengetahuan secara keseluruhan. Pada arsitektur data mining memiliki beberapa komponen utama, diantaranya : Database (Relational Database). Merupakan sebuah sistem database, atau disebut juga database management system (DBMS), mengandung sekumpulan data yang saling berhubungan, dikenal sebagai sebuah database, dan satu set program perangkat lunak untuk mengatur dan mengakses data tersebut. Data warehouse. Merupakan sebuah ruang penyimpanan informasi yang terkumpul dari beraneka macam sumber, disimpan dalam skema yang menyatu, dan biasanya terletak pada sebuah site. Knowledge base Data mining engine. Pattern evolution module. Graphical user interface. Data mining dalam penerapannya menggabungkan berbagai bidang ilmu, diantarnya: Sistem basis data, statistik, sistem cerdas, pembelajaran mesin, pengenalan pola, dan visualisasi. Bidang sistem basis data merupakan prasayarat utama data mining. Hal ini disebakan karena pada umumnya data mining dikembangkanan untuk sistem basis data skala besar. DataWarehousing yang merupakan data pre-procesing banyak diterapakan melalui penggunaan SQL dan store procedure yang kemudian menjadi semacam fungsi yang disebut Data Mining Query Language (DMQL), sebagai contoh pada produk SQL Server dan Oracle. Statistik deskriptif, pengujian hipotesa, regresi liner, regresi non linier, poin estimasi, korelasi, dan analisis klaster merupakan perhitungan/teknik analisis statistic sangat dibutuhkan baik dalam preprocessing maupun proses data mining. Pembelajaran mesin, pengenalan pola, jaringan syaraf tiruan, algoritma genetika, logika samar merupakan teknik-teknik sistem cerdas yang utama dalam analisis data mining selain metode statistik. Fungsi-fungsi yang diterapkan dalam data mining  Fungsi-fungsi yang umum diterapkan dalam data mining : Assosiation, adalah proses untuk menemukan aturan assosiatif antara suatu kombinasi item dalam suatu waktu. Sequence, hampir sama dengan association bedanya sequence diterapkan lebih dari satu periode. Clastering, adalah proses pengelompokan sejumlah data/obyek ke dalam kelompok-kelompok data (klaster) sehingga setiap klaster akan berisi data yang saling mirip. Classification, adalah proses penemuan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui. Regretion, adalah proses pemetaam data dalam suatu nilai prediksi Forecasting, adalah proses pengestimasian nilai prediksi berdasarkan pola-pola di dalam sekumpulan data. Solution, adalah proses penemuan akar masalah dan problem solving dari persoalan bisnis yang dihadapi atau paling tidak sebagai informasi pendukung dalam pengambilan keputusan. Penerapan Data Mining Penerapan Sebagai cabang ilmu baru di bidang komputer cukup banyak penerapan yang dapat dilakukan oleh Data Mining. Apalagi ditunjang kekayaan dan keanekaragaman berbagai bidang ilmu (artificial intelligence, database, statistik, pemodelan matematika, pengolahan citra dsb.) membuat penerapan data mining menjadi makin luas. Berikut beberapa penerapannya: Analisa Pasar dan Manajemen Untuk analisa pasar Banyak sekali sumber data yang dapat digunakan seperti transaksi kartu kredit, kartu anggota club tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi tentang gaya hidup publik. Beberapa solusi yang bisa diselesaikan dengan data mining diantaranya: Menembak target pasar Data mining dapat melakukan pengelompokan (clustering) dari modelmodel pembeli dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya. Melihat pola beli pemakai dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. Sebagai contoh, ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account (rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan. Cross-Market Analysis Kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk dengan produk lainnya. contoh:o Cari pola penjualan Coca Cola sedemikian rupa sehingga kita dapat mengetahui barang apa sajakah yang harus kita sediakan untuk meningkatkan penjualan Coca Cola? Profil Customer Data mining dapat membantu Anda untuk melihat profil customer/pembeli/nasabah sehingga kita dapat mengetahui kelompok customer tertentu suka membeli produk apa saja. Identifikasi Kebutuhan Customer Anda dapat mengidentifikasi produk-produk apa saja yang terbaik untuk tiap kelompok customer dan menyusun faktor-faktor apa saja yang kira-kira dapat menarik customer baru untuk bergabung/membeli. Menilai Loyalitas Customer VISA International Spanyol menggunakan data mining untuk melihat kesuksesan program-program customer loyalty mereka. Anda bisa lihat di www.visa.es/ingles/info/300300.html. Informasi Summary Anda juga dapat memanfaatkan data mining untuk membuat laporan summary yang bersifat multi-dimensi dan dilengkapi dengan informasi statistik lainnya. Contoh Aplikasi Data Mining Berikut ini beberapa contoh aplikasi data mining pada beberapa bidang seperti: Pemasaran, Bank dan Asuransi. Langkah-langkah proses untuk melakukan data mining adalah sebagai berikut : Data Cleaning Data Cleaning digunakan untuk menghilangkan noise data yang tidak konsisten. Data integration Sumber data yang terpecah dapat disatukan. Data selection Data yang terdapat dalam database datawarehouse kemudian direduksi dengan berbagai teknik. Proses reduksi diperlukan untuk mendapatkan hasil yang lebih akurat dan mengurangi waktu komputasi terutama utuk masalah dengan skala besar (large scale problem). Beberapa cara seleksi, antra lain: Sampling, adalah seleksi subset representatif dari populasi data yang besar Denoising, adalah proses menghilangkan noise dari data yang akan ditransformasikan Feature extraction, adalah proses membuka spesifikasi data yang signifikan dalam konteks tertentu. Data transformation Transformasi data diperlukan sebagai tahap pre-procecing, dimana data yang diolah siap untuk ditambang. Beberapa cara transformsi, antara lain: Centering, mengurangi setiap data dengan rata-rata dari setiap atribut yang ada. Normalisation, membagi setiap data yang dicentering dengan standar deviasi dari atribut bersangkutan. Scaling, mengubah data sehingga berada dalam skala tertentu. Data mining Proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data. Evaluasi Pola Tahap ini merupakan bagian dari proses pencarian pengetahuan yang mencakup pemeriksaan apakah pola atau informasi yang ditemukan bertentangan dengan fakta atau hipotesa yang ada sebelumnya. Presentasi Pengetahuan (Knowledge Presentation) Langkah terakhir adalah mempresentasikan pengetahuan dalam bentuk visualisasi agar lebih mudah dipahami oleh pengguna.