apa sih data mining

15Jan08

Data mining merupakan prinsip dasar dalam mengurutkan data dalam jumlah yang sangat banyak dan mengambil informasi – informasi yang berkaitan dengan apa yang diperlukan seperti apa yang biasa dilakukan oleh seorang analis. Dengan bertambah banyaknya jumlah data yang ada dalam model bisnis yang kita lakukan dalam perusahaan ini, maka peran analis untuk menganalisa data secara manual perlu digantikan dengan aplikasi yang berbasis komputer yang dapat menganalisa data secara otomatis menggunakan alat yang lebih kompleks dan canggih.

Data mining dapat mengidentifikasi tren yang terdapat dalam sekumpulan data. Melalui algoritma yang rumit, kita akan memiliki kemampuan untuk menentukan kunci utama dari sebuah proses bisnis atau menemukan kesempatan baru. Beberapa teknik yang sering digunakan dalam data mining :

·        Artificial Neural Network : model prediksi non linear yang melakukan pembelajaran melalu latihan dan menyerupai struktur jaringan nerual yang terdapat pada mahluk hidup.

·        Decision Tree : struktur yang berbentuk pohon yang menggambarkan kumpulan keputusan. Decision tree ini akan membentuk aturan klasifikasi dari kumpulan data.

·        Genetic Algorithms : teknik optimasi yang menggunakan proses seperti kombinasi genetik, mutasi dan seleksi alam sebagai pola berdasarkan konsep evolusi

·        Nearest Neighbor Method : teknik yang mengklasifikasi setiap rekord dalam kumpulan data berdasarkan kombinasi dari klas kumpulan rekord yang mirip dalam kumpulan data historis.

·        Rule Induction : ekstraksi aturan sebab-akibat dari data secara statistik

 

Tahap – tahap yang dilakukan dalam data mining :

·        Pembersihan data untuk menghilangkan data yang tidak konsisten dan noise

·        Integrasi data dari berbagai sumber

·        Transformasi data menjadi bentuk yang sesuai untuk dilakukan mining

·        Aplikasi teknis data mining

·        Evaluasi pola yang ditemukan untuk menemukan pola yang menarik atau bernilai

                  ·        Presentasi pengetahuan dengan teknik visualisasi

Istilah data mining sering kali digunakan untuk dua proses yang berbeda dari penemuan pengetahuan (knowledge discovery) dan prediksi. Knowledge discovery menyediakan informasi secara eksplisit dan prediksi menyediakan perkiraan yang akan terjadi di masa yang akan datang.

Knowledge discovery disini menyangkut penemuan pola atau perilaku yang terdapat di dalam data yang berujung pada pengambilan tindakan bisnis yang menguntungkan. Data mining memerlukan volume data yang sangat besar termasuk data historis maupun data saat ini untuk mengeksplorasi pengetahuan. Begitu sejumlah data tersebut telah didapat, maka data tersebut akan dibersihkan, di validasi dan dipersiapkan untuk disimpan di dalam sebuah data warehouse. Bussiness intelligence (BI) akan menangkap fakta dari kumpulan data ini untuk digunakan dalam proses penemuan pengetahuan.

Data mining juga dapat secara otomatis melakukan proses prediksi tren dan kebiasaan yang mungkin terjadi di masa yang akan datang berdasarkan informasi yang terkandung didalam database yang besar. Pertanyaan yang biasanya dijawab dengan melakukan penelitian dan analisa yang mendalam sekarang dapat dijawab dengan cepat langsung dari data yang tersedia. Salah satu contoh dari prediksi yang dilakukan oleh data mining adalah targeted marketing. Disini digunakan data dari promosi yang dilakukan di masa sebelumnya untuk mengidentifikasi target calon konsumen yang paling mungkin untuk dilakukan promosi di masa yang akan datang.

Bagaimana cara data mining melakukan prediksi ini? Teknik yang digunakan disini adalah teknik pemodelan. Pemodelan adalah pembuatan model pada situasi yang telah diketahui dan menerapkannya pada situasi yang lain yang tidak diketahui. Dalam data mining, komputer di muati dengan berbagai macam informasi yang banyak sekali dengan situasi atau keadaan yang telah diketahui dan kemudian perangkat lunak data mining akan menggunakan semua data dan mengambil data yang sesuai dengan karakteristik model yang dibuat. Begitu model berhasil dibuat, maka model ini dapat digunakan pada situasi yang mirip. Sebagai contoh, misalnya perusahaan sedang melakukan pembagian kupon diskon untuk mencari lebih banyak konsumen untuk membeli di gerai yang dioperasikan. Kita dapat mengirimkan kupon itu secara acak ke semua kalangan. Tetapi kemungkinan keberhasil ini akan lebih baik jika kita menggunakan pengalaman yang tersimpan di dalam data perusahaan, seperti umur, jenis kelamin, pekerjaan, pendapatan, riwayat belanja dan lain – lain untuk membangun sebuah model yang dapat merepresentasikan tipe – tipe konsumen baru yang mempunyai prospek tinggi. Hal ini dapat menghemat waktu dan biaya karena pengiriman kupon dapat lebih di targetkan pada tipe – tipe konsumen tersebut.

Untuk mengaplikasikan hal ini, data mining harus diintegrasikan dengan data warehouse dan kakas bisnis analis. Data mining yang beroperasi diluar data warehouse akan memerlukan langkah – langkah tambahan untuk mengambil dan menganalisa data. Sebagai langkah awal yang ideal yaitu menggunakan data warehouse yang menyimpan data dari semua konsumen dan data yang menyimpan aktifitas dari para kompetitor. Gambar dibawah ini menunjukkan arsitektur data mining yang terintegrasi dengan data warehouse.

Server OLAP (On – Line Analytical Processing) memungkinkan penggunaaan model bisnis yang lebih rumit untuk diaplikasikan pada data warehouse. Struktur multidimensinya memungkinkan pengguna untuk melakukan analisa terhadap data sesuai dengan kepentingan bisnis masing – masing, seperti daerah, produk, kategori konsumen, dan lain – lain. Server data mining ini harus terintegrasi dengan data warehouse dan OLAP untuk mendapatkan analisa bisnis yang terfokus. Dengan bertumbuhnya data warehouse, akan menghasilkan analisa dan keputusan yang baru, sehingga dapat digunakan secara terus menerus dalam pengambilan keputusan selanjutnya.

Penggambaran ini menunjukkkan pergeseran dari sistem pembantu pengambilan keputusan konvensional. Bukan hanya menyampaikan data kepada pengguna menggunakan query dan perangkat lunak untuk membuat laporan, server analisis menggunakan model bisnis pengguna pada data warehouse dan mengembalikan informasi yang paling berkaitan. Pelaporan, visualisasi dan peralatan analisis dapat digunakan untuk merencanakan keputusan bisnis di masa depan dan memperkirakan pengaruh dari rencana tersebut.

Kompetisi dalam bisinis memerlukan analisa yang canggih dan dilakukan secara terus menerus terhadap data. Tetapi terdapat celah dalam sistem pengambilan dan penyimpanan data dengan kemampuan pengguna untuk dapat melakukan analisa guna mendapatkan informasi dan pengetahuan dari data – data yang ada. Data mining data mengisi celah ini dengan menyediakan kemampuan untuk menganalisa dan mengambil informasi serta pengetahuan dari data yang sangat banyak sesuai dengan keperluan dari pengguna.

Advertisements


One Response to “apa sih data mining”

  1. 1 haikal

    Apa Peranan visualisasi informasi dalam data mining


Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s


%d bloggers like this: