Banyak vendor software menyediakan berbagai tool data mining.
Contoh-contoh vendor tersebut adalah SPSS (PASW Modeler, sebelumnya
dikenal sebagai Clementine), SAS (Enterprise Miner), StstSoft
(Statistica Data Miner), Salford (CART, MARS, TreeNet, RandomForest),
Angoss (KnowledgesSTUDIO, KnowledgeSeeker), dan Megaputer (PolyAnalyst).
Seperti bisa dilihat diatas, kebanyakan dari tool-tool popular tersebut
dikembangkan oleh perusahaan-perusahaan software statistic terbesar
(SPSS, SAS, dan StatSoft). Kebanyakan dari vendor-vendor tool ‘business
intelligence (BI)’ (seperti IBM Cognos, Oracle Hyperion, SAP Business
Objects, Microstrategy, Teradata, dan Microsoft) juga memiliki tingkat
kemampuan data mining yang terintegrasi dengan tawaran-tawaran software
mereka.tool-tool BI ini utamanya masih berfokus pada pemodelan
multidimensional dan visualisasi data dan tidak ditujukan untuk menjadi
pesaing langsung dari vendor-vendor tool data minig tersebut.
RAPID MINER
Selain tool-tool komersial tadi, beberapa tool software data mining open source dan/atau fratis juga tersedia di internet. Barangkali tool software data mining gratis (dan open source) yang paling popular adalah Weka, yang dikembangkan oleh sejumlah peneliti dari Universitas Waikato di New Zealand (tool tersebut bisa didownload di cs.waikato.ac.nz/ml/weka/). Weka meliputi banyak sekali algorithma untuk berbagai perkerjaan data mining yang berbeda-beda dan memiliki user interface yang intuitif. Satu lagi yang baru saja dirilis, tool data mining gratis (bagi penggunaan nonkomersial) adalah RapidMiner (yang dikembangkan oleh Rapid-I; dan bisa didownload dari rapid-i.com). GUI (graphical user interface) yang sudah ditingkatkan kemampuannya, penerapan banyak sekali algorithma, dan penyatuan dengan berbagai fitur-fitur visualisasi data membuatnya berbeda dari tool-tool gratisan lainnya. Perbedaan utama antara tool-tool komersialm seperti Enterprise Miner, PASW, dan Statistika, dan tool-tool gratisan, seperti Weka dan RapidMiner, adalah efisiensi komputasionalnya. Pekerjaan data mining yang sama yang melibatkan dataset yang agak besar mungkin saja akan memakan waktu yang jauh lebih lama bila dilakukan oleh software gratisan, dan dalam beberapa kasus mungkin bahkan tidak layak untuk digunakan (misalnya, crash karena penggunaan memori computer yang tidak efisien). Tabel berikut adalah daftar dari beberapa produk utama beserta websitenya.
Apa itu SPSS?
SPSS
adalah sebuah program aplikasi yang memiliki kemampuan analisis
statistik cukup tinggi serta sistem manajemen data pada lingkungan
grafis dengan menggunakan menu-menu deskriptif dan kotak-kotak dialog
yang sederhana sehingga mudah untuk dipahami cara pengoperasiannya.
Beberapa aktivitas dapat dilakukan dengan mudah dengan menggunakan
pointing dan clicking mouse.
SPSS
banyak digunakan dalam berbagai riset pemasaran, pengendalian dan
perbaikan mutu (quality improvement), serta riset-riset sains. SPSS
pertama kali muncul dengan versi PC (bisa dipakai untuk komputer
desktop) dengan nama SPSS/PC+ (versi DOS). Tetapi, dengan mulai
populernya system operasi windows. SPSS mulai mengeluarkan versi windows
(mulai dari versi 6.0 sampai versi terbaru sekarang).
Pada
awalnya SPSS dibuat untuk keperluan pengolahan data statistik untuk
ilmu-ilmu social, sehingga kepanjangan SPSS itu sendiri adalah
Statistikal Package for the Social Sciens. Sekarang kemampuan SPSS
diperluas untuk melayani berbagai jenis pengguna (user), seperti untuk
proses produksi di pabrik, riset ilmu sains dan lainnya. Dengan
demikian, sekarang kepanjangan dari SPSS Statistikal Product and Service
Solutions.
SPSS
dapat membaca berbagai jenis data atau memasukkan data secara langsung
ke dalam SPSS Data Editor. Bagaimanapun struktur dari file data
mentahnya, maka data dalam Data Editor SPSS harus dibentuk dalam bentuk
baris (cases) dan kolom (variables). Case berisi informasi untuk satu
unit analisis, sedangkan variable adalah informasi yang dikumpulkan dari
masing-masing kasus.
Hasil-hasil
analisis muncul dalam SPSS Output Navigator. Kebanyakan prosedur Base
System menghasilkan pivot tables, dimana kita bisa memperbaiki tampilan
dari keluaran yang diberikan oleh SPSS. Untuk memperbaiki output, maka
kita dapat mmperbaiki output sesuai dengan kebutuhan. Beberapa kemudahan
yang lain yang dimiliki SPSS dalam pengoperasiannya adalah karena SPSS
menyediakan beberapa fasilitas seperti berikut ini:
Data
Editor. Merupakan jendela untuk pengolahan data. Data editor dirancang
sedemikian rupa seperti pada aplikasi-aplikasi spreadsheet untuk
mendefinisikan, memasukkan, mengedit, dan menampilkan data.
Viewer.
Viewer mempermudah pemakai untuk melihat hasil pemrosesan, menunjukkan
atau menghilangkan bagian-bagian tertentu dari output, serta memudahkan
distribusi hasil pengolahan dari SPSS ke aplikasi-aplikasi yang lain.
Multidimensional
Pivot Tables. Hasil pengolahan data akan ditunjukkan dengan
multidimensional pivot tables. Pemakai dapat melakukan eksplorasi
terhdap tabel dengan pengaturan baris, kolom, serta layer. Pemakai juga
dapat dengan mudah melakukan pengaturan kelompok data dengan melakukan
splitting tabel sehingga hanya satu group tertentu saja yang ditampilkan
pada satu waktu.
High-Resolution
Graphics. Dengan kemampuan grafikal beresolusi tinggi, baik untuk
menampilkan pie charts, bar charts, histogram, scatterplots, 3-D
graphics, dan yang lainnya, akan membuat SPSS tidak hanya mudah
dioperasikan tetapi juga membuat pemakai merasa nyaman dalam
pekerjaannya.
Database
Access. Pemakai program ini dapat memperoleh kembali informasi dari
sebuah database dengan menggunakan Database Wizard yang disediakannya.
Data
Transformations. Transformasi data akan membantu pemakai memperoleh
data yang siap untuk dianalisis. Pemakai dapat dengan mudah melakukan
subset data, mengkombinasikan kategori, add, aggregat, merge, split, dan
beberapa perintah transpose files, serta yang lainnya.
Electronic
Distribution. Pengguna dapat mengirimkan laporan secara elektronik
menggunakan sebuah tombol pengiriman data (e-mail) atau melakukan export
tabel dan grafik ke mode HTML sehingga mendukung distribusi melalui
internet dan intranet.
Online
Help. SPSS menyediakan fasilitas online help yang akan selalu siap
membantu pemakai dalam melakukan pekerjaannya. Bantuan yang diberikan
dapat berupa petunjuk pengoperasian secara detail, kemudahan pencarian
prosedur yang diinginkan sampai pada contoh-contoh kasus dalam
pengoperasian program ini.
Akses
Data Tanpa Tempat Penyimpanan Sementara. Analisis file-file data yang
sangat besar disimpan tanpa membutuhkan tempat penyimpanan sementara.
Hal ini berbeda dengan SPSS sebelum versi 11.5 dimana file data yang
sangat besar dibuat temporary filenya.
Interface
dengan Database Relasional. Fasilitas ini akan menambah efisiensi dan
memudahkan pekerjaan untuk mengekstrak data dan menganalisnya dari
database relasional.
Analisis
Distribusi. Fasilitas ini diperoleh pada pemakaian SPSS for Server atau
untuk aplikasi multiuser. Kegunaan dari analisis ini adalah apabila
peneliti akan menganalisis file-file data yang sangat besar dapat
langsung me-remote dari server dan memprosesnya sekaligus tanpa harus
memindahkan ke komputer user.
Multiple Sesi. SPSS memberikan kemampuan untuk melakukan analisis lebih dari satu file data pada waktu yang bersamaan.
Mapping.
Visualisasi data dapat dibuat dengan berbagai macam tipe baik secara
konvensional atau interaktif, misalnya dengan menggunakan tipe bar, pie
atau jangkauan nilai, simbol gradual, dan chart.
No comments:
Post a Comment