Wednesday, May 21, 2014

SPSS VS RAPIDMINER

Banyak vendor software menyediakan berbagai tool data mining. Contoh-contoh vendor tersebut adalah SPSS (PASW Modeler, sebelumnya dikenal sebagai Clementine), SAS (Enterprise Miner), StstSoft (Statistica Data Miner), Salford (CART, MARS, TreeNet, RandomForest), Angoss (KnowledgesSTUDIO, KnowledgeSeeker), dan Megaputer (PolyAnalyst). Seperti bisa dilihat diatas, kebanyakan dari tool-tool popular tersebut dikembangkan oleh perusahaan-perusahaan software statistic terbesar (SPSS, SAS, dan StatSoft). Kebanyakan dari vendor-vendor tool ‘business intelligence (BI)’ (seperti IBM Cognos, Oracle Hyperion, SAP Business Objects, Microstrategy, Teradata, dan Microsoft) juga memiliki tingkat kemampuan data mining yang terintegrasi dengan tawaran-tawaran software mereka.tool-tool BI ini utamanya masih berfokus pada pemodelan multidimensional dan visualisasi data dan tidak ditujukan untuk menjadi pesaing langsung dari vendor-vendor tool data minig tersebut.

RAPID MINER
Selain tool-tool komersial tadi, beberapa tool software data mining open source dan/atau fratis juga tersedia di internet. Barangkali tool software data mining gratis (dan open source) yang paling popular adalah Weka, yang dikembangkan oleh sejumlah peneliti dari Universitas Waikato di New Zealand (tool tersebut bisa didownload di cs.waikato.ac.nz/ml/weka/). Weka meliputi banyak sekali algorithma untuk berbagai perkerjaan data mining yang berbeda-beda dan memiliki user interface yang intuitif. Satu lagi yang baru saja dirilis, tool data mining gratis (bagi penggunaan nonkomersial) adalah RapidMiner (yang dikembangkan oleh Rapid-I; dan bisa didownload dari rapid-i.com). GUI (graphical user interface) yang sudah ditingkatkan kemampuannya, penerapan banyak sekali algorithma, dan penyatuan dengan berbagai fitur-fitur visualisasi data membuatnya berbeda dari tool-tool gratisan lainnya. Perbedaan utama antara tool-tool komersialm seperti Enterprise Miner, PASW, dan Statistika, dan tool-tool gratisan, seperti Weka dan RapidMiner, adalah efisiensi komputasionalnya. Pekerjaan data mining yang sama yang melibatkan dataset yang agak besar mungkin saja akan memakan waktu yang jauh lebih lama bila dilakukan oleh software gratisan, dan dalam beberapa kasus mungkin bahkan tidak layak untuk digunakan (misalnya, crash karena penggunaan memori computer yang tidak efisien). Tabel berikut adalah daftar dari beberapa produk utama beserta websitenya.

 

Apa itu SPSS?

SPSS adalah sebuah program aplikasi yang memiliki kemampuan analisis statistik cukup tinggi serta sistem manajemen data pada lingkungan grafis dengan menggunakan menu-menu deskriptif dan kotak-kotak dialog yang sederhana sehingga mudah untuk dipahami cara pengoperasiannya. Beberapa aktivitas dapat dilakukan dengan mudah dengan menggunakan pointing dan clicking mouse.
SPSS banyak digunakan dalam berbagai riset pemasaran, pengendalian dan perbaikan mutu (quality improvement), serta riset-riset sains. SPSS pertama kali muncul dengan versi PC (bisa dipakai untuk komputer desktop) dengan nama SPSS/PC+ (versi DOS). Tetapi, dengan mulai populernya system operasi windows. SPSS mulai mengeluarkan versi windows (mulai dari versi 6.0 sampai versi terbaru sekarang).
Pada awalnya SPSS dibuat untuk keperluan pengolahan data statistik untuk ilmu-ilmu social, sehingga kepanjangan SPSS itu sendiri adalah Statistikal Package for the Social Sciens. Sekarang kemampuan SPSS diperluas untuk melayani berbagai jenis pengguna (user), seperti untuk proses produksi di pabrik, riset ilmu sains dan lainnya. Dengan demikian, sekarang kepanjangan dari SPSS Statistikal Product and Service Solutions.
SPSS dapat membaca berbagai jenis data atau memasukkan data secara langsung ke dalam SPSS Data Editor. Bagaimanapun struktur dari file data mentahnya, maka data dalam Data Editor SPSS harus dibentuk dalam bentuk baris (cases) dan kolom (variables). Case berisi informasi untuk satu unit analisis, sedangkan variable adalah informasi yang dikumpulkan dari masing-masing kasus.
Hasil-hasil analisis muncul dalam SPSS Output Navigator. Kebanyakan prosedur Base System menghasilkan pivot tables, dimana kita bisa memperbaiki tampilan dari keluaran yang diberikan oleh SPSS. Untuk memperbaiki output, maka kita dapat mmperbaiki output sesuai dengan kebutuhan. Beberapa kemudahan yang lain yang dimiliki SPSS dalam pengoperasiannya adalah karena SPSS menyediakan beberapa fasilitas seperti berikut ini:
Data Editor. Merupakan jendela untuk pengolahan data. Data editor dirancang sedemikian rupa seperti pada aplikasi-aplikasi spreadsheet untuk mendefinisikan, memasukkan, mengedit, dan menampilkan data.
Viewer. Viewer mempermudah pemakai untuk melihat hasil pemrosesan, menunjukkan atau menghilangkan bagian-bagian tertentu dari output, serta memudahkan distribusi hasil pengolahan dari SPSS ke aplikasi-aplikasi yang lain.
Multidimensional Pivot Tables. Hasil pengolahan data akan ditunjukkan dengan multidimensional pivot tables. Pemakai dapat melakukan eksplorasi terhdap tabel dengan pengaturan baris, kolom, serta layer. Pemakai juga dapat dengan mudah melakukan pengaturan kelompok data dengan melakukan splitting tabel sehingga hanya satu group tertentu saja yang ditampilkan pada satu waktu.
High-Resolution Graphics. Dengan kemampuan grafikal beresolusi tinggi, baik untuk menampilkan pie charts, bar charts, histogram, scatterplots, 3-D graphics, dan yang lainnya, akan membuat SPSS tidak hanya mudah dioperasikan tetapi juga membuat pemakai merasa nyaman dalam pekerjaannya.
Database Access. Pemakai program ini dapat memperoleh kembali informasi dari sebuah database dengan menggunakan Database Wizard yang disediakannya.
Data Transformations. Transformasi data akan membantu pemakai memperoleh data yang siap untuk dianalisis. Pemakai dapat dengan mudah melakukan subset data, mengkombinasikan kategori, add, aggregat, merge, split, dan beberapa perintah transpose files, serta yang lainnya.
Electronic Distribution. Pengguna dapat mengirimkan laporan secara elektronik menggunakan sebuah tombol pengiriman data (e-mail) atau melakukan export tabel dan grafik ke mode HTML sehingga mendukung distribusi melalui internet dan intranet.
Online Help. SPSS menyediakan fasilitas online help yang akan selalu siap membantu pemakai dalam melakukan pekerjaannya. Bantuan yang diberikan dapat berupa petunjuk pengoperasian secara detail, kemudahan pencarian prosedur yang diinginkan sampai pada contoh-contoh kasus dalam pengoperasian program ini.
Akses Data Tanpa Tempat Penyimpanan Sementara. Analisis file-file data yang sangat besar disimpan tanpa membutuhkan tempat penyimpanan sementara. Hal ini berbeda dengan SPSS sebelum versi 11.5 dimana file data yang sangat besar dibuat temporary filenya.
Interface dengan Database Relasional. Fasilitas ini akan menambah efisiensi dan memudahkan pekerjaan untuk mengekstrak data dan menganalisnya dari database relasional.
Analisis Distribusi. Fasilitas ini diperoleh pada pemakaian SPSS for Server atau untuk aplikasi multiuser. Kegunaan dari analisis ini adalah apabila peneliti akan menganalisis file-file data yang sangat besar dapat langsung me-remote dari server dan memprosesnya sekaligus tanpa harus memindahkan ke komputer user.
Multiple Sesi. SPSS memberikan kemampuan untuk melakukan analisis lebih dari satu file data pada waktu yang bersamaan.
Mapping. Visualisasi data dapat dibuat dengan berbagai macam tipe baik secara konvensional atau interaktif, misalnya dengan menggunakan tipe bar, pie atau jangkauan nilai, simbol gradual, dan chart.
 

No comments:

Post a Comment