Sistem Temu-Balik Informasi (Information Retrieval) digunakan untuk
menemukan kembali informasi-informasi yang relevan terhadap kebutuhan
pengguna dari suatu kumpulan informasi secara otomatis. Salah satu
aplikasi umum dari sistem temu kembali informasi adalah search-engine
atau mesin pencarian yang terdapat pada jaringan internet. Pengguna
dapat mencari halaman-halaman Web yang dibutuhkannya melalui mesin
tersebut.
Ukuran efektifitas pencarian ditentukan oleh precision dan recall.
Precision adalah rasio jumlah dokumen relevan yang ditemukan dengan
total jumlah dokumen yang ditemukan oleh search-engine. Precision
mengindikasikan kualitas himpunan jawaban, tetapi tidak memandang total
jumlah dokumen yang relevan dalam kumpulan dokumen.
Recall adalah rasio jumlah dokumen relevan yang ditemukan kembali
dengan total jumlah dokumen dalam kumpulan dokumen yang dianggap
relevan.
Dalam Information Retrieval,
mendapatkan dokumen yang relevan tidaklah cukup. Tujuan yang harus
dipenuhi adalah bagaimana mendapatkan doukmen relevan dan tidak
mendapatkan dokumen yang tidak relevan. Tujuan lainnya adalah bagaimana
menyusun dokumen yang telah didapatkan tersebut ditampilkan terurut dari
dokumen yang memiliki tingkat relevansi lebih tingi ke tingkat
relevansi rendah. Penyusunan dokumen terurut tersebut disebut sebagai
perangkingan dokumen. Model Ruang Vektor dan Model Probabilistik adalah 2
model pendekatan untuk melakukan hal tersebut.
Model ruang vektor dan model probabilistik adalah model yang
menggunakan pembobotan kata dan perangkingan dokumen. Hasil retrieval
yang didapat dari model-model ini adalah dokumen terangking yang
dianggap paling relevan terhadap query.
Dalam model ruang vektor, dokumen dan query direpresentasikan sebagai
vektor dalam dalam ruang vektor yang disusun dalam indeks term,
kemudian dimodelkan dengan persamaan geometri. Sedangkan model
probabilistik membuat asumsi-asumsi distribusi term dalam dokumen
relevan dan tidak relevan dalam orde estimasi kemungkinan relevansi
suatu dokumen terhadap suatu query.
No comments:
Post a Comment