TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB

Information Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada penelitian ini, terdapat beberapa buku berbahasa A...

Full description

Bibliographic Details
Main Authors: M. Ali Fauzi, Agus Arifin, Anny Yuniarti
Format: Article
Language:English
Published: Udayana University, Institute for Research and Community Services 2015-11-01
Series:Lontar Komputer
Subjects:
Online Access:https://ojs.unud.ac.id/index.php/lontar/article/view/16698
_version_ 1811249032845066240
author M. Ali Fauzi
Agus Arifin
Anny Yuniarti
author_facet M. Ali Fauzi
Agus Arifin
Anny Yuniarti
author_sort M. Ali Fauzi
collection DOAJ
description Information Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada penelitian ini, terdapat beberapa buku berbahasa Arab yang memiliki puluhan bahkan ratusan halaman. Masing-masing halaman dari buku tersebut adalah sebuah dokumen yang akan diranking berdasarkan query dari pengguna. TF.IDF hanya melakukan pembobotan berbasis pada dokumen tanpa memperhatikan indeks buku dan kelas yang merupakan induk dokumen tersebut sehingga kinerjanya kurang maksimal jika diimplementasikan pada kasus ini. Oleh karena itu, diusulkan metode baru term weighting yang berbasis pada indeks buku dan kelas. Metode ini memperhatikan frekuensi kemunculan term pada keseluruhan buku dan kelas. Metode yang disebut inverse class frequency (ICF) dan inverse book frequency (IBF) ini digabungkan dengan metode sebelumnya sehingga menjadi TF.IDF.ICF.IBF. Pengujian metode ini menggunakan dataset dari beberapa e-book berbahasa arab. Hasil penelitian menunjukkan bahwa metode yang diajukan terbukti dapat diaplikasikan pada perangkingan dokumen berbahasa arab dan memiliki performa yang lebih bagus dibanding metode sebelumnya dengan nilai F-Measure 75%, precision 76%, dan recall mencapai 74%.
first_indexed 2024-04-12T15:38:11Z
format Article
id doaj.art-c8594647ca1b43f1a3dd3beeed3a8e65
institution Directory Open Access Journal
issn 2088-1541
2541-5832
language English
last_indexed 2024-04-12T15:38:11Z
publishDate 2015-11-01
publisher Udayana University, Institute for Research and Community Services
record_format Article
series Lontar Komputer
spelling doaj.art-c8594647ca1b43f1a3dd3beeed3a8e652022-12-22T03:26:54ZengUdayana University, Institute for Research and Community ServicesLontar Komputer2088-15412541-58322015-11-0116698TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARABM. Ali Fauzi0Agus Arifin1Anny Yuniarti2Institut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInformation Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada penelitian ini, terdapat beberapa buku berbahasa Arab yang memiliki puluhan bahkan ratusan halaman. Masing-masing halaman dari buku tersebut adalah sebuah dokumen yang akan diranking berdasarkan query dari pengguna. TF.IDF hanya melakukan pembobotan berbasis pada dokumen tanpa memperhatikan indeks buku dan kelas yang merupakan induk dokumen tersebut sehingga kinerjanya kurang maksimal jika diimplementasikan pada kasus ini. Oleh karena itu, diusulkan metode baru term weighting yang berbasis pada indeks buku dan kelas. Metode ini memperhatikan frekuensi kemunculan term pada keseluruhan buku dan kelas. Metode yang disebut inverse class frequency (ICF) dan inverse book frequency (IBF) ini digabungkan dengan metode sebelumnya sehingga menjadi TF.IDF.ICF.IBF. Pengujian metode ini menggunakan dataset dari beberapa e-book berbahasa arab. Hasil penelitian menunjukkan bahwa metode yang diajukan terbukti dapat diaplikasikan pada perangkingan dokumen berbahasa arab dan memiliki performa yang lebih bagus dibanding metode sebelumnya dengan nilai F-Measure 75%, precision 76%, dan recall mencapai 74%.https://ojs.unud.ac.id/index.php/lontar/article/view/16698Perankingan Dokumen, Term Weighting, IBF, Indeks Buku, Indeks Kelas
spellingShingle M. Ali Fauzi
Agus Arifin
Anny Yuniarti
TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
Lontar Komputer
Perankingan Dokumen, Term Weighting, IBF, Indeks Buku, Indeks Kelas
title TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
title_full TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
title_fullStr TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
title_full_unstemmed TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
title_short TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
title_sort term weighting berbasis indeks buku dan kelas untuk perangkingan dokumen berbahasa arab
topic Perankingan Dokumen, Term Weighting, IBF, Indeks Buku, Indeks Kelas
url https://ojs.unud.ac.id/index.php/lontar/article/view/16698
work_keys_str_mv AT malifauzi termweightingberbasisindeksbukudankelasuntukperangkingandokumenberbahasaarab
AT agusarifin termweightingberbasisindeksbukudankelasuntukperangkingandokumenberbahasaarab
AT annyyuniarti termweightingberbasisindeksbukudankelasuntukperangkingandokumenberbahasaarab