TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB
Information Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada penelitian ini, terdapat beberapa buku berbahasa A...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Udayana University, Institute for Research and Community Services
2015-11-01
|
Series: | Lontar Komputer |
Subjects: | |
Online Access: | https://ojs.unud.ac.id/index.php/lontar/article/view/16698 |
_version_ | 1811249032845066240 |
---|---|
author | M. Ali Fauzi Agus Arifin Anny Yuniarti |
author_facet | M. Ali Fauzi Agus Arifin Anny Yuniarti |
author_sort | M. Ali Fauzi |
collection | DOAJ |
description | Information Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada penelitian ini, terdapat beberapa buku berbahasa Arab yang memiliki puluhan bahkan ratusan halaman. Masing-masing halaman dari buku tersebut adalah sebuah dokumen yang akan diranking berdasarkan query dari pengguna. TF.IDF hanya melakukan pembobotan berbasis pada dokumen tanpa memperhatikan indeks buku dan kelas yang merupakan induk dokumen tersebut sehingga kinerjanya kurang maksimal jika diimplementasikan pada kasus ini. Oleh karena itu, diusulkan metode baru term weighting yang berbasis pada indeks buku dan kelas. Metode ini memperhatikan frekuensi kemunculan term pada keseluruhan buku dan kelas. Metode yang disebut inverse class frequency (ICF) dan inverse book frequency (IBF) ini digabungkan dengan metode sebelumnya sehingga menjadi TF.IDF.ICF.IBF. Pengujian metode ini menggunakan dataset dari beberapa e-book berbahasa arab. Hasil penelitian menunjukkan bahwa metode yang diajukan terbukti dapat diaplikasikan pada perangkingan dokumen berbahasa arab dan memiliki performa yang lebih bagus dibanding metode sebelumnya dengan nilai F-Measure 75%, precision 76%, dan recall mencapai 74%. |
first_indexed | 2024-04-12T15:38:11Z |
format | Article |
id | doaj.art-c8594647ca1b43f1a3dd3beeed3a8e65 |
institution | Directory Open Access Journal |
issn | 2088-1541 2541-5832 |
language | English |
last_indexed | 2024-04-12T15:38:11Z |
publishDate | 2015-11-01 |
publisher | Udayana University, Institute for Research and Community Services |
record_format | Article |
series | Lontar Komputer |
spelling | doaj.art-c8594647ca1b43f1a3dd3beeed3a8e652022-12-22T03:26:54ZengUdayana University, Institute for Research and Community ServicesLontar Komputer2088-15412541-58322015-11-0116698TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARABM. Ali Fauzi0Agus Arifin1Anny Yuniarti2Institut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInformation Retrieval berdasarkan query tertentu sudah jamak ditemukan pada sistem komputer saat ini. Salah satu metode yang populer digunakan adalah perangkingan dokumen menggunakan space vector model berbasis pada nilai term weighting TF.IDF. Pada penelitian ini, terdapat beberapa buku berbahasa Arab yang memiliki puluhan bahkan ratusan halaman. Masing-masing halaman dari buku tersebut adalah sebuah dokumen yang akan diranking berdasarkan query dari pengguna. TF.IDF hanya melakukan pembobotan berbasis pada dokumen tanpa memperhatikan indeks buku dan kelas yang merupakan induk dokumen tersebut sehingga kinerjanya kurang maksimal jika diimplementasikan pada kasus ini. Oleh karena itu, diusulkan metode baru term weighting yang berbasis pada indeks buku dan kelas. Metode ini memperhatikan frekuensi kemunculan term pada keseluruhan buku dan kelas. Metode yang disebut inverse class frequency (ICF) dan inverse book frequency (IBF) ini digabungkan dengan metode sebelumnya sehingga menjadi TF.IDF.ICF.IBF. Pengujian metode ini menggunakan dataset dari beberapa e-book berbahasa arab. Hasil penelitian menunjukkan bahwa metode yang diajukan terbukti dapat diaplikasikan pada perangkingan dokumen berbahasa arab dan memiliki performa yang lebih bagus dibanding metode sebelumnya dengan nilai F-Measure 75%, precision 76%, dan recall mencapai 74%.https://ojs.unud.ac.id/index.php/lontar/article/view/16698Perankingan Dokumen, Term Weighting, IBF, Indeks Buku, Indeks Kelas |
spellingShingle | M. Ali Fauzi Agus Arifin Anny Yuniarti TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB Lontar Komputer Perankingan Dokumen, Term Weighting, IBF, Indeks Buku, Indeks Kelas |
title | TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB |
title_full | TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB |
title_fullStr | TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB |
title_full_unstemmed | TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB |
title_short | TERM WEIGHTING BERBASIS INDEKS BUKU DAN KELAS UNTUK PERANGKINGAN DOKUMEN BERBAHASA ARAB |
title_sort | term weighting berbasis indeks buku dan kelas untuk perangkingan dokumen berbahasa arab |
topic | Perankingan Dokumen, Term Weighting, IBF, Indeks Buku, Indeks Kelas |
url | https://ojs.unud.ac.id/index.php/lontar/article/view/16698 |
work_keys_str_mv | AT malifauzi termweightingberbasisindeksbukudankelasuntukperangkingandokumenberbahasaarab AT agusarifin termweightingberbasisindeksbukudankelasuntukperangkingandokumenberbahasaarab AT annyyuniarti termweightingberbasisindeksbukudankelasuntukperangkingandokumenberbahasaarab |