Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab

Perangkingan dokumen telah menjadi topik yang banyak dibahas pada sistem temu kembali informasi untuk memberikan urutan dokumen paling relevan berdasarkan kueri yang diberikan oleh pengguna. Namun, penelitian tentang perangkingan dokumen dalam bahasa Arab masih belum banyak dilakukan karena memiliki...

Full description

Bibliographic Details
Main Authors: Amelia Devi Putri Ariyanto, Lutfiyatul A, Agus Z A, . Maryamah, Rizka W S, Rarasmaya I
Format: Article
Language:Indonesian
Published: Universitas Dian Nuswantoro 2021-05-01
Series:Techno.Com
Subjects:
Online Access:http://publikasi.dinus.ac.id/index.php/technoc/article/view/4357
_version_ 1818340143453437952
author Amelia Devi Putri Ariyanto
Lutfiyatul A
Agus Z A
. Maryamah
Rizka W S
Rarasmaya I
author_facet Amelia Devi Putri Ariyanto
Lutfiyatul A
Agus Z A
. Maryamah
Rizka W S
Rarasmaya I
author_sort Amelia Devi Putri Ariyanto
collection DOAJ
description Perangkingan dokumen telah menjadi topik yang banyak dibahas pada sistem temu kembali informasi untuk memberikan urutan dokumen paling relevan berdasarkan kueri yang diberikan oleh pengguna. Namun, penelitian tentang perangkingan dokumen dalam bahasa Arab masih belum banyak dilakukan karena memiliki morfologi yang unik dan literatur dalam bahasa Arab yang masih sedikit. Selain itu, didalam proses perangkingan juga diperlukan perhitungan pembobotan kata yang optimal supaya dapat memberikan hasil yang sesuai. Pembobotan kata yang paling umum digunakan adalah term frequency-inverse document frequency (TF.IDF) yang hanya menghitung pembobotan setiap kata berdasarkan pengelompokan dokumen saja sehingga dapat menyebabkan relevansi antar dokumen menjadi rendah karena memiliki tingkat kemiripan antar dokumen yang berbeda. Oleh karena itu, diperlukan suatu pembobotan kata berdasarkan pengelompokan dokumen dalam suatu cluster untuk meningkatkan relevansi antar dokumen. Tujuan penelitian ini membuat metode perangkingan dokumen berbahasa Arab dengan menggunakan pembobotan berbasis cluster yang menggabungkan TF.IDF dan inverse cluster frequency (ICF) sehingga diperoleh TF.IDF.ICF. Evaluasi dilakukan menggunakan dokumen e-book berbahasa Arab yang telah dikelompokkan menjadi tiga cluster. Hasil penelitian membuktikan pembobotan TF.IDF.ICF mampu menemukan dokumen paling relevan terhadap kueri yang dimasukan oleh pengguna serta memperoleh nilai rata-rata precision dan F1-Measure yang lebih tinggi daripada hanya menggunakan pembobotan TF.IDF yaitu sebesar 68% dan 78%.
first_indexed 2024-12-13T15:38:13Z
format Article
id doaj.art-4ff8741034b2429aa72b4aec10566efb
institution Directory Open Access Journal
issn 2356-2579
2356-2579
language Indonesian
last_indexed 2024-12-13T15:38:13Z
publishDate 2021-05-01
publisher Universitas Dian Nuswantoro
record_format Article
series Techno.Com
spelling doaj.art-4ff8741034b2429aa72b4aec10566efb2022-12-21T23:39:56ZindUniversitas Dian NuswantoroTechno.Com2356-25792356-25792021-05-0120225926710.33633/tc.v20i2.43572039Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa ArabAmelia Devi Putri Ariyanto0Lutfiyatul A1Agus Z A2. Maryamah3Rizka W S4Rarasmaya I5Institut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberPerangkingan dokumen telah menjadi topik yang banyak dibahas pada sistem temu kembali informasi untuk memberikan urutan dokumen paling relevan berdasarkan kueri yang diberikan oleh pengguna. Namun, penelitian tentang perangkingan dokumen dalam bahasa Arab masih belum banyak dilakukan karena memiliki morfologi yang unik dan literatur dalam bahasa Arab yang masih sedikit. Selain itu, didalam proses perangkingan juga diperlukan perhitungan pembobotan kata yang optimal supaya dapat memberikan hasil yang sesuai. Pembobotan kata yang paling umum digunakan adalah term frequency-inverse document frequency (TF.IDF) yang hanya menghitung pembobotan setiap kata berdasarkan pengelompokan dokumen saja sehingga dapat menyebabkan relevansi antar dokumen menjadi rendah karena memiliki tingkat kemiripan antar dokumen yang berbeda. Oleh karena itu, diperlukan suatu pembobotan kata berdasarkan pengelompokan dokumen dalam suatu cluster untuk meningkatkan relevansi antar dokumen. Tujuan penelitian ini membuat metode perangkingan dokumen berbahasa Arab dengan menggunakan pembobotan berbasis cluster yang menggabungkan TF.IDF dan inverse cluster frequency (ICF) sehingga diperoleh TF.IDF.ICF. Evaluasi dilakukan menggunakan dokumen e-book berbahasa Arab yang telah dikelompokkan menjadi tiga cluster. Hasil penelitian membuktikan pembobotan TF.IDF.ICF mampu menemukan dokumen paling relevan terhadap kueri yang dimasukan oleh pengguna serta memperoleh nilai rata-rata precision dan F1-Measure yang lebih tinggi daripada hanya menggunakan pembobotan TF.IDF yaitu sebesar 68% dan 78%.http://publikasi.dinus.ac.id/index.php/technoc/article/view/4357perangkingan dokumen arab, tf.idf.icf, pembobotan kata berbasis cluster
spellingShingle Amelia Devi Putri Ariyanto
Lutfiyatul A
Agus Z A
. Maryamah
Rizka W S
Rarasmaya I
Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab
Techno.Com
perangkingan dokumen arab, tf.idf.icf, pembobotan kata berbasis cluster
title Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab
title_full Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab
title_fullStr Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab
title_full_unstemmed Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab
title_short Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab
title_sort metode pembobotan kata berbasis cluster untuk perangkingan dokumen berbahasa arab
topic perangkingan dokumen arab, tf.idf.icf, pembobotan kata berbasis cluster
url http://publikasi.dinus.ac.id/index.php/technoc/article/view/4357
work_keys_str_mv AT ameliadeviputriariyanto metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab
AT lutfiyatula metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab
AT agusza metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab
AT maryamah metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab
AT rizkaws metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab
AT rarasmayai metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab