Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab
Perangkingan dokumen telah menjadi topik yang banyak dibahas pada sistem temu kembali informasi untuk memberikan urutan dokumen paling relevan berdasarkan kueri yang diberikan oleh pengguna. Namun, penelitian tentang perangkingan dokumen dalam bahasa Arab masih belum banyak dilakukan karena memiliki...
Main Authors: | , , , , , |
---|---|
Format: | Article |
Language: | Indonesian |
Published: |
Universitas Dian Nuswantoro
2021-05-01
|
Series: | Techno.Com |
Subjects: | |
Online Access: | http://publikasi.dinus.ac.id/index.php/technoc/article/view/4357 |
_version_ | 1818340143453437952 |
---|---|
author | Amelia Devi Putri Ariyanto Lutfiyatul A Agus Z A . Maryamah Rizka W S Rarasmaya I |
author_facet | Amelia Devi Putri Ariyanto Lutfiyatul A Agus Z A . Maryamah Rizka W S Rarasmaya I |
author_sort | Amelia Devi Putri Ariyanto |
collection | DOAJ |
description | Perangkingan dokumen telah menjadi topik yang banyak dibahas pada sistem temu kembali informasi untuk memberikan urutan dokumen paling relevan berdasarkan kueri yang diberikan oleh pengguna. Namun, penelitian tentang perangkingan dokumen dalam bahasa Arab masih belum banyak dilakukan karena memiliki morfologi yang unik dan literatur dalam bahasa Arab yang masih sedikit. Selain itu, didalam proses perangkingan juga diperlukan perhitungan pembobotan kata yang optimal supaya dapat memberikan hasil yang sesuai. Pembobotan kata yang paling umum digunakan adalah term frequency-inverse document frequency (TF.IDF) yang hanya menghitung pembobotan setiap kata berdasarkan pengelompokan dokumen saja sehingga dapat menyebabkan relevansi antar dokumen menjadi rendah karena memiliki tingkat kemiripan antar dokumen yang berbeda. Oleh karena itu, diperlukan suatu pembobotan kata berdasarkan pengelompokan dokumen dalam suatu cluster untuk meningkatkan relevansi antar dokumen. Tujuan penelitian ini membuat metode perangkingan dokumen berbahasa Arab dengan menggunakan pembobotan berbasis cluster yang menggabungkan TF.IDF dan inverse cluster frequency (ICF) sehingga diperoleh TF.IDF.ICF. Evaluasi dilakukan menggunakan dokumen e-book berbahasa Arab yang telah dikelompokkan menjadi tiga cluster. Hasil penelitian membuktikan pembobotan TF.IDF.ICF mampu menemukan dokumen paling relevan terhadap kueri yang dimasukan oleh pengguna serta memperoleh nilai rata-rata precision dan F1-Measure yang lebih tinggi daripada hanya menggunakan pembobotan TF.IDF yaitu sebesar 68% dan 78%. |
first_indexed | 2024-12-13T15:38:13Z |
format | Article |
id | doaj.art-4ff8741034b2429aa72b4aec10566efb |
institution | Directory Open Access Journal |
issn | 2356-2579 2356-2579 |
language | Indonesian |
last_indexed | 2024-12-13T15:38:13Z |
publishDate | 2021-05-01 |
publisher | Universitas Dian Nuswantoro |
record_format | Article |
series | Techno.Com |
spelling | doaj.art-4ff8741034b2429aa72b4aec10566efb2022-12-21T23:39:56ZindUniversitas Dian NuswantoroTechno.Com2356-25792356-25792021-05-0120225926710.33633/tc.v20i2.43572039Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa ArabAmelia Devi Putri Ariyanto0Lutfiyatul A1Agus Z A2. Maryamah3Rizka W S4Rarasmaya I5Institut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberPerangkingan dokumen telah menjadi topik yang banyak dibahas pada sistem temu kembali informasi untuk memberikan urutan dokumen paling relevan berdasarkan kueri yang diberikan oleh pengguna. Namun, penelitian tentang perangkingan dokumen dalam bahasa Arab masih belum banyak dilakukan karena memiliki morfologi yang unik dan literatur dalam bahasa Arab yang masih sedikit. Selain itu, didalam proses perangkingan juga diperlukan perhitungan pembobotan kata yang optimal supaya dapat memberikan hasil yang sesuai. Pembobotan kata yang paling umum digunakan adalah term frequency-inverse document frequency (TF.IDF) yang hanya menghitung pembobotan setiap kata berdasarkan pengelompokan dokumen saja sehingga dapat menyebabkan relevansi antar dokumen menjadi rendah karena memiliki tingkat kemiripan antar dokumen yang berbeda. Oleh karena itu, diperlukan suatu pembobotan kata berdasarkan pengelompokan dokumen dalam suatu cluster untuk meningkatkan relevansi antar dokumen. Tujuan penelitian ini membuat metode perangkingan dokumen berbahasa Arab dengan menggunakan pembobotan berbasis cluster yang menggabungkan TF.IDF dan inverse cluster frequency (ICF) sehingga diperoleh TF.IDF.ICF. Evaluasi dilakukan menggunakan dokumen e-book berbahasa Arab yang telah dikelompokkan menjadi tiga cluster. Hasil penelitian membuktikan pembobotan TF.IDF.ICF mampu menemukan dokumen paling relevan terhadap kueri yang dimasukan oleh pengguna serta memperoleh nilai rata-rata precision dan F1-Measure yang lebih tinggi daripada hanya menggunakan pembobotan TF.IDF yaitu sebesar 68% dan 78%.http://publikasi.dinus.ac.id/index.php/technoc/article/view/4357perangkingan dokumen arab, tf.idf.icf, pembobotan kata berbasis cluster |
spellingShingle | Amelia Devi Putri Ariyanto Lutfiyatul A Agus Z A . Maryamah Rizka W S Rarasmaya I Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab Techno.Com perangkingan dokumen arab, tf.idf.icf, pembobotan kata berbasis cluster |
title | Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab |
title_full | Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab |
title_fullStr | Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab |
title_full_unstemmed | Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab |
title_short | Metode Pembobotan Kata Berbasis Cluster Untuk Perangkingan Dokumen Berbahasa Arab |
title_sort | metode pembobotan kata berbasis cluster untuk perangkingan dokumen berbahasa arab |
topic | perangkingan dokumen arab, tf.idf.icf, pembobotan kata berbasis cluster |
url | http://publikasi.dinus.ac.id/index.php/technoc/article/view/4357 |
work_keys_str_mv | AT ameliadeviputriariyanto metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab AT lutfiyatula metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab AT agusza metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab AT maryamah metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab AT rizkaws metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab AT rarasmayai metodepembobotankataberbasisclusteruntukperangkingandokumenberbahasaarab |