Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25

Penggunaan internet sebagai sumber informasi telah membawa manusia pada era one click away. Apa pun bisa diakses di mana pun kapan pun, baik secara visual maupun tidak. Namun, tidak semua informasi yang diakses selalu sesuai dengan konteks yang diinginkan. Untuk memudahkan pengguna internet dalam me...

Full description

Bibliographic Details
Main Authors: Yurdha Fadhila Hernawan, Putra Pandu Adikara, Randy Cahya Wihandika
Format: Article
Language:Indonesian
Published: University of Brawijaya 2022-02-01
Series:Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:https://jtiik.ub.ac.id/index.php/jtiik/article/view/3765
_version_ 1797194592369508352
author Yurdha Fadhila Hernawan
Putra Pandu Adikara
Randy Cahya Wihandika
author_facet Yurdha Fadhila Hernawan
Putra Pandu Adikara
Randy Cahya Wihandika
author_sort Yurdha Fadhila Hernawan
collection DOAJ
description Penggunaan internet sebagai sumber informasi telah membawa manusia pada era one click away. Apa pun bisa diakses di mana pun kapan pun, baik secara visual maupun tidak. Namun, tidak semua informasi yang diakses selalu sesuai dengan konteks yang diinginkan. Untuk memudahkan pengguna internet dalam mendapatkan informasi yang ringkas dengan tidak merusak atau menghilangkan informasi penting, maka dibutuhkan suatu peringkasan otomatis. Salah satu cara untuk mendapatkan ringkasan pada sebuah dokumen adalah dengan mencari kumpulan kalimat penting pada dokumen yang dapat merepresentasikan dokumen asli secara keseluruhan. Metode peringkasan tersebut disebut juga dengan peringkasan ekstraktif. Pada penelitian ini, peringkasan ekstraktif dilakukan dengan memeringkatkan setiap kalimat pada sebuah dokumen dan mengambil kalimat dengan peringkat teratas sebagai ringkasan. Metode TextRank yang digunakan pada penelitian ini merepresentasikan dokumen sebagai graf, setiap kalimat dianggap sebagai node dan hubungan antara kalimat (node) merupakan nilai similarity antar kalimat. Fungsi similarity yang digunakan adalah BM25 dengan metode pemeringkatan PageRank. Panjang ringkasan yang dihasilkan sistem disesuaikan dengan besar nilai compression rate yang digunakan. Setelah membandingkan hasil ringkasan yang didapatkan sistem peringkasan otomatis dengan hasil ringkasan yang didapatkan dari expert (pakar) sebanyak 10 dokumen, penelitian ini berhasil dilakukan dengan kualitas ringkasan terbaik didapatkan pada saat penggunaan compression rate sebesar 30% dengan nilai rata-rata precision, recall, dan f-measure secara berturut-turut adalah 0,552; 0,552; dan 0,552.   Abstract The use of the internet as a source of information has brought humans to a oneclick era. Anything can be accessed anywhere, visually or not. However, every information accessed is not always match with the context itself. An automatic summarization is needed to help people to get the concise informations without ruin the context and missing the point. One way to get a summarize of the document is to find a collection of important sentences in the document that can represent the original document as a whole. That automatic text summarization method is also called extractive summarize. In this study, extractive summarization is done by checking each sentence in a document and ranking the important sentences. The TextRank method used in this study will represent the document as a graph, each sentence will be considered as a node and the relationship between sentences (nodes) is the value of similarity between sentences. The similarity function used is BM25 with the PageRank as ranking method. The resulting length of the system will be adjusted to the value of the level of compression used. After comparing the summarization result between the automatic system and an expert of 10 documents, this research is successfully carried out with the best quality is obtained when using a compression rate of 30% with an average value of precision, recall, and f-measure is 0.552; 0.552; and 0.552.   
first_indexed 2024-04-24T05:58:44Z
format Article
id doaj.art-6c7a35ebcddf4697ad229e51279f74f3
institution Directory Open Access Journal
issn 2355-7699
2528-6579
language Indonesian
last_indexed 2024-04-24T05:58:44Z
publishDate 2022-02-01
publisher University of Brawijaya
record_format Article
series Jurnal Teknologi Informasi dan Ilmu Komputer
spelling doaj.art-6c7a35ebcddf4697ad229e51279f74f32024-04-23T08:47:21ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792022-02-019110.25126/jtiik.2022913765843Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25Yurdha Fadhila Hernawan0Putra Pandu Adikara1Randy Cahya Wihandika2Universitas Brawijaya, MalangUniversitas Brawijaya, MalangUniversitas Brawijaya, MalangPenggunaan internet sebagai sumber informasi telah membawa manusia pada era one click away. Apa pun bisa diakses di mana pun kapan pun, baik secara visual maupun tidak. Namun, tidak semua informasi yang diakses selalu sesuai dengan konteks yang diinginkan. Untuk memudahkan pengguna internet dalam mendapatkan informasi yang ringkas dengan tidak merusak atau menghilangkan informasi penting, maka dibutuhkan suatu peringkasan otomatis. Salah satu cara untuk mendapatkan ringkasan pada sebuah dokumen adalah dengan mencari kumpulan kalimat penting pada dokumen yang dapat merepresentasikan dokumen asli secara keseluruhan. Metode peringkasan tersebut disebut juga dengan peringkasan ekstraktif. Pada penelitian ini, peringkasan ekstraktif dilakukan dengan memeringkatkan setiap kalimat pada sebuah dokumen dan mengambil kalimat dengan peringkat teratas sebagai ringkasan. Metode TextRank yang digunakan pada penelitian ini merepresentasikan dokumen sebagai graf, setiap kalimat dianggap sebagai node dan hubungan antara kalimat (node) merupakan nilai similarity antar kalimat. Fungsi similarity yang digunakan adalah BM25 dengan metode pemeringkatan PageRank. Panjang ringkasan yang dihasilkan sistem disesuaikan dengan besar nilai compression rate yang digunakan. Setelah membandingkan hasil ringkasan yang didapatkan sistem peringkasan otomatis dengan hasil ringkasan yang didapatkan dari expert (pakar) sebanyak 10 dokumen, penelitian ini berhasil dilakukan dengan kualitas ringkasan terbaik didapatkan pada saat penggunaan compression rate sebesar 30% dengan nilai rata-rata precision, recall, dan f-measure secara berturut-turut adalah 0,552; 0,552; dan 0,552.   Abstract The use of the internet as a source of information has brought humans to a oneclick era. Anything can be accessed anywhere, visually or not. However, every information accessed is not always match with the context itself. An automatic summarization is needed to help people to get the concise informations without ruin the context and missing the point. One way to get a summarize of the document is to find a collection of important sentences in the document that can represent the original document as a whole. That automatic text summarization method is also called extractive summarize. In this study, extractive summarization is done by checking each sentence in a document and ranking the important sentences. The TextRank method used in this study will represent the document as a graph, each sentence will be considered as a node and the relationship between sentences (nodes) is the value of similarity between sentences. The similarity function used is BM25 with the PageRank as ranking method. The resulting length of the system will be adjusted to the value of the level of compression used. After comparing the summarization result between the automatic system and an expert of 10 documents, this research is successfully carried out with the best quality is obtained when using a compression rate of 30% with an average value of precision, recall, and f-measure is 0.552; 0.552; and 0.552.    https://jtiik.ub.ac.id/index.php/jtiik/article/view/3765
spellingShingle Yurdha Fadhila Hernawan
Putra Pandu Adikara
Randy Cahya Wihandika
Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25
Jurnal Teknologi Informasi dan Ilmu Komputer
title Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25
title_full Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25
title_fullStr Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25
title_full_unstemmed Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25
title_short Peringkasan Artikel Berbahasa Indonesia Menggunakan TextRank dengan Pembobotan BM25
title_sort peringkasan artikel berbahasa indonesia menggunakan textrank dengan pembobotan bm25
url https://jtiik.ub.ac.id/index.php/jtiik/article/view/3765
work_keys_str_mv AT yurdhafadhilahernawan peringkasanartikelberbahasaindonesiamenggunakantextrankdenganpembobotanbm25
AT putrapanduadikara peringkasanartikelberbahasaindonesiamenggunakantextrankdenganpembobotanbm25
AT randycahyawihandika peringkasanartikelberbahasaindonesiamenggunakantextrankdenganpembobotanbm25