PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA
Ringkasan berita diartikan sebagai teks yang dihasilkan dari satu atau lebih kalimat yang menyampaikan informasi penting dari berita. Salah satu fase penting dalam peringkasan adalah pembobotan kalimat (sentence scoring). Dimana pada peringkasan berita, metode pembobotannya sebagian besar menggunaka...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Institut Teknologi Sepuluh Nopember
2015-01-01
|
Series: | JUTI: Jurnal Ilmiah Teknologi Informasi |
Online Access: | http://juti.if.its.ac.id/index.php/juti/article/view/386 |
_version_ | 1818647157161328640 |
---|---|
author | Nur Hayatin Chastine Fatichah Diana Purwitasari |
author_facet | Nur Hayatin Chastine Fatichah Diana Purwitasari |
author_sort | Nur Hayatin |
collection | DOAJ |
description | Ringkasan berita diartikan sebagai teks yang dihasilkan dari satu atau lebih kalimat yang menyampaikan informasi penting dari berita. Salah satu fase penting dalam peringkasan adalah pembobotan kalimat (sentence scoring). Dimana pada peringkasan berita, metode pembobotannya sebagian besar menggunakan fitur dari berita sendiri. Padahal dalam satu topik berita dimungkinkan adanya multiple issue. Dari multiple issue biasanya hanya ada satu isu yang menjadi pokok pembicaraan yang disebut dengan Trending Issue. Trending Issue inilah yang harusnya dipertimbangkan pada proses peringkasan berita sehingga ringkasan yang dihasilkan lebih koheren.
Penelitian ini bertujuan untuk meringkas multi berita menggunakan metode pembobotan berdasarkan Trending Issue dengan tetap mempertimbangkan fitur penting berita, yaitu word frequency, TF-IDF, posisi kalimat, dan kemiripan kalimat terhadap judul (NeFTIS). Dimana Trending Issue didapatkan dari data Twitter dengan cara mengelompokkan tweets kemudian melakukan ekstraksi isu pada tiap kelompok yang terbentuk. Selanjutnya tiap isu diberikan bobot menggunakan konsep Cluster Importance (CI). Isu dengan bobot terbesar yang akan dipilih sebagai Trending Issue.
Ada 5 tahap yang dilakukan untuk menghasilkan ringkasan multi berita dengan menggunakan NeFTIS, yaitu ekstraksi Trending Issue, seleksi berita, ekstraksi fitur berita, penghitungan total bobot kalimat, dan penyusunan ringkasan. Untuk mengukur kualitas sistem digunakan metode evaluasi ROUGE-1 dengan menganalisa performa dari hasil ringkasan dengan menggunakan metode pembobotan NeFTIS dibandingkan dengan hasil ringkasan dengan hanya menggunakan fitur berita (NeFS). Hasil rata-rata max-ROUGE-1 untuk seluruh variasi jumlah kalimat yang menyusun ringkasan (n) menunjukan bahwa metode pembobotan NeFTIS lebih akurat dibanding dengan metode pembobotan NeFS dengan nilai rata-rata max-ROUGE-1 terbesar 0.8201 untuk n=30. |
first_indexed | 2024-12-17T00:58:04Z |
format | Article |
id | doaj.art-713ab1edde9c4edaaaac2356f01e0f9b |
institution | Directory Open Access Journal |
issn | 1412-6389 2406-8535 |
language | English |
last_indexed | 2024-12-17T00:58:04Z |
publishDate | 2015-01-01 |
publisher | Institut Teknologi Sepuluh Nopember |
record_format | Article |
series | JUTI: Jurnal Ilmiah Teknologi Informasi |
spelling | doaj.art-713ab1edde9c4edaaaac2356f01e0f9b2022-12-21T22:09:33ZengInstitut Teknologi Sepuluh NopemberJUTI: Jurnal Ilmiah Teknologi Informasi1412-63892406-85352015-01-01131384410.12962/j24068535.v13i1.a386294PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITANur HayatinChastine FatichahDiana PurwitasariRingkasan berita diartikan sebagai teks yang dihasilkan dari satu atau lebih kalimat yang menyampaikan informasi penting dari berita. Salah satu fase penting dalam peringkasan adalah pembobotan kalimat (sentence scoring). Dimana pada peringkasan berita, metode pembobotannya sebagian besar menggunakan fitur dari berita sendiri. Padahal dalam satu topik berita dimungkinkan adanya multiple issue. Dari multiple issue biasanya hanya ada satu isu yang menjadi pokok pembicaraan yang disebut dengan Trending Issue. Trending Issue inilah yang harusnya dipertimbangkan pada proses peringkasan berita sehingga ringkasan yang dihasilkan lebih koheren. Penelitian ini bertujuan untuk meringkas multi berita menggunakan metode pembobotan berdasarkan Trending Issue dengan tetap mempertimbangkan fitur penting berita, yaitu word frequency, TF-IDF, posisi kalimat, dan kemiripan kalimat terhadap judul (NeFTIS). Dimana Trending Issue didapatkan dari data Twitter dengan cara mengelompokkan tweets kemudian melakukan ekstraksi isu pada tiap kelompok yang terbentuk. Selanjutnya tiap isu diberikan bobot menggunakan konsep Cluster Importance (CI). Isu dengan bobot terbesar yang akan dipilih sebagai Trending Issue. Ada 5 tahap yang dilakukan untuk menghasilkan ringkasan multi berita dengan menggunakan NeFTIS, yaitu ekstraksi Trending Issue, seleksi berita, ekstraksi fitur berita, penghitungan total bobot kalimat, dan penyusunan ringkasan. Untuk mengukur kualitas sistem digunakan metode evaluasi ROUGE-1 dengan menganalisa performa dari hasil ringkasan dengan menggunakan metode pembobotan NeFTIS dibandingkan dengan hasil ringkasan dengan hanya menggunakan fitur berita (NeFS). Hasil rata-rata max-ROUGE-1 untuk seluruh variasi jumlah kalimat yang menyusun ringkasan (n) menunjukan bahwa metode pembobotan NeFTIS lebih akurat dibanding dengan metode pembobotan NeFS dengan nilai rata-rata max-ROUGE-1 terbesar 0.8201 untuk n=30.http://juti.if.its.ac.id/index.php/juti/article/view/386 |
spellingShingle | Nur Hayatin Chastine Fatichah Diana Purwitasari PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA JUTI: Jurnal Ilmiah Teknologi Informasi |
title | PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA |
title_full | PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA |
title_fullStr | PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA |
title_full_unstemmed | PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA |
title_short | PEMBOBOTAN KALIMAT BERDASARKAN FITUR BERITA DAN TRENDING ISSUE UNTUK PERINGKASAN MULTI DOKUMEN BERITA |
title_sort | pembobotan kalimat berdasarkan fitur berita dan trending issue untuk peringkasan multi dokumen berita |
url | http://juti.if.its.ac.id/index.php/juti/article/view/386 |
work_keys_str_mv | AT nurhayatin pembobotankalimatberdasarkanfiturberitadantrendingissueuntukperingkasanmultidokumenberita AT chastinefatichah pembobotankalimatberdasarkanfiturberitadantrendingissueuntukperingkasanmultidokumenberita AT dianapurwitasari pembobotankalimatberdasarkanfiturberitadantrendingissueuntukperingkasanmultidokumenberita |