Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah
Munculnya media sosial mendorong pemerintah untuk memanfaatkan media sosial sebagai sarana penyebaran informasi. Informasi yang diberikan haruslah bermanfaat bagi masyarakat dalam rangka meningkatkan hubungan government to citizen. Klasifikasi terhadap unggahan media sosial pemerintah daerah dapat d...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Universitas Gadjah Mada
2020-05-01
|
Series: | Jurnal Nasional Teknik Elektro dan Teknologi Informasi |
Subjects: | |
Online Access: | https://jurnal.ugm.ac.id/v3/JNTETI/article/view/90 |
_version_ | 1818380094012391424 |
---|---|
author | Pande Made Risky Cahya Dinatha Nur Aini Rakhmawati |
author_facet | Pande Made Risky Cahya Dinatha Nur Aini Rakhmawati |
author_sort | Pande Made Risky Cahya Dinatha |
collection | DOAJ |
description | Munculnya media sosial mendorong pemerintah untuk memanfaatkan media sosial sebagai sarana penyebaran informasi. Informasi yang diberikan haruslah bermanfaat bagi masyarakat dalam rangka meningkatkan hubungan government to citizen. Klasifikasi terhadap unggahan media sosial pemerintah daerah dapat dilakukan untuk mengetahui jenis informasi yang diunggah. Penelitian klasifikasi unggahan media sosial pada studi kasus pemerintah daerah di Indonesia telah berhasil dilakukan, tetapi pengolahan teks untuk membangun model klasifikasinya masih dapat dieksplorasi. Metode pengolahan teks yang dibahas di dalam makalah ini adalah term weighting dan word embedding. Tujuan makalah ini adalah membandingkan term weighting term frequency-inverse document frequency, Okapi BM25, dan word embedding doc2vec dalam menghasilkan fitur untuk mengatasi masalah klasifikasi teks pendek. Makalah ini merepresentasikan teks sebagai fitur untuk melakukan klasifikasi, mengetahui kinerja model klasifikasi yang telah menerapkan teknik tersebut, dan membandingkan kinerja setiap model klasifikasi untuk mengetahui metode terbaik di dalam studi kasus klasifikasi unggahan media sosial pemerintah daerah di Indonesia. Terdapat enam kelas untuk mengklasifikasi 1.000 teks pendek dari 91 akun pemda. Pengukuran precision, recall, f-1, macro-average, micro-average, dan AUC dilakukan pada masing-masing model. Hasil menunjukkan bahwa model TF-IDF bersama SVM linear memberikan hasil yang lebih baik dibandingkan logistic regression dengan skor 0,572 dan 0,766 pada pengukuran macro-average recall dan micro-average recall. |
first_indexed | 2024-12-14T02:13:13Z |
format | Article |
id | doaj.art-2de894c4c3034895a45a58fb84dcdf8d |
institution | Directory Open Access Journal |
issn | 2301-4156 2460-5719 |
language | English |
last_indexed | 2024-12-14T02:13:13Z |
publishDate | 2020-05-01 |
publisher | Universitas Gadjah Mada |
record_format | Article |
series | Jurnal Nasional Teknik Elektro dan Teknologi Informasi |
spelling | doaj.art-2de894c4c3034895a45a58fb84dcdf8d2022-12-21T23:20:43ZengUniversitas Gadjah MadaJurnal Nasional Teknik Elektro dan Teknologi Informasi2301-41562460-57192020-05-019215516110.22146/jnteti.v9i2.9090Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah DaerahPande Made Risky Cahya Dinatha0Nur Aini Rakhmawati1Sepuluh Nopember Institute of TechnologySepuluh Nopember Institute of TechnologyMunculnya media sosial mendorong pemerintah untuk memanfaatkan media sosial sebagai sarana penyebaran informasi. Informasi yang diberikan haruslah bermanfaat bagi masyarakat dalam rangka meningkatkan hubungan government to citizen. Klasifikasi terhadap unggahan media sosial pemerintah daerah dapat dilakukan untuk mengetahui jenis informasi yang diunggah. Penelitian klasifikasi unggahan media sosial pada studi kasus pemerintah daerah di Indonesia telah berhasil dilakukan, tetapi pengolahan teks untuk membangun model klasifikasinya masih dapat dieksplorasi. Metode pengolahan teks yang dibahas di dalam makalah ini adalah term weighting dan word embedding. Tujuan makalah ini adalah membandingkan term weighting term frequency-inverse document frequency, Okapi BM25, dan word embedding doc2vec dalam menghasilkan fitur untuk mengatasi masalah klasifikasi teks pendek. Makalah ini merepresentasikan teks sebagai fitur untuk melakukan klasifikasi, mengetahui kinerja model klasifikasi yang telah menerapkan teknik tersebut, dan membandingkan kinerja setiap model klasifikasi untuk mengetahui metode terbaik di dalam studi kasus klasifikasi unggahan media sosial pemerintah daerah di Indonesia. Terdapat enam kelas untuk mengklasifikasi 1.000 teks pendek dari 91 akun pemda. Pengukuran precision, recall, f-1, macro-average, micro-average, dan AUC dilakukan pada masing-masing model. Hasil menunjukkan bahwa model TF-IDF bersama SVM linear memberikan hasil yang lebih baik dibandingkan logistic regression dengan skor 0,572 dan 0,766 pada pengukuran macro-average recall dan micro-average recall.https://jurnal.ugm.ac.id/v3/JNTETI/article/view/90classificationterm weightingword embeddingsocial mediashort texttwitter |
spellingShingle | Pande Made Risky Cahya Dinatha Nur Aini Rakhmawati Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah Jurnal Nasional Teknik Elektro dan Teknologi Informasi classification term weighting word embedding social media short text |
title | Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah |
title_full | Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah |
title_fullStr | Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah |
title_full_unstemmed | Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah |
title_short | Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah |
title_sort | komparasi term weighting dan word embedding pada klasifikasi tweet pemerintah daerah |
topic | classification term weighting word embedding social media short text |
url | https://jurnal.ugm.ac.id/v3/JNTETI/article/view/90 |
work_keys_str_mv | AT pandemaderiskycahyadinatha komparasitermweightingdanwordembeddingpadaklasifikasitweetpemerintahdaerah AT nurainirakhmawati komparasitermweightingdanwordembeddingpadaklasifikasitweetpemerintahdaerah |