Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah

Munculnya media sosial mendorong pemerintah untuk memanfaatkan media sosial sebagai sarana penyebaran informasi. Informasi yang diberikan haruslah bermanfaat bagi masyarakat dalam rangka meningkatkan hubungan government to citizen. Klasifikasi terhadap unggahan media sosial pemerintah daerah dapat d...

Full description

Bibliographic Details
Main Authors: Pande Made Risky Cahya Dinatha, Nur Aini Rakhmawati
Format: Article
Language:English
Published: Universitas Gadjah Mada 2020-05-01
Series:Jurnal Nasional Teknik Elektro dan Teknologi Informasi
Subjects:
Online Access:https://jurnal.ugm.ac.id/v3/JNTETI/article/view/90
_version_ 1818380094012391424
author Pande Made Risky Cahya Dinatha
Nur Aini Rakhmawati
author_facet Pande Made Risky Cahya Dinatha
Nur Aini Rakhmawati
author_sort Pande Made Risky Cahya Dinatha
collection DOAJ
description Munculnya media sosial mendorong pemerintah untuk memanfaatkan media sosial sebagai sarana penyebaran informasi. Informasi yang diberikan haruslah bermanfaat bagi masyarakat dalam rangka meningkatkan hubungan government to citizen. Klasifikasi terhadap unggahan media sosial pemerintah daerah dapat dilakukan untuk mengetahui jenis informasi yang diunggah. Penelitian klasifikasi unggahan media sosial pada studi kasus pemerintah daerah di Indonesia telah berhasil dilakukan, tetapi pengolahan teks untuk membangun model klasifikasinya masih dapat dieksplorasi. Metode pengolahan teks yang dibahas di dalam makalah ini adalah term weighting dan word embedding. Tujuan makalah ini adalah membandingkan term weighting term frequency-inverse document frequency, Okapi BM25, dan word embedding doc2vec dalam menghasilkan fitur untuk mengatasi masalah klasifikasi teks pendek. Makalah ini merepresentasikan teks sebagai fitur untuk melakukan klasifikasi, mengetahui kinerja model klasifikasi yang telah menerapkan teknik tersebut, dan membandingkan kinerja setiap model klasifikasi untuk mengetahui metode terbaik di dalam studi kasus klasifikasi unggahan media sosial pemerintah daerah di Indonesia. Terdapat enam kelas untuk mengklasifikasi 1.000 teks pendek dari 91 akun pemda. Pengukuran precision, recall, f-1, macro-average, micro-average, dan AUC dilakukan pada masing-masing model. Hasil menunjukkan bahwa model TF-IDF bersama SVM linear memberikan hasil yang lebih baik dibandingkan logistic regression dengan skor 0,572 dan 0,766 pada pengukuran macro-average recall dan micro-average recall.
first_indexed 2024-12-14T02:13:13Z
format Article
id doaj.art-2de894c4c3034895a45a58fb84dcdf8d
institution Directory Open Access Journal
issn 2301-4156
2460-5719
language English
last_indexed 2024-12-14T02:13:13Z
publishDate 2020-05-01
publisher Universitas Gadjah Mada
record_format Article
series Jurnal Nasional Teknik Elektro dan Teknologi Informasi
spelling doaj.art-2de894c4c3034895a45a58fb84dcdf8d2022-12-21T23:20:43ZengUniversitas Gadjah MadaJurnal Nasional Teknik Elektro dan Teknologi Informasi2301-41562460-57192020-05-019215516110.22146/jnteti.v9i2.9090Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah DaerahPande Made Risky Cahya Dinatha0Nur Aini Rakhmawati1Sepuluh Nopember Institute of TechnologySepuluh Nopember Institute of TechnologyMunculnya media sosial mendorong pemerintah untuk memanfaatkan media sosial sebagai sarana penyebaran informasi. Informasi yang diberikan haruslah bermanfaat bagi masyarakat dalam rangka meningkatkan hubungan government to citizen. Klasifikasi terhadap unggahan media sosial pemerintah daerah dapat dilakukan untuk mengetahui jenis informasi yang diunggah. Penelitian klasifikasi unggahan media sosial pada studi kasus pemerintah daerah di Indonesia telah berhasil dilakukan, tetapi pengolahan teks untuk membangun model klasifikasinya masih dapat dieksplorasi. Metode pengolahan teks yang dibahas di dalam makalah ini adalah term weighting dan word embedding. Tujuan makalah ini adalah membandingkan term weighting term frequency-inverse document frequency, Okapi BM25, dan word embedding doc2vec dalam menghasilkan fitur untuk mengatasi masalah klasifikasi teks pendek. Makalah ini merepresentasikan teks sebagai fitur untuk melakukan klasifikasi, mengetahui kinerja model klasifikasi yang telah menerapkan teknik tersebut, dan membandingkan kinerja setiap model klasifikasi untuk mengetahui metode terbaik di dalam studi kasus klasifikasi unggahan media sosial pemerintah daerah di Indonesia. Terdapat enam kelas untuk mengklasifikasi 1.000 teks pendek dari 91 akun pemda. Pengukuran precision, recall, f-1, macro-average, micro-average, dan AUC dilakukan pada masing-masing model. Hasil menunjukkan bahwa model TF-IDF bersama SVM linear memberikan hasil yang lebih baik dibandingkan logistic regression dengan skor 0,572 dan 0,766 pada pengukuran macro-average recall dan micro-average recall.https://jurnal.ugm.ac.id/v3/JNTETI/article/view/90classificationterm weightingword embeddingsocial mediashort texttwitter
spellingShingle Pande Made Risky Cahya Dinatha
Nur Aini Rakhmawati
Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah
Jurnal Nasional Teknik Elektro dan Teknologi Informasi
classification
term weighting
word embedding
social media
short text
twitter
title Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah
title_full Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah
title_fullStr Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah
title_full_unstemmed Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah
title_short Komparasi Term Weighting dan Word Embedding pada Klasifikasi Tweet Pemerintah Daerah
title_sort komparasi term weighting dan word embedding pada klasifikasi tweet pemerintah daerah
topic classification
term weighting
word embedding
social media
short text
twitter
url https://jurnal.ugm.ac.id/v3/JNTETI/article/view/90
work_keys_str_mv AT pandemaderiskycahyadinatha komparasitermweightingdanwordembeddingpadaklasifikasitweetpemerintahdaerah
AT nurainirakhmawati komparasitermweightingdanwordembeddingpadaklasifikasitweetpemerintahdaerah