Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di Twitter

Perkembangan teknologi dan internet membawa ancaman besar terkait dengan privasi dan keamanan data pribadi. Pada bulan September 2022, terdapat insiden bocornya 1,3 miliar data pendaftaran kartu identitas ponsel atau kartu SIM yang berisi data pribadi pengguna di situs gelap. Twitter sebagai salah s...

Full description

Bibliographic Details
Main Authors: Muh Ichlasul Amal, Elsa Syafira Rahmasita, Edward Suryaputra, Nur Aini Rakhmawati
Format: Article
Language:English
Published: Universitas Kristen Maranatha 2022-12-01
Series:JuTISI (Jurnal Teknik Informatika dan Sistem Informasi)
Subjects:
Online Access:https://journal.maranatha.edu/index.php/jutisi/article/view/5483
_version_ 1797653277464068096
author Muh Ichlasul Amal
Elsa Syafira Rahmasita
Edward Suryaputra
Nur Aini Rakhmawati
author_facet Muh Ichlasul Amal
Elsa Syafira Rahmasita
Edward Suryaputra
Nur Aini Rakhmawati
author_sort Muh Ichlasul Amal
collection DOAJ
description Perkembangan teknologi dan internet membawa ancaman besar terkait dengan privasi dan keamanan data pribadi. Pada bulan September 2022, terdapat insiden bocornya 1,3 miliar data pendaftaran kartu identitas ponsel atau kartu SIM yang berisi data pribadi pengguna di situs gelap. Twitter sebagai salah satu media sosial terpopuler di Indonesia menjadi tempat masyarakat Indonesia menyuarakan opininya terkait isu kebocoran data tersebut. Penelitian ini bertujuan untuk mencari tahu sebaran kata dan analisis klasifikasi sentimen dari opini masyarakat di Twitter terkait dengan isu tersebut. Analisis klasifikasi sentimen dilakukan menggunakan pendekatan machine learning dengan empat metode, yaitu Random Forest, Logistic Regresssion, Support-Vector Machine, dan model IndoBERT. Keempat metode tersebut akan dibandingkan untuk melihat model mana yang menghasilkan performa terbaik dalam mendeteksi sentimen. Dari proses crawling, didapatkan 957 tweet, di mana 609 tweet diberi label dan akan dilatih menggunakan empat metode tersebut. Dari data yang didapatkan, terdapat ketidakseimbangan antar kelas, di mana sentimen positif memiliki jumlah yang jauh lebih sedikti dibandingkan sentimen negatif dan netral. Beberapa kata yang sering digunakan dalam data tweet yang diambil adalah sim card, data sim, bocor data, miliar data, dan kominfo. Hasil pembangunan model menunjukkan algoritma Support-Vector Machine memiliki performa terbaik dengan nilai f1-score 0.81, dilanjutkan dengan Random Forest sebesar 0.78, IndoBERT sebesar 0.76, dan Logistic Regression sebesar 0.74. Ketidakseimbangan kelas dan kurangnya data latih membuat performa IndoBERT sebagai salah satu state-of-the-art dalam NLP memiliki performa yang rendah dibandingkan algoritma lainnya. Hasil dari penelitian ini dapat digunakan pihak berwenang untuk mengevaluasi kebijakan dalam menangani isu keamanan data dengan mendengarkan opini dari masyarakat Indonesia.
first_indexed 2024-03-11T16:42:20Z
format Article
id doaj.art-6ebf268f633141ffb7bb9fa57fe85c1a
institution Directory Open Access Journal
issn 2443-2210
2443-2229
language English
last_indexed 2024-03-11T16:42:20Z
publishDate 2022-12-01
publisher Universitas Kristen Maranatha
record_format Article
series JuTISI (Jurnal Teknik Informatika dan Sistem Informasi)
spelling doaj.art-6ebf268f633141ffb7bb9fa57fe85c1a2023-10-23T08:40:54ZengUniversitas Kristen MaranathaJuTISI (Jurnal Teknik Informatika dan Sistem Informasi)2443-22102443-22292022-12-0183645 – 660645 – 66010.28932/jutisi.v8i3.54835059Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di TwitterMuh Ichlasul Amal0Elsa Syafira Rahmasita1Edward Suryaputra2Nur Aini Rakhmawati3Institut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberInstitut Teknologi Sepuluh NopemberPerkembangan teknologi dan internet membawa ancaman besar terkait dengan privasi dan keamanan data pribadi. Pada bulan September 2022, terdapat insiden bocornya 1,3 miliar data pendaftaran kartu identitas ponsel atau kartu SIM yang berisi data pribadi pengguna di situs gelap. Twitter sebagai salah satu media sosial terpopuler di Indonesia menjadi tempat masyarakat Indonesia menyuarakan opininya terkait isu kebocoran data tersebut. Penelitian ini bertujuan untuk mencari tahu sebaran kata dan analisis klasifikasi sentimen dari opini masyarakat di Twitter terkait dengan isu tersebut. Analisis klasifikasi sentimen dilakukan menggunakan pendekatan machine learning dengan empat metode, yaitu Random Forest, Logistic Regresssion, Support-Vector Machine, dan model IndoBERT. Keempat metode tersebut akan dibandingkan untuk melihat model mana yang menghasilkan performa terbaik dalam mendeteksi sentimen. Dari proses crawling, didapatkan 957 tweet, di mana 609 tweet diberi label dan akan dilatih menggunakan empat metode tersebut. Dari data yang didapatkan, terdapat ketidakseimbangan antar kelas, di mana sentimen positif memiliki jumlah yang jauh lebih sedikti dibandingkan sentimen negatif dan netral. Beberapa kata yang sering digunakan dalam data tweet yang diambil adalah sim card, data sim, bocor data, miliar data, dan kominfo. Hasil pembangunan model menunjukkan algoritma Support-Vector Machine memiliki performa terbaik dengan nilai f1-score 0.81, dilanjutkan dengan Random Forest sebesar 0.78, IndoBERT sebesar 0.76, dan Logistic Regression sebesar 0.74. Ketidakseimbangan kelas dan kurangnya data latih membuat performa IndoBERT sebagai salah satu state-of-the-art dalam NLP memiliki performa yang rendah dibandingkan algoritma lainnya. Hasil dari penelitian ini dapat digunakan pihak berwenang untuk mengevaluasi kebijakan dalam menangani isu keamanan data dengan mendengarkan opini dari masyarakat Indonesia.https://journal.maranatha.edu/index.php/jutisi/article/view/5483indobertkebocoran data kartu simlogistic regressionrandom forestsupport-vector machine.
spellingShingle Muh Ichlasul Amal
Elsa Syafira Rahmasita
Edward Suryaputra
Nur Aini Rakhmawati
Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di Twitter
JuTISI (Jurnal Teknik Informatika dan Sistem Informasi)
indobert
kebocoran data kartu sim
logistic regression
random forest
support-vector machine.
title Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di Twitter
title_full Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di Twitter
title_fullStr Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di Twitter
title_full_unstemmed Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di Twitter
title_short Analisis Klasifikasi Sentimen Terhadap Isu Kebocoran Data Kartu Identitas Ponsel di Twitter
title_sort analisis klasifikasi sentimen terhadap isu kebocoran data kartu identitas ponsel di twitter
topic indobert
kebocoran data kartu sim
logistic regression
random forest
support-vector machine.
url https://journal.maranatha.edu/index.php/jutisi/article/view/5483
work_keys_str_mv AT muhichlasulamal analisisklasifikasisentimenterhadapisukebocorandatakartuidentitasponselditwitter
AT elsasyafirarahmasita analisisklasifikasisentimenterhadapisukebocorandatakartuidentitasponselditwitter
AT edwardsuryaputra analisisklasifikasisentimenterhadapisukebocorandatakartuidentitasponselditwitter
AT nurainirakhmawati analisisklasifikasisentimenterhadapisukebocorandatakartuidentitasponselditwitter