Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata

Penelitian ini bertujuan untuk memberikan alternatif dalam menguji kemiripan makna antar 2 kalimat. Pembentukan database sinonim kata dilakukan dengan mengelompokkan kata berdasar sinonim atau yang memiliki kesamaan arti. Masing-masing kelompok kata diberikan ID unik. Selanjutnya setiap kelompok kat...

Full description

Bibliographic Details
Main Authors:	Ardi Sanjaya, Ahmad Bagus Setiawan, Umi Mahdiyah, Intan Nur Farida, Aprisa Risky Prasetyo
Format:	Article
Language:	Indonesian
Published:	University of Brawijaya 2023-08-01
Series:	Jurnal Teknologi Informasi dan Ilmu Komputer
Online Access:	https://jtiik.ub.ac.id/index.php/jtiik/article/view/6864

_version_	1797194601232072704
author	Ardi Sanjaya Ahmad Bagus Setiawan Umi Mahdiyah Intan Nur Farida Aprisa Risky Prasetyo
author_facet	Ardi Sanjaya Ahmad Bagus Setiawan Umi Mahdiyah Intan Nur Farida Aprisa Risky Prasetyo
author_sort	Ardi Sanjaya
collection	DOAJ
description	Penelitian ini bertujuan untuk memberikan alternatif dalam menguji kemiripan makna antar 2 kalimat. Pembentukan database sinonim kata dilakukan dengan mengelompokkan kata berdasar sinonim atau yang memiliki kesamaan arti. Masing-masing kelompok kata diberikan ID unik. Selanjutnya setiap kelompok kata dipecah untuk diuraikan menjadi kata tunggal, disimpan pada tabel kata dengan melabeli ID kata dan ID sinonim. ID sinonim didasarkan pada ID unik pada tabel sinonim. Dalam pengujian kemiripan makna, masing-masing kalimat akan di urai menjadi kata dan tiap-tiap kata akan dicocokkan berdasarkan tabel kata dengan acuan ID sinonim. ID Sinonim yang didapat kemudian dilakukan pengukuran jarak vektor dan kemiripan menggunakan rumus cosine similarity. Berdasarkan pengujian dan analisa yang telah dilakukan, dari 25 pengujian didapati 24 nilai kemiripan mengalami peningkatan prosentase. Hal tersebut dikarenakan penggunaan ID yang didasarkan pada kelompok kata dan irisan saat proses pembobotan mampu meningkatkan nilai kemiripan. Rata-rata nilai kemiripan pada penggunaan ID sebagai vektor hitung adalah 94,48% dan rata-rata nilai kemiripan pada metode atau alur pembanding adalah sebesar 69,96%. Abstract This study aims to provide an alternative in testing the similarity of meaning between 2 sentences. The formation of a word synonym database is done by grouping words based on synonyms or those that have the same meaning. Each group of words is assigned a unique ID. Furthermore, each group of words is broken down to be broken down into single words, stored in the word table labeled word ID and synonym ID. Synonym ID is based on the unique ID in the synonym table. In testing the similarity of meaning, each sentence will be broken down into words and each word will be matched based on the word table with synonym ID references. The synonym ID obtained is then measured by measuring the vector distance and similarity using the cosine similarity formula. Based on the tests and analyzes that have been carried out, out of 25 tests it was found that 24 similarity values experienced an increase in the percentage. This is because the use of ID based on word groups and slices during the weighting process can increase the similarity value. The average similarity value in the use of ID as a calculating vector is 94.48% and the average similarity value in the comparison method or plot is 69.96%.
first_indexed	2024-03-12T12:17:41Z
format	Article
id	doaj.art-8d1f6660ed064dc5af83579088190af4
institution	Directory Open Access Journal
issn	2355-7699 2528-6579
language	Indonesian
last_indexed	2024-04-24T05:58:52Z
publishDate	2023-08-01
publisher	University of Brawijaya
record_format	Article
series	Jurnal Teknologi Informasi dan Ilmu Komputer
spelling	doaj.art-8d1f6660ed064dc5af83579088190af42024-04-23T08:44:41ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792023-08-0110410.25126/jtiik.202410468641142Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim KataArdi Sanjaya0Ahmad Bagus Setiawan1Umi Mahdiyah2Intan Nur Farida3Aprisa Risky Prasetyo4Universitas Nusantara PGRI Kediri, KediriUniversitas Nusantara PGRI Kediri, KediriUniversitas Nusantara PGRI Kediri, KediriUniversitas Nusantara PGRI Kediri, KediriUniversitas Nusantara PGRI Kediri, KediriPenelitian ini bertujuan untuk memberikan alternatif dalam menguji kemiripan makna antar 2 kalimat. Pembentukan database sinonim kata dilakukan dengan mengelompokkan kata berdasar sinonim atau yang memiliki kesamaan arti. Masing-masing kelompok kata diberikan ID unik. Selanjutnya setiap kelompok kata dipecah untuk diuraikan menjadi kata tunggal, disimpan pada tabel kata dengan melabeli ID kata dan ID sinonim. ID sinonim didasarkan pada ID unik pada tabel sinonim. Dalam pengujian kemiripan makna, masing-masing kalimat akan di urai menjadi kata dan tiap-tiap kata akan dicocokkan berdasarkan tabel kata dengan acuan ID sinonim. ID Sinonim yang didapat kemudian dilakukan pengukuran jarak vektor dan kemiripan menggunakan rumus cosine similarity. Berdasarkan pengujian dan analisa yang telah dilakukan, dari 25 pengujian didapati 24 nilai kemiripan mengalami peningkatan prosentase. Hal tersebut dikarenakan penggunaan ID yang didasarkan pada kelompok kata dan irisan saat proses pembobotan mampu meningkatkan nilai kemiripan. Rata-rata nilai kemiripan pada penggunaan ID sebagai vektor hitung adalah 94,48% dan rata-rata nilai kemiripan pada metode atau alur pembanding adalah sebesar 69,96%. Abstract This study aims to provide an alternative in testing the similarity of meaning between 2 sentences. The formation of a word synonym database is done by grouping words based on synonyms or those that have the same meaning. Each group of words is assigned a unique ID. Furthermore, each group of words is broken down to be broken down into single words, stored in the word table labeled word ID and synonym ID. Synonym ID is based on the unique ID in the synonym table. In testing the similarity of meaning, each sentence will be broken down into words and each word will be matched based on the word table with synonym ID references. The synonym ID obtained is then measured by measuring the vector distance and similarity using the cosine similarity formula. Based on the tests and analyzes that have been carried out, out of 25 tests it was found that 24 similarity values experienced an increase in the percentage. This is because the use of ID based on word groups and slices during the weighting process can increase the similarity value. The average similarity value in the use of ID as a calculating vector is 94.48% and the average similarity value in the comparison method or plot is 69.96%. https://jtiik.ub.ac.id/index.php/jtiik/article/view/6864
spellingShingle	Ardi Sanjaya Ahmad Bagus Setiawan Umi Mahdiyah Intan Nur Farida Aprisa Risky Prasetyo Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata Jurnal Teknologi Informasi dan Ilmu Komputer
title	Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata
title_full	Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata
title_fullStr	Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata
title_full_unstemmed	Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata
title_short	Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata
title_sort	pengukuran kemiripan makna menggunakan cosine similarity dan basis data sinonim kata
url	https://jtiik.ub.ac.id/index.php/jtiik/article/view/6864
work_keys_str_mv	AT ardisanjaya pengukurankemiripanmaknamenggunakancosinesimilaritydanbasisdatasinonimkata AT ahmadbagussetiawan pengukurankemiripanmaknamenggunakancosinesimilaritydanbasisdatasinonimkata AT umimahdiyah pengukurankemiripanmaknamenggunakancosinesimilaritydanbasisdatasinonimkata AT intannurfarida pengukurankemiripanmaknamenggunakancosinesimilaritydanbasisdatasinonimkata AT aprisariskyprasetyo pengukurankemiripanmaknamenggunakancosinesimilaritydanbasisdatasinonimkata

Pengukuran Kemiripan Makna Menggunakan Cosine Similarity dan Basis Data Sinonim Kata

Similar Items