Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

Keanekaragaman dokumen teks serta jumlahnya saat ini terus bertambah yang menyebabkan penumpukan dokumen. Dokumen yang tersebar dan tidak terkoordinasi dengan baik akan menyulitkan pencari informasi dalam mendapatkan informasi yang diinginkan, maka perlu dibuatnya suatu sistem yang dapat mengelompok...

Full description

Bibliographic Details
Main Authors: Adi Radili, Suwanto Sanjaya
Format: Article
Language:Indonesian
Published: Program Studi Teknik Informatika, Universitas Islam Negeri Sultan Syarif Kasim Riau, Indonesia 2018-01-01
Series:Jurnal CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi
Online Access:http://ejournal.uin-suska.ac.id/index.php/coreit/article/view/4418
_version_ 1818336373736734720
author Adi Radili
Suwanto Sanjaya
author_facet Adi Radili
Suwanto Sanjaya
author_sort Adi Radili
collection DOAJ
description Keanekaragaman dokumen teks serta jumlahnya saat ini terus bertambah yang menyebabkan penumpukan dokumen. Dokumen yang tersebar dan tidak terkoordinasi dengan baik akan menyulitkan pencari informasi dalam mendapatkan informasi yang diinginkan, maka perlu dibuatnya suatu sistem yang dapat mengelompokkan dokumen. Penelitian ini menerapkan metode winnowing untuk pemilihan fitur yaitu fingerprint dan naive bayes untuk pengelompokan. Pengelompokan dokumen dengan menggunakan winnowing fingerprint dan naive bayes mempunyai 8 bidang keahlian dengan menggunakan 1050 dokumen abstrak dengan 90% data latih dan 10% data uji. Pengujian menghasilkan akurasi 40% (k-gram=3, bilangan prima=2 dan jumlah window=8), 49,52% (k-gram=5, bilangan prima=2 dan jumlah window=8), 84,76% (k-gram=8, bilangan prima=2 dan jumlah window=8) dan 67,61% (k-gram=12, bilangan prima=2 dan jumlah window=8). Sedangkan pengujian menggunakan data yang seimbang, yaitu 400 data latih (masing-masing kelas memiliki 50 dokumen) menghasilkan akurasi 20% (k-gram=3, bilangan prima=2 dan jumlah window=8), 27,5% (k-gram=5, bilangan prima=2 dan jumlah window=8), 70% (k-gram=8, bilangan prima=2 dan jumlah window=8) dan 47,5% (k-gram=12, bilangan prima=2 dan jumlah window=8). Konfigurasi winnowing dengan nilai k-gram=8, bilangan prima=2 dan jumlah window=8 akan menghasilkan ciri dokumen yang terbaik untuk pengelompokan dokumen. Kata kunci – Text Mining, Winnowing, Naive Bayes, Fingerprint, Pengelompokan Dokumen
first_indexed 2024-12-13T14:38:18Z
format Article
id doaj.art-f893d97bcf04439595d2cfaa8cd97992
institution Directory Open Access Journal
issn 2460-738X
2599-3321
language Indonesian
last_indexed 2024-12-13T14:38:18Z
publishDate 2018-01-01
publisher Program Studi Teknik Informatika, Universitas Islam Negeri Sultan Syarif Kasim Riau, Indonesia
record_format Article
series Jurnal CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi
spelling doaj.art-f893d97bcf04439595d2cfaa8cd979922022-12-21T23:41:41ZindProgram Studi Teknik Informatika, Universitas Islam Negeri Sultan Syarif Kasim Riau, IndonesiaJurnal CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi2460-738X2599-33212018-01-013210.24014/coreit.v3i2.44182722Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan DokumenAdi Radili0Suwanto Sanjaya1UIN Suska RiauUIN SUska RiauKeanekaragaman dokumen teks serta jumlahnya saat ini terus bertambah yang menyebabkan penumpukan dokumen. Dokumen yang tersebar dan tidak terkoordinasi dengan baik akan menyulitkan pencari informasi dalam mendapatkan informasi yang diinginkan, maka perlu dibuatnya suatu sistem yang dapat mengelompokkan dokumen. Penelitian ini menerapkan metode winnowing untuk pemilihan fitur yaitu fingerprint dan naive bayes untuk pengelompokan. Pengelompokan dokumen dengan menggunakan winnowing fingerprint dan naive bayes mempunyai 8 bidang keahlian dengan menggunakan 1050 dokumen abstrak dengan 90% data latih dan 10% data uji. Pengujian menghasilkan akurasi 40% (k-gram=3, bilangan prima=2 dan jumlah window=8), 49,52% (k-gram=5, bilangan prima=2 dan jumlah window=8), 84,76% (k-gram=8, bilangan prima=2 dan jumlah window=8) dan 67,61% (k-gram=12, bilangan prima=2 dan jumlah window=8). Sedangkan pengujian menggunakan data yang seimbang, yaitu 400 data latih (masing-masing kelas memiliki 50 dokumen) menghasilkan akurasi 20% (k-gram=3, bilangan prima=2 dan jumlah window=8), 27,5% (k-gram=5, bilangan prima=2 dan jumlah window=8), 70% (k-gram=8, bilangan prima=2 dan jumlah window=8) dan 47,5% (k-gram=12, bilangan prima=2 dan jumlah window=8). Konfigurasi winnowing dengan nilai k-gram=8, bilangan prima=2 dan jumlah window=8 akan menghasilkan ciri dokumen yang terbaik untuk pengelompokan dokumen. Kata kunci – Text Mining, Winnowing, Naive Bayes, Fingerprint, Pengelompokan Dokumenhttp://ejournal.uin-suska.ac.id/index.php/coreit/article/view/4418
spellingShingle Adi Radili
Suwanto Sanjaya
Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
Jurnal CoreIT: Jurnal Hasil Penelitian Ilmu Komputer dan Teknologi Informasi
title Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
title_full Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
title_fullStr Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
title_full_unstemmed Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
title_short Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
title_sort penerapan metode winnowing fingerprint dan naive bayes untuk pengelompokan dokumen
url http://ejournal.uin-suska.ac.id/index.php/coreit/article/view/4418
work_keys_str_mv AT adiradili penerapanmetodewinnowingfingerprintdannaivebayesuntukpengelompokandokumen
AT suwantosanjaya penerapanmetodewinnowingfingerprintdannaivebayesuntukpengelompokandokumen