Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen

Klasterisasi dokumen adalah suatu proses pengelompokan dokumen secara otomatis dan unsupervised. Klasterisasi dokumen merupakan permasalahan yang sering ditemui dalam berbagai bidang seperti <em>text mining</em> dan sistem temu kembali informasi. Metode klasterisasi dokumen yang memiliki...

Full description

Bibliographic Details
Main Authors: Eric Budiman Gosno, Isye Arieshanti, Rully Soelaiman
Format: Article
Language:Indonesian
Published: Lembaga Penelitian dan Pengabdian kepada Masyarakat (LP2M) 2013-09-01
Series:Jurnal Teknik ITS
Subjects:
Online Access:http://ejurnal.its.ac.id/index.php/teknik/article/view/3872
_version_ 1818953968783458304
author Eric Budiman Gosno
Isye Arieshanti
Rully Soelaiman
author_facet Eric Budiman Gosno
Isye Arieshanti
Rully Soelaiman
author_sort Eric Budiman Gosno
collection DOAJ
description Klasterisasi dokumen adalah suatu proses pengelompokan dokumen secara otomatis dan unsupervised. Klasterisasi dokumen merupakan permasalahan yang sering ditemui dalam berbagai bidang seperti <em>text mining</em> dan sistem temu kembali informasi. Metode klasterisasi dokumen yang memiliki akurasi dan efisiensi waktu yang tinggi sangat diperlukan untuk meningkatkan hasil pada mesin pencari web,  dan untuk proses <em>filtering</em>. Salah satu metode klasterisasi yang telah dikenal dan diaplikasikan dalam klasterisasi dokumen adalah <em>K-Means Clustering</em>. Tetapi <em>K-Means Clustering </em>sensitif terhadap pemilihan posisi awal dari titik tengah klaster sehingga pemilihan posisi awal dari titik tengah klaster yang buruk akan mengakibatkan <em>K-Means Clustering</em> terjebak dalam <em>local optimum</em>. <em>KD-Tree K-Means Clustering</em> merupakan perbaikan dari <em>K-Means Clustering</em>. <em>KD-Tree K-Means Clustering</em> menggunakan struktur data <em>K-Dimensional Tree</em> dan nilai kerapatan pada proses inisialisasi titik tengah klaster. Pada makalah ini diimplementasikan algoritma <em>KD-Tree K-Means Clustering</em> untuk permasalahan klasterisasi dokumen. Performa klasterisasi dokumen yang dihasilkan oleh metode <em>KD-Tree K-Means Clustering</em> pada data set <em>20 newsgroup</em> memiliki nilai distorsi 3×10<sup>5</sup> lebih rendah dibandingkan dengan nilai rerata distorsi <em>K-Means Clustering</em> dan nilai NIG 0,09 lebih baik dibandingkan dengan nilai NIG <em>K-Means Clustering.</em>
first_indexed 2024-12-20T10:14:42Z
format Article
id doaj.art-130667bf42ae4a3bbd9e4b9c6eef12e8
institution Directory Open Access Journal
issn 2301-9271
2337-3539
language Indonesian
last_indexed 2024-12-20T10:14:42Z
publishDate 2013-09-01
publisher Lembaga Penelitian dan Pengabdian kepada Masyarakat (LP2M)
record_format Article
series Jurnal Teknik ITS
spelling doaj.art-130667bf42ae4a3bbd9e4b9c6eef12e82022-12-21T19:44:06ZindLembaga Penelitian dan Pengabdian kepada Masyarakat (LP2M)Jurnal Teknik ITS2301-92712337-35392013-09-0122924Implementasi KD-Tree K-Means Clustering untuk Klasterisasi DokumenEric Budiman Gosno0Isye Arieshanti1Rully Soelaiman2Institut Teknologi Sepuluh Nopember SurabayaInstitut Teknologi Sepuluh Nopember SurabayaInstitut Teknologi Sepuluh Nopember SurabayaKlasterisasi dokumen adalah suatu proses pengelompokan dokumen secara otomatis dan unsupervised. Klasterisasi dokumen merupakan permasalahan yang sering ditemui dalam berbagai bidang seperti <em>text mining</em> dan sistem temu kembali informasi. Metode klasterisasi dokumen yang memiliki akurasi dan efisiensi waktu yang tinggi sangat diperlukan untuk meningkatkan hasil pada mesin pencari web,  dan untuk proses <em>filtering</em>. Salah satu metode klasterisasi yang telah dikenal dan diaplikasikan dalam klasterisasi dokumen adalah <em>K-Means Clustering</em>. Tetapi <em>K-Means Clustering </em>sensitif terhadap pemilihan posisi awal dari titik tengah klaster sehingga pemilihan posisi awal dari titik tengah klaster yang buruk akan mengakibatkan <em>K-Means Clustering</em> terjebak dalam <em>local optimum</em>. <em>KD-Tree K-Means Clustering</em> merupakan perbaikan dari <em>K-Means Clustering</em>. <em>KD-Tree K-Means Clustering</em> menggunakan struktur data <em>K-Dimensional Tree</em> dan nilai kerapatan pada proses inisialisasi titik tengah klaster. Pada makalah ini diimplementasikan algoritma <em>KD-Tree K-Means Clustering</em> untuk permasalahan klasterisasi dokumen. Performa klasterisasi dokumen yang dihasilkan oleh metode <em>KD-Tree K-Means Clustering</em> pada data set <em>20 newsgroup</em> memiliki nilai distorsi 3×10<sup>5</sup> lebih rendah dibandingkan dengan nilai rerata distorsi <em>K-Means Clustering</em> dan nilai NIG 0,09 lebih baik dibandingkan dengan nilai NIG <em>K-Means Clustering.</em>http://ejurnal.its.ac.id/index.php/teknik/article/view/3872K-Dimensional TreeK-Means ClusteringKD-Tree K-Means ClusteringKlasterisasi Dokumen
spellingShingle Eric Budiman Gosno
Isye Arieshanti
Rully Soelaiman
Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen
Jurnal Teknik ITS
K-Dimensional Tree
K-Means Clustering
KD-Tree K-Means Clustering
Klasterisasi Dokumen
title Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen
title_full Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen
title_fullStr Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen
title_full_unstemmed Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen
title_short Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen
title_sort implementasi kd tree k means clustering untuk klasterisasi dokumen
topic K-Dimensional Tree
K-Means Clustering
KD-Tree K-Means Clustering
Klasterisasi Dokumen
url http://ejurnal.its.ac.id/index.php/teknik/article/view/3872
work_keys_str_mv AT ericbudimangosno implementasikdtreekmeansclusteringuntukklasterisasidokumen
AT isyearieshanti implementasikdtreekmeansclusteringuntukklasterisasidokumen
AT rullysoelaiman implementasikdtreekmeansclusteringuntukklasterisasidokumen