Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen
Klasterisasi dokumen adalah suatu proses pengelompokan dokumen secara otomatis dan unsupervised. Klasterisasi dokumen merupakan permasalahan yang sering ditemui dalam berbagai bidang seperti <em>text mining</em> dan sistem temu kembali informasi. Metode klasterisasi dokumen yang memiliki...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | Indonesian |
Published: |
Lembaga Penelitian dan Pengabdian kepada Masyarakat (LP2M)
2013-09-01
|
Series: | Jurnal Teknik ITS |
Subjects: | |
Online Access: | http://ejurnal.its.ac.id/index.php/teknik/article/view/3872 |
_version_ | 1818953968783458304 |
---|---|
author | Eric Budiman Gosno Isye Arieshanti Rully Soelaiman |
author_facet | Eric Budiman Gosno Isye Arieshanti Rully Soelaiman |
author_sort | Eric Budiman Gosno |
collection | DOAJ |
description | Klasterisasi dokumen adalah suatu proses pengelompokan dokumen secara otomatis dan unsupervised. Klasterisasi dokumen merupakan permasalahan yang sering ditemui dalam berbagai bidang seperti <em>text mining</em> dan sistem temu kembali informasi. Metode klasterisasi dokumen yang memiliki akurasi dan efisiensi waktu yang tinggi sangat diperlukan untuk meningkatkan hasil pada mesin pencari web, dan untuk proses <em>filtering</em>. Salah satu metode klasterisasi yang telah dikenal dan diaplikasikan dalam klasterisasi dokumen adalah <em>K-Means Clustering</em>. Tetapi <em>K-Means Clustering </em>sensitif terhadap pemilihan posisi awal dari titik tengah klaster sehingga pemilihan posisi awal dari titik tengah klaster yang buruk akan mengakibatkan <em>K-Means Clustering</em> terjebak dalam <em>local optimum</em>. <em>KD-Tree K-Means Clustering</em> merupakan perbaikan dari <em>K-Means Clustering</em>. <em>KD-Tree K-Means Clustering</em> menggunakan struktur data <em>K-Dimensional Tree</em> dan nilai kerapatan pada proses inisialisasi titik tengah klaster. Pada makalah ini diimplementasikan algoritma <em>KD-Tree K-Means Clustering</em> untuk permasalahan klasterisasi dokumen. Performa klasterisasi dokumen yang dihasilkan oleh metode <em>KD-Tree K-Means Clustering</em> pada data set <em>20 newsgroup</em> memiliki nilai distorsi 3×10<sup>5</sup> lebih rendah dibandingkan dengan nilai rerata distorsi <em>K-Means Clustering</em> dan nilai NIG 0,09 lebih baik dibandingkan dengan nilai NIG <em>K-Means Clustering.</em> |
first_indexed | 2024-12-20T10:14:42Z |
format | Article |
id | doaj.art-130667bf42ae4a3bbd9e4b9c6eef12e8 |
institution | Directory Open Access Journal |
issn | 2301-9271 2337-3539 |
language | Indonesian |
last_indexed | 2024-12-20T10:14:42Z |
publishDate | 2013-09-01 |
publisher | Lembaga Penelitian dan Pengabdian kepada Masyarakat (LP2M) |
record_format | Article |
series | Jurnal Teknik ITS |
spelling | doaj.art-130667bf42ae4a3bbd9e4b9c6eef12e82022-12-21T19:44:06ZindLembaga Penelitian dan Pengabdian kepada Masyarakat (LP2M)Jurnal Teknik ITS2301-92712337-35392013-09-0122924Implementasi KD-Tree K-Means Clustering untuk Klasterisasi DokumenEric Budiman Gosno0Isye Arieshanti1Rully Soelaiman2Institut Teknologi Sepuluh Nopember SurabayaInstitut Teknologi Sepuluh Nopember SurabayaInstitut Teknologi Sepuluh Nopember SurabayaKlasterisasi dokumen adalah suatu proses pengelompokan dokumen secara otomatis dan unsupervised. Klasterisasi dokumen merupakan permasalahan yang sering ditemui dalam berbagai bidang seperti <em>text mining</em> dan sistem temu kembali informasi. Metode klasterisasi dokumen yang memiliki akurasi dan efisiensi waktu yang tinggi sangat diperlukan untuk meningkatkan hasil pada mesin pencari web, dan untuk proses <em>filtering</em>. Salah satu metode klasterisasi yang telah dikenal dan diaplikasikan dalam klasterisasi dokumen adalah <em>K-Means Clustering</em>. Tetapi <em>K-Means Clustering </em>sensitif terhadap pemilihan posisi awal dari titik tengah klaster sehingga pemilihan posisi awal dari titik tengah klaster yang buruk akan mengakibatkan <em>K-Means Clustering</em> terjebak dalam <em>local optimum</em>. <em>KD-Tree K-Means Clustering</em> merupakan perbaikan dari <em>K-Means Clustering</em>. <em>KD-Tree K-Means Clustering</em> menggunakan struktur data <em>K-Dimensional Tree</em> dan nilai kerapatan pada proses inisialisasi titik tengah klaster. Pada makalah ini diimplementasikan algoritma <em>KD-Tree K-Means Clustering</em> untuk permasalahan klasterisasi dokumen. Performa klasterisasi dokumen yang dihasilkan oleh metode <em>KD-Tree K-Means Clustering</em> pada data set <em>20 newsgroup</em> memiliki nilai distorsi 3×10<sup>5</sup> lebih rendah dibandingkan dengan nilai rerata distorsi <em>K-Means Clustering</em> dan nilai NIG 0,09 lebih baik dibandingkan dengan nilai NIG <em>K-Means Clustering.</em>http://ejurnal.its.ac.id/index.php/teknik/article/view/3872K-Dimensional TreeK-Means ClusteringKD-Tree K-Means ClusteringKlasterisasi Dokumen |
spellingShingle | Eric Budiman Gosno Isye Arieshanti Rully Soelaiman Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen Jurnal Teknik ITS K-Dimensional Tree K-Means Clustering KD-Tree K-Means Clustering Klasterisasi Dokumen |
title | Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen |
title_full | Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen |
title_fullStr | Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen |
title_full_unstemmed | Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen |
title_short | Implementasi KD-Tree K-Means Clustering untuk Klasterisasi Dokumen |
title_sort | implementasi kd tree k means clustering untuk klasterisasi dokumen |
topic | K-Dimensional Tree K-Means Clustering KD-Tree K-Means Clustering Klasterisasi Dokumen |
url | http://ejurnal.its.ac.id/index.php/teknik/article/view/3872 |
work_keys_str_mv | AT ericbudimangosno implementasikdtreekmeansclusteringuntukklasterisasidokumen AT isyearieshanti implementasikdtreekmeansclusteringuntukklasterisasidokumen AT rullysoelaiman implementasikdtreekmeansclusteringuntukklasterisasidokumen |