RANCANG BANGUN APLIKASI PENCARIAN DOKUMEN BERBASIS WEB MENGGUNAKAN METODE SUFFIX CACTUS CLUSTERING
<!--[if gte mso 9]><xml> Normal 0 false false false IN X-NONE X-NONE MicrosoftInternetExplorer4 </xml><![endif]--><!--[if gte mso 9]><xml> </xml><![endif]--> <!--[if gt...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Institut Teknologi Sepuluh Nopember
2003-01-01
|
Series: | JUTI: Jurnal Ilmiah Teknologi Informasi |
Online Access: | http://juti.if.its.ac.id/index.php/juti/article/view/109 |
Summary: | <!--[if gte mso 9]><xml> Normal 0 false false false IN X-NONE X-NONE MicrosoftInternetExplorer4 </xml><![endif]--><!--[if gte mso 9]><xml> </xml><![endif]--> <!--[if gte mso 10]> <style>
/* Style Definitions */
table.MsoNormalTable
{mso-style-name:"Table Normal";
mso-tstyle-rowband-size:0;
mso-tstyle-colband-size:0;
mso-style-noshow:yes;
mso-style-priority:99;
mso-style-qformat:yes;
mso-style-parent:"";
mso-padding-alt:0cm 5.4pt 0cm 5.4pt;
mso-para-margin:0cm;
mso-para-margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:11.0pt;
font-family:"Calibri","sans-serif";
mso-ascii-font-family:Calibri;
mso-ascii-theme-font:minor-latin;
mso-fareast-font-family:"Times New Roman";
mso-fareast-theme-font:minor-fareast;
mso-hansi-font-family:Calibri;
mso-hansi-theme-font:minor-latin;
mso-bidi-font-family:"Times New Roman";
mso-bidi-theme-font:minor-bidi;}
</style> <![endif]--> <p><em>Salah satu bagian dari temu kembali (retrieval) informasi adalah menyajikan data hasil pencarian dengan cara mengelompokkan (clustering) seluruh dokumen hasil pencarian sesuai dengan kemiripan antar dokumen. Agar tingkat kemiripan dokumen tinggi maka dokumen harus dibaca dengan memperhatikan struktur frasa-frasa penyusun dokumen (semantis). </em></p> <p><em>Pembacaan secara semantis inilah yang kemudian membutuhkan representasi isi dokumen secara tepat. Hal ini dipecahkan dengan preprocessing dokumen hasil pencarian dalam bentuk struktur data suffix cactus. Implementasi struktur data suffix cactus memungkinkan pencarian string relatif lebih cepat dibandingkan query biasa. Suffix cactus bisa dikonstruksi dari suffix tree ataupun dari suffix array. Kinerja suffix cactus berada di antara keduanya. </em></p> <p><em>Pada makalah ini, suffix cactus dikonstruksi berdasarkan pada informasi yang didapat dari suffix tree, sedangkan clustering diimplementasikan pada judul dokumen yang dianggap representasi dokumen berbahasa Indonesia. Hasil pencarian dokumen berupa grup-grup dokumen dan ditampilkan frasa-frasa baru yang memiliki kedekatan dengan keyword yang diinputkan. Pada makalah ini juga dilakukan pengukuran waktu eksekusi dan ukuran suffix cactus terhadap jumlah dokumen (hits).</em></p> <p> </p> <p>Kata kunci<em>: Information Retrieval, clustering, suffix tree, suffix cactus</em>.</p> |
---|---|
ISSN: | 1412-6389 2406-8535 |