Pengkelasan dokumen web menggunakan teknik vector machine (SVM)

Dewasa ini, kebanyakan enjin carian di internet menggunakan sistem pengindeksan subjek berbanding pengkelasan dokumen. Dalam sistem pengindeksan subjek, kosa kata atau kata kunci yang terkawal digunakan untuk menetapkan istilah pengindeksan pada dokumendokumen web. Manakala, pengkelasan dokumen pula...

Full description

Bibliographic Details
Main Authors: Othman, Mohd. Shahizan, Dollah, Rozilawati @ Md. Zain, Mi Yusuf, Lizawati, Salim, Juhana, Shukur, Zarina, Chin, Mae Yen
Format: Conference or Workshop Item
Language:English
Published: 2005
Subjects:
Online Access:http://eprints.utm.my/3389/1/Pengkelasan_Dokumen_Web_Menggunakan_Teknik.pdf
_version_ 1825909383335247872
author Othman, Mohd. Shahizan
Dollah, Rozilawati @ Md. Zain
Mi Yusuf, Lizawati
Salim, Juhana
Shukur, Zarina
Chin, Mae Yen
author_facet Othman, Mohd. Shahizan
Dollah, Rozilawati @ Md. Zain
Mi Yusuf, Lizawati
Salim, Juhana
Shukur, Zarina
Chin, Mae Yen
author_sort Othman, Mohd. Shahizan
collection ePrints
description Dewasa ini, kebanyakan enjin carian di internet menggunakan sistem pengindeksan subjek berbanding pengkelasan dokumen. Dalam sistem pengindeksan subjek, kosa kata atau kata kunci yang terkawal digunakan untuk menetapkan istilah pengindeksan pada dokumendokumen web. Manakala, pengkelasan dokumen pula akan mengkelaskan dokumen-dokumen web dalam satu struktur hirarki berdasarkan kategori subjek. Pengindeksan berdasarkan kata kunci berkemampuan untuk mencari dokumen-dokumen yang mengandungi kata kunci yang spesifik. Walau bagaimanapunia sukar untuk mengenalpasti dokumen-dokumen yang mempunyai kategori yang sama. Oleh yang demikian, pengkelasan teks secara automatik adalah diperlukan. Ini bertujuan untuk mengkelaskan dokumen-dokumen ke dalam kategoriketegori yang berbeza berdasarkan kandungan teks. Sehubungan dengan itu, kertas kerja ini akan membincangkan tentang kajian pengkelasan teks dengan menggunakan kaedah Support Vector Machine (SVM). Set data yang digunakan dalam kajian ini diperolehi daripada Bank Search Information Consultancy Ltd. dan Jabatan Sains Komputer di University of Reading. Set data ini dipecahkan kepada empat kategori iaitu perbankan dan kewangan, bahasa pengaturcaraan, sains dan sukan. Hasil kajian ini menunjukkan peratus ketepatan pengkelasan dokumen web untuk set data yang digunakan adalah rendah dan kurang memuaskan.
first_indexed 2024-03-05T18:01:21Z
format Conference or Workshop Item
id utm.eprints-3389
institution Universiti Teknologi Malaysia - ePrints
language English
last_indexed 2024-03-05T18:01:21Z
publishDate 2005
record_format dspace
spelling utm.eprints-33892017-08-28T00:45:16Z http://eprints.utm.my/3389/ Pengkelasan dokumen web menggunakan teknik vector machine (SVM) Othman, Mohd. Shahizan Dollah, Rozilawati @ Md. Zain Mi Yusuf, Lizawati Salim, Juhana Shukur, Zarina Chin, Mae Yen H Social Sciences (General) QA75 Electronic computers. Computer science Dewasa ini, kebanyakan enjin carian di internet menggunakan sistem pengindeksan subjek berbanding pengkelasan dokumen. Dalam sistem pengindeksan subjek, kosa kata atau kata kunci yang terkawal digunakan untuk menetapkan istilah pengindeksan pada dokumendokumen web. Manakala, pengkelasan dokumen pula akan mengkelaskan dokumen-dokumen web dalam satu struktur hirarki berdasarkan kategori subjek. Pengindeksan berdasarkan kata kunci berkemampuan untuk mencari dokumen-dokumen yang mengandungi kata kunci yang spesifik. Walau bagaimanapunia sukar untuk mengenalpasti dokumen-dokumen yang mempunyai kategori yang sama. Oleh yang demikian, pengkelasan teks secara automatik adalah diperlukan. Ini bertujuan untuk mengkelaskan dokumen-dokumen ke dalam kategoriketegori yang berbeza berdasarkan kandungan teks. Sehubungan dengan itu, kertas kerja ini akan membincangkan tentang kajian pengkelasan teks dengan menggunakan kaedah Support Vector Machine (SVM). Set data yang digunakan dalam kajian ini diperolehi daripada Bank Search Information Consultancy Ltd. dan Jabatan Sains Komputer di University of Reading. Set data ini dipecahkan kepada empat kategori iaitu perbankan dan kewangan, bahasa pengaturcaraan, sains dan sukan. Hasil kajian ini menunjukkan peratus ketepatan pengkelasan dokumen web untuk set data yang digunakan adalah rendah dan kurang memuaskan. 2005-12 Conference or Workshop Item PeerReviewed application/pdf en http://eprints.utm.my/3389/1/Pengkelasan_Dokumen_Web_Menggunakan_Teknik.pdf Othman, Mohd. Shahizan and Dollah, Rozilawati @ Md. Zain and Mi Yusuf, Lizawati and Salim, Juhana and Shukur, Zarina and Chin, Mae Yen (2005) Pengkelasan dokumen web menggunakan teknik vector machine (SVM). In: Seminar Capaian Maklumat & Pengurusan Pengetahuan 2005 (CAMP'05), December 2005, ESSET Bangi.
spellingShingle H Social Sciences (General)
QA75 Electronic computers. Computer science
Othman, Mohd. Shahizan
Dollah, Rozilawati @ Md. Zain
Mi Yusuf, Lizawati
Salim, Juhana
Shukur, Zarina
Chin, Mae Yen
Pengkelasan dokumen web menggunakan teknik vector machine (SVM)
title Pengkelasan dokumen web menggunakan teknik vector machine (SVM)
title_full Pengkelasan dokumen web menggunakan teknik vector machine (SVM)
title_fullStr Pengkelasan dokumen web menggunakan teknik vector machine (SVM)
title_full_unstemmed Pengkelasan dokumen web menggunakan teknik vector machine (SVM)
title_short Pengkelasan dokumen web menggunakan teknik vector machine (SVM)
title_sort pengkelasan dokumen web menggunakan teknik vector machine svm
topic H Social Sciences (General)
QA75 Electronic computers. Computer science
url http://eprints.utm.my/3389/1/Pengkelasan_Dokumen_Web_Menggunakan_Teknik.pdf
work_keys_str_mv AT othmanmohdshahizan pengkelasandokumenwebmenggunakanteknikvectormachinesvm
AT dollahrozilawatimdzain pengkelasandokumenwebmenggunakanteknikvectormachinesvm
AT miyusuflizawati pengkelasandokumenwebmenggunakanteknikvectormachinesvm
AT salimjuhana pengkelasandokumenwebmenggunakanteknikvectormachinesvm
AT shukurzarina pengkelasandokumenwebmenggunakanteknikvectormachinesvm
AT chinmaeyen pengkelasandokumenwebmenggunakanteknikvectormachinesvm