Pengkelasan dokumen web menggunakan teknik vector machine (SVM)
Dewasa ini, kebanyakan enjin carian di internet menggunakan sistem pengindeksan subjek berbanding pengkelasan dokumen. Dalam sistem pengindeksan subjek, kosa kata atau kata kunci yang terkawal digunakan untuk menetapkan istilah pengindeksan pada dokumendokumen web. Manakala, pengkelasan dokumen pula...
Main Authors: | , , , , , |
---|---|
Format: | Conference or Workshop Item |
Language: | English |
Published: |
2005
|
Subjects: | |
Online Access: | http://eprints.utm.my/3389/1/Pengkelasan_Dokumen_Web_Menggunakan_Teknik.pdf |
_version_ | 1825909383335247872 |
---|---|
author | Othman, Mohd. Shahizan Dollah, Rozilawati @ Md. Zain Mi Yusuf, Lizawati Salim, Juhana Shukur, Zarina Chin, Mae Yen |
author_facet | Othman, Mohd. Shahizan Dollah, Rozilawati @ Md. Zain Mi Yusuf, Lizawati Salim, Juhana Shukur, Zarina Chin, Mae Yen |
author_sort | Othman, Mohd. Shahizan |
collection | ePrints |
description | Dewasa ini, kebanyakan enjin carian di internet menggunakan sistem pengindeksan subjek berbanding pengkelasan dokumen. Dalam sistem pengindeksan subjek, kosa kata atau kata kunci yang terkawal digunakan untuk menetapkan istilah pengindeksan pada dokumendokumen web. Manakala, pengkelasan dokumen pula akan mengkelaskan dokumen-dokumen web dalam satu struktur hirarki berdasarkan kategori subjek. Pengindeksan berdasarkan kata kunci berkemampuan untuk mencari dokumen-dokumen yang mengandungi kata kunci yang spesifik. Walau bagaimanapunia sukar untuk mengenalpasti dokumen-dokumen yang mempunyai kategori yang sama. Oleh yang demikian, pengkelasan teks secara automatik adalah diperlukan. Ini bertujuan untuk mengkelaskan dokumen-dokumen ke dalam kategoriketegori yang berbeza berdasarkan kandungan teks. Sehubungan dengan itu, kertas kerja ini akan membincangkan tentang kajian pengkelasan teks dengan menggunakan kaedah Support Vector Machine (SVM). Set data yang digunakan dalam kajian ini diperolehi daripada Bank Search Information Consultancy Ltd. dan Jabatan Sains Komputer di University of Reading. Set data ini dipecahkan kepada empat kategori iaitu perbankan dan kewangan, bahasa pengaturcaraan, sains dan sukan. Hasil kajian ini menunjukkan peratus ketepatan pengkelasan dokumen web untuk set data yang digunakan adalah rendah dan kurang memuaskan. |
first_indexed | 2024-03-05T18:01:21Z |
format | Conference or Workshop Item |
id | utm.eprints-3389 |
institution | Universiti Teknologi Malaysia - ePrints |
language | English |
last_indexed | 2024-03-05T18:01:21Z |
publishDate | 2005 |
record_format | dspace |
spelling | utm.eprints-33892017-08-28T00:45:16Z http://eprints.utm.my/3389/ Pengkelasan dokumen web menggunakan teknik vector machine (SVM) Othman, Mohd. Shahizan Dollah, Rozilawati @ Md. Zain Mi Yusuf, Lizawati Salim, Juhana Shukur, Zarina Chin, Mae Yen H Social Sciences (General) QA75 Electronic computers. Computer science Dewasa ini, kebanyakan enjin carian di internet menggunakan sistem pengindeksan subjek berbanding pengkelasan dokumen. Dalam sistem pengindeksan subjek, kosa kata atau kata kunci yang terkawal digunakan untuk menetapkan istilah pengindeksan pada dokumendokumen web. Manakala, pengkelasan dokumen pula akan mengkelaskan dokumen-dokumen web dalam satu struktur hirarki berdasarkan kategori subjek. Pengindeksan berdasarkan kata kunci berkemampuan untuk mencari dokumen-dokumen yang mengandungi kata kunci yang spesifik. Walau bagaimanapunia sukar untuk mengenalpasti dokumen-dokumen yang mempunyai kategori yang sama. Oleh yang demikian, pengkelasan teks secara automatik adalah diperlukan. Ini bertujuan untuk mengkelaskan dokumen-dokumen ke dalam kategoriketegori yang berbeza berdasarkan kandungan teks. Sehubungan dengan itu, kertas kerja ini akan membincangkan tentang kajian pengkelasan teks dengan menggunakan kaedah Support Vector Machine (SVM). Set data yang digunakan dalam kajian ini diperolehi daripada Bank Search Information Consultancy Ltd. dan Jabatan Sains Komputer di University of Reading. Set data ini dipecahkan kepada empat kategori iaitu perbankan dan kewangan, bahasa pengaturcaraan, sains dan sukan. Hasil kajian ini menunjukkan peratus ketepatan pengkelasan dokumen web untuk set data yang digunakan adalah rendah dan kurang memuaskan. 2005-12 Conference or Workshop Item PeerReviewed application/pdf en http://eprints.utm.my/3389/1/Pengkelasan_Dokumen_Web_Menggunakan_Teknik.pdf Othman, Mohd. Shahizan and Dollah, Rozilawati @ Md. Zain and Mi Yusuf, Lizawati and Salim, Juhana and Shukur, Zarina and Chin, Mae Yen (2005) Pengkelasan dokumen web menggunakan teknik vector machine (SVM). In: Seminar Capaian Maklumat & Pengurusan Pengetahuan 2005 (CAMP'05), December 2005, ESSET Bangi. |
spellingShingle | H Social Sciences (General) QA75 Electronic computers. Computer science Othman, Mohd. Shahizan Dollah, Rozilawati @ Md. Zain Mi Yusuf, Lizawati Salim, Juhana Shukur, Zarina Chin, Mae Yen Pengkelasan dokumen web menggunakan teknik vector machine (SVM) |
title | Pengkelasan dokumen web menggunakan teknik vector machine (SVM) |
title_full | Pengkelasan dokumen web menggunakan teknik vector machine (SVM) |
title_fullStr | Pengkelasan dokumen web menggunakan teknik vector machine (SVM) |
title_full_unstemmed | Pengkelasan dokumen web menggunakan teknik vector machine (SVM) |
title_short | Pengkelasan dokumen web menggunakan teknik vector machine (SVM) |
title_sort | pengkelasan dokumen web menggunakan teknik vector machine svm |
topic | H Social Sciences (General) QA75 Electronic computers. Computer science |
url | http://eprints.utm.my/3389/1/Pengkelasan_Dokumen_Web_Menggunakan_Teknik.pdf |
work_keys_str_mv | AT othmanmohdshahizan pengkelasandokumenwebmenggunakanteknikvectormachinesvm AT dollahrozilawatimdzain pengkelasandokumenwebmenggunakanteknikvectormachinesvm AT miyusuflizawati pengkelasandokumenwebmenggunakanteknikvectormachinesvm AT salimjuhana pengkelasandokumenwebmenggunakanteknikvectormachinesvm AT shukurzarina pengkelasandokumenwebmenggunakanteknikvectormachinesvm AT chinmaeyen pengkelasandokumenwebmenggunakanteknikvectormachinesvm |