NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG

Vấn đề mất cân bằng dữ liệu xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp nhỏ trong tập mất cân bằng là khó khăn. Khi tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Học với chi phí nhạy cảm...

Full description

Bibliographic Details
Main Authors: Bùi Minh Quân, Huỳnh Xuân Hiệp, Phạm Xuân Hiền
Format: Article
Language:Vietnamese
Published: Can Tho University Publisher 2013-10-01
Series:Tạp chí Khoa học Đại học Cần Thơ
Subjects:
Online Access:https://ctujsvn.ctu.edu.vn/index.php/ctujsvn/article/view/1907
_version_ 1797286247389986816
author Bùi Minh Quân
Huỳnh Xuân Hiệp
Phạm Xuân Hiền
author_facet Bùi Minh Quân
Huỳnh Xuân Hiệp
Phạm Xuân Hiền
author_sort Bùi Minh Quân
collection DOAJ
description Vấn đề mất cân bằng dữ liệu xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp nhỏ trong tập mất cân bằng là khó khăn. Khi tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Học với chi phí nhạy cảm là giải pháp hiệu quả để giải quyết vấn đề mất cân bằng. Trong bài báo này, chúng tôi trình bày một hệ thống gọi là hệ thống quyết định với chi phí, hệ thống giúp cải thiện khả năng phân loại chính xác của lớp nhỏ trong tập dữ liệu mất cân bằng, lớp dữ liệu rất được quan tâm. Hệ thống được xây dựng dựa vào kết quả nghiên cứu giải pháp phân loại trên dữ liệu mất cân bằng tiếp cận với chi phí nhạy cảm. Hệ thống được áp dụng vào lĩnh vực chẩn đoán y học, kết quả thực nghiệm cho thấy khả năng phát hiện chính xác bệnh nhân của hệ thống chẩn đoán được cải thiện.
first_indexed 2024-03-07T18:15:30Z
format Article
id doaj.art-0f806e023afa40e78ceaf9aceec96aae
institution Directory Open Access Journal
issn 1859-2333
2815-5599
language Vietnamese
last_indexed 2024-03-07T18:15:30Z
publishDate 2013-10-01
publisher Can Tho University Publisher
record_format Article
series Tạp chí Khoa học Đại học Cần Thơ
spelling doaj.art-0f806e023afa40e78ceaf9aceec96aae2024-03-02T07:32:36ZvieCan Tho University PublisherTạp chí Khoa học Đại học Cần Thơ1859-23332815-55992013-10-01CĐ Công nghệ TTNÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNGBùi Minh Quân0Huỳnh Xuân Hiệp1Phạm Xuân Hiền2BM. Mạng Máy tính & Truyền thông, K.Công nghệ Thông tin &Truyền thôngBM.Công nghệ phần mềm, K.Công nghệ Thông tin &Truyền thôngBộ môn Khoa học Máy tính, K.Công nghệ Thông tin &Truyền thôngVấn đề mất cân bằng dữ liệu xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp nhỏ trong tập mất cân bằng là khó khăn. Khi tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Học với chi phí nhạy cảm là giải pháp hiệu quả để giải quyết vấn đề mất cân bằng. Trong bài báo này, chúng tôi trình bày một hệ thống gọi là hệ thống quyết định với chi phí, hệ thống giúp cải thiện khả năng phân loại chính xác của lớp nhỏ trong tập dữ liệu mất cân bằng, lớp dữ liệu rất được quan tâm. Hệ thống được xây dựng dựa vào kết quả nghiên cứu giải pháp phân loại trên dữ liệu mất cân bằng tiếp cận với chi phí nhạy cảm. Hệ thống được áp dụng vào lĩnh vực chẩn đoán y học, kết quả thực nghiệm cho thấy khả năng phát hiện chính xác bệnh nhân của hệ thống chẩn đoán được cải thiện.https://ctujsvn.ctu.edu.vn/index.php/ctujsvn/article/view/1907Học với chi phí nhạy cảmtập đa lớpdữ liệu mất cân bằng
spellingShingle Bùi Minh Quân
Huỳnh Xuân Hiệp
Phạm Xuân Hiền
NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG
Tạp chí Khoa học Đại học Cần Thơ
Học với chi phí nhạy cảm
tập đa lớp
dữ liệu mất cân bằng
title NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG
title_full NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG
title_fullStr NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG
title_full_unstemmed NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG
title_short NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG
title_sort nang cao do chinh xac phan loai lop it mau tu tap du lieu mat can bang
topic Học với chi phí nhạy cảm
tập đa lớp
dữ liệu mất cân bằng
url https://ctujsvn.ctu.edu.vn/index.php/ctujsvn/article/view/1907
work_keys_str_mv AT buiminhquan nangcaođochinhxacphanloailopitmaututapdulieumatcanbang
AT huynhxuanhiep nangcaođochinhxacphanloailopitmaututapdulieumatcanbang
AT phamxuanhien nangcaođochinhxacphanloailopitmaututapdulieumatcanbang