NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG
Vấn đề mất cân bằng dữ liệu xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp nhỏ trong tập mất cân bằng là khó khăn. Khi tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Học với chi phí nhạy cảm...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | Vietnamese |
Published: |
Can Tho University Publisher
2013-10-01
|
Series: | Tạp chí Khoa học Đại học Cần Thơ |
Subjects: | |
Online Access: | https://ctujsvn.ctu.edu.vn/index.php/ctujsvn/article/view/1907 |
_version_ | 1797286247389986816 |
---|---|
author | Bùi Minh Quân Huỳnh Xuân Hiệp Phạm Xuân Hiền |
author_facet | Bùi Minh Quân Huỳnh Xuân Hiệp Phạm Xuân Hiền |
author_sort | Bùi Minh Quân |
collection | DOAJ |
description | Vấn đề mất cân bằng dữ liệu xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp nhỏ trong tập mất cân bằng là khó khăn. Khi tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Học với chi phí nhạy cảm là giải pháp hiệu quả để giải quyết vấn đề mất cân bằng. Trong bài báo này, chúng tôi trình bày một hệ thống gọi là hệ thống quyết định với chi phí, hệ thống giúp cải thiện khả năng phân loại chính xác của lớp nhỏ trong tập dữ liệu mất cân bằng, lớp dữ liệu rất được quan tâm. Hệ thống được xây dựng dựa vào kết quả nghiên cứu giải pháp phân loại trên dữ liệu mất cân bằng tiếp cận với chi phí nhạy cảm. Hệ thống được áp dụng vào lĩnh vực chẩn đoán y học, kết quả thực nghiệm cho thấy khả năng phát hiện chính xác bệnh nhân của hệ thống chẩn đoán được
cải thiện. |
first_indexed | 2024-03-07T18:15:30Z |
format | Article |
id | doaj.art-0f806e023afa40e78ceaf9aceec96aae |
institution | Directory Open Access Journal |
issn | 1859-2333 2815-5599 |
language | Vietnamese |
last_indexed | 2024-03-07T18:15:30Z |
publishDate | 2013-10-01 |
publisher | Can Tho University Publisher |
record_format | Article |
series | Tạp chí Khoa học Đại học Cần Thơ |
spelling | doaj.art-0f806e023afa40e78ceaf9aceec96aae2024-03-02T07:32:36ZvieCan Tho University PublisherTạp chí Khoa học Đại học Cần Thơ1859-23332815-55992013-10-01CĐ Công nghệ TTNÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNGBùi Minh Quân0Huỳnh Xuân Hiệp1Phạm Xuân Hiền2BM. Mạng Máy tính & Truyền thông, K.Công nghệ Thông tin &Truyền thôngBM.Công nghệ phần mềm, K.Công nghệ Thông tin &Truyền thôngBộ môn Khoa học Máy tính, K.Công nghệ Thông tin &Truyền thôngVấn đề mất cân bằng dữ liệu xảy ra khi trong tập dữ liệu có lớp chứa số mẫu nhiều hơn các lớp khác. Phân loại chính xác cho mẫu thuộc lớp nhỏ trong tập mất cân bằng là khó khăn. Khi tỷ lệ mất cân bằng của tập dữ liệu càng cao thì việc phát hiện được mẫu của lớp nhỏ càng khó. Học với chi phí nhạy cảm là giải pháp hiệu quả để giải quyết vấn đề mất cân bằng. Trong bài báo này, chúng tôi trình bày một hệ thống gọi là hệ thống quyết định với chi phí, hệ thống giúp cải thiện khả năng phân loại chính xác của lớp nhỏ trong tập dữ liệu mất cân bằng, lớp dữ liệu rất được quan tâm. Hệ thống được xây dựng dựa vào kết quả nghiên cứu giải pháp phân loại trên dữ liệu mất cân bằng tiếp cận với chi phí nhạy cảm. Hệ thống được áp dụng vào lĩnh vực chẩn đoán y học, kết quả thực nghiệm cho thấy khả năng phát hiện chính xác bệnh nhân của hệ thống chẩn đoán được cải thiện.https://ctujsvn.ctu.edu.vn/index.php/ctujsvn/article/view/1907Học với chi phí nhạy cảmtập đa lớpdữ liệu mất cân bằng |
spellingShingle | Bùi Minh Quân Huỳnh Xuân Hiệp Phạm Xuân Hiền NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG Tạp chí Khoa học Đại học Cần Thơ Học với chi phí nhạy cảm tập đa lớp dữ liệu mất cân bằng |
title | NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG |
title_full | NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG |
title_fullStr | NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG |
title_full_unstemmed | NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG |
title_short | NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI LỚP ÍT MẪU TỪ TẬP DỮ LIỆU MẤT CÂN BẰNG |
title_sort | nang cao do chinh xac phan loai lop it mau tu tap du lieu mat can bang |
topic | Học với chi phí nhạy cảm tập đa lớp dữ liệu mất cân bằng |
url | https://ctujsvn.ctu.edu.vn/index.php/ctujsvn/article/view/1907 |
work_keys_str_mv | AT buiminhquan nangcaođochinhxacphanloailopitmaututapdulieumatcanbang AT huynhxuanhiep nangcaođochinhxacphanloailopitmaututapdulieumatcanbang AT phamxuanhien nangcaođochinhxacphanloailopitmaututapdulieumatcanbang |