A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning

Dengan majunya perkembangan teknologi beberapa tahun terakhir, menghadirkan banyak konten digital. Hal ini juga menghadirkan kesempatan dalam bidang penelitian seperti halnya Machine Learning. Salah satu metode dalam Machine Learning adalah klasifikasi. Klasifikasi bertujuan untuk mengelompokkan dat...

Full description

Bibliographic Details
Main Authors: Muammar Reza Pahlawan, Arief Setyanto, M. Rudyanto Arief
Format: Article
Language:Indonesian
Published: LP3M Universitas Nurul Jadid 2024-04-01
Series:Journal of Electrical Engineering and Computer
Subjects:
Online Access:https://ejournal.unuja.ac.id/index.php/jeecom/article/view/8510
_version_ 1827275882686840832
author Muammar Reza Pahlawan
Arief Setyanto
M. Rudyanto Arief
author_facet Muammar Reza Pahlawan
Arief Setyanto
M. Rudyanto Arief
author_sort Muammar Reza Pahlawan
collection DOAJ
description Dengan majunya perkembangan teknologi beberapa tahun terakhir, menghadirkan banyak konten digital. Hal ini juga menghadirkan kesempatan dalam bidang penelitian seperti halnya Machine Learning. Salah satu metode dalam Machine Learning adalah klasifikasi. Klasifikasi bertujuan untuk mengelompokkan data sesuai dengan kelasnya. Akan tetapi faktor seperti data imbalance dapat menyebabkan hasil dari metode ini menjadi kurang sesuai dengan yang diharapkan. Penelitian ini menyajikan tinjauan komprehensif tentang metode klasifikasi dalam pengolahan teks, dengan fokus pada penanganan tantangan yang ditimbulkan oleh data yang tidak seimbang. Dengan pertumbuhan eksponensial konten digital, kebutuhan untuk mengkategorikan dan menganalisis data teks secara efektif telah menjadi semakin kritis. Metode klasifikasi memainkan peran penting dalam upaya ini, memfasilitasi tugas seperti analisis sentimen, klasifikasi dokumen, dan pengambilan informasi. Namun, keberadaan data imbalance, ditandai oleh distribusi kelas yang condong, menimbulkan hambatan signifikan terhadap keandalan dan efektivitas model klasifikasi. Dengan penelitian ini diharapkan pembaca, dapat mengetahui metode apa saja yang umumnya digunakan dalam metode klasifikasi. Kemampuan metode klasifikasi tersebut pada umumnya ketika dihadapkan pada kasus tertentu seperti data imbalance. Tinjauan ini menyoroti Support Vector Machine (SVM) sebagai metode klasifikasi paling menonjol sebesar 25%, diikuti oleh K-Nearest Neighbours (KNN) dan Random Forest dengan persentase 19%, Decision Tree, dan Naïve Bayes. Metode alternatif yang disesuaikan dengan tujuan penelitian dan tantangan tertentu juga dieksplorasi. Hasil persentase penggunaan metode tersebut didapat dari kumpulan jurnal yang peneliti kumpulkan dan teliti
first_indexed 2024-04-24T05:51:31Z
format Article
id doaj.art-b36d09a650454a2db5d27cf02658f372
institution Directory Open Access Journal
issn 2715-0410
2715-6427
language Indonesian
last_indexed 2024-04-24T05:51:31Z
publishDate 2024-04-01
publisher LP3M Universitas Nurul Jadid
record_format Article
series Journal of Electrical Engineering and Computer
spelling doaj.art-b36d09a650454a2db5d27cf02658f3722024-04-23T12:29:26ZindLP3M Universitas Nurul JadidJournal of Electrical Engineering and Computer2715-04102715-64272024-04-016117718510.33650/jeecom.v6i1.85102920A Comprehensive Review of Clasifier used with Imbalanced Data in Machine LearningMuammar Reza Pahlawan0Arief Setyanto1M. Rudyanto Arief2Magister of Informatics, Universitas AMIKOM YogyakartaMagister of Informatics, Universitas AMIKOM YogyakartaMagister of Informatics, Universitas AMIKOM YogyakartaDengan majunya perkembangan teknologi beberapa tahun terakhir, menghadirkan banyak konten digital. Hal ini juga menghadirkan kesempatan dalam bidang penelitian seperti halnya Machine Learning. Salah satu metode dalam Machine Learning adalah klasifikasi. Klasifikasi bertujuan untuk mengelompokkan data sesuai dengan kelasnya. Akan tetapi faktor seperti data imbalance dapat menyebabkan hasil dari metode ini menjadi kurang sesuai dengan yang diharapkan. Penelitian ini menyajikan tinjauan komprehensif tentang metode klasifikasi dalam pengolahan teks, dengan fokus pada penanganan tantangan yang ditimbulkan oleh data yang tidak seimbang. Dengan pertumbuhan eksponensial konten digital, kebutuhan untuk mengkategorikan dan menganalisis data teks secara efektif telah menjadi semakin kritis. Metode klasifikasi memainkan peran penting dalam upaya ini, memfasilitasi tugas seperti analisis sentimen, klasifikasi dokumen, dan pengambilan informasi. Namun, keberadaan data imbalance, ditandai oleh distribusi kelas yang condong, menimbulkan hambatan signifikan terhadap keandalan dan efektivitas model klasifikasi. Dengan penelitian ini diharapkan pembaca, dapat mengetahui metode apa saja yang umumnya digunakan dalam metode klasifikasi. Kemampuan metode klasifikasi tersebut pada umumnya ketika dihadapkan pada kasus tertentu seperti data imbalance. Tinjauan ini menyoroti Support Vector Machine (SVM) sebagai metode klasifikasi paling menonjol sebesar 25%, diikuti oleh K-Nearest Neighbours (KNN) dan Random Forest dengan persentase 19%, Decision Tree, dan Naïve Bayes. Metode alternatif yang disesuaikan dengan tujuan penelitian dan tantangan tertentu juga dieksplorasi. Hasil persentase penggunaan metode tersebut didapat dari kumpulan jurnal yang peneliti kumpulkan dan telitihttps://ejournal.unuja.ac.id/index.php/jeecom/article/view/8510classification methodssuper vector machine (svm)k-nearest neighbors (knn)random forest, imbalance data
spellingShingle Muammar Reza Pahlawan
Arief Setyanto
M. Rudyanto Arief
A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning
Journal of Electrical Engineering and Computer
classification methods
super vector machine (svm)
k-nearest neighbors (knn)
random forest, imbalance data
title A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning
title_full A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning
title_fullStr A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning
title_full_unstemmed A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning
title_short A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning
title_sort comprehensive review of clasifier used with imbalanced data in machine learning
topic classification methods
super vector machine (svm)
k-nearest neighbors (knn)
random forest, imbalance data
url https://ejournal.unuja.ac.id/index.php/jeecom/article/view/8510
work_keys_str_mv AT muammarrezapahlawan acomprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning
AT ariefsetyanto acomprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning
AT mrudyantoarief acomprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning
AT muammarrezapahlawan comprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning
AT ariefsetyanto comprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning
AT mrudyantoarief comprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning