A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning
Dengan majunya perkembangan teknologi beberapa tahun terakhir, menghadirkan banyak konten digital. Hal ini juga menghadirkan kesempatan dalam bidang penelitian seperti halnya Machine Learning. Salah satu metode dalam Machine Learning adalah klasifikasi. Klasifikasi bertujuan untuk mengelompokkan dat...
Main Authors: | , , |
---|---|
Format: | Article |
Language: | Indonesian |
Published: |
LP3M Universitas Nurul Jadid
2024-04-01
|
Series: | Journal of Electrical Engineering and Computer |
Subjects: | |
Online Access: | https://ejournal.unuja.ac.id/index.php/jeecom/article/view/8510 |
_version_ | 1827275882686840832 |
---|---|
author | Muammar Reza Pahlawan Arief Setyanto M. Rudyanto Arief |
author_facet | Muammar Reza Pahlawan Arief Setyanto M. Rudyanto Arief |
author_sort | Muammar Reza Pahlawan |
collection | DOAJ |
description | Dengan majunya perkembangan teknologi beberapa tahun terakhir, menghadirkan banyak konten digital. Hal ini juga menghadirkan kesempatan dalam bidang penelitian seperti halnya Machine Learning. Salah satu metode dalam Machine Learning adalah klasifikasi. Klasifikasi bertujuan untuk mengelompokkan data sesuai dengan kelasnya. Akan tetapi faktor seperti data imbalance dapat menyebabkan hasil dari metode ini menjadi kurang sesuai dengan yang diharapkan. Penelitian ini menyajikan tinjauan komprehensif tentang metode klasifikasi dalam pengolahan teks, dengan fokus pada penanganan tantangan yang ditimbulkan oleh data yang tidak seimbang. Dengan pertumbuhan eksponensial konten digital, kebutuhan untuk mengkategorikan dan menganalisis data teks secara efektif telah menjadi semakin kritis. Metode klasifikasi memainkan peran penting dalam upaya ini, memfasilitasi tugas seperti analisis sentimen, klasifikasi dokumen, dan pengambilan informasi. Namun, keberadaan data imbalance, ditandai oleh distribusi kelas yang condong, menimbulkan hambatan signifikan terhadap keandalan dan efektivitas model klasifikasi. Dengan penelitian ini diharapkan pembaca, dapat mengetahui metode apa saja yang umumnya digunakan dalam metode klasifikasi. Kemampuan metode klasifikasi tersebut pada umumnya ketika dihadapkan pada kasus tertentu seperti data imbalance. Tinjauan ini menyoroti Support Vector Machine (SVM) sebagai metode klasifikasi paling menonjol sebesar 25%, diikuti oleh K-Nearest Neighbours (KNN) dan Random Forest dengan persentase 19%, Decision Tree, dan Naïve Bayes. Metode alternatif yang disesuaikan dengan tujuan penelitian dan tantangan tertentu juga dieksplorasi. Hasil persentase penggunaan metode tersebut didapat dari kumpulan jurnal yang peneliti kumpulkan dan teliti |
first_indexed | 2024-04-24T05:51:31Z |
format | Article |
id | doaj.art-b36d09a650454a2db5d27cf02658f372 |
institution | Directory Open Access Journal |
issn | 2715-0410 2715-6427 |
language | Indonesian |
last_indexed | 2024-04-24T05:51:31Z |
publishDate | 2024-04-01 |
publisher | LP3M Universitas Nurul Jadid |
record_format | Article |
series | Journal of Electrical Engineering and Computer |
spelling | doaj.art-b36d09a650454a2db5d27cf02658f3722024-04-23T12:29:26ZindLP3M Universitas Nurul JadidJournal of Electrical Engineering and Computer2715-04102715-64272024-04-016117718510.33650/jeecom.v6i1.85102920A Comprehensive Review of Clasifier used with Imbalanced Data in Machine LearningMuammar Reza Pahlawan0Arief Setyanto1M. Rudyanto Arief2Magister of Informatics, Universitas AMIKOM YogyakartaMagister of Informatics, Universitas AMIKOM YogyakartaMagister of Informatics, Universitas AMIKOM YogyakartaDengan majunya perkembangan teknologi beberapa tahun terakhir, menghadirkan banyak konten digital. Hal ini juga menghadirkan kesempatan dalam bidang penelitian seperti halnya Machine Learning. Salah satu metode dalam Machine Learning adalah klasifikasi. Klasifikasi bertujuan untuk mengelompokkan data sesuai dengan kelasnya. Akan tetapi faktor seperti data imbalance dapat menyebabkan hasil dari metode ini menjadi kurang sesuai dengan yang diharapkan. Penelitian ini menyajikan tinjauan komprehensif tentang metode klasifikasi dalam pengolahan teks, dengan fokus pada penanganan tantangan yang ditimbulkan oleh data yang tidak seimbang. Dengan pertumbuhan eksponensial konten digital, kebutuhan untuk mengkategorikan dan menganalisis data teks secara efektif telah menjadi semakin kritis. Metode klasifikasi memainkan peran penting dalam upaya ini, memfasilitasi tugas seperti analisis sentimen, klasifikasi dokumen, dan pengambilan informasi. Namun, keberadaan data imbalance, ditandai oleh distribusi kelas yang condong, menimbulkan hambatan signifikan terhadap keandalan dan efektivitas model klasifikasi. Dengan penelitian ini diharapkan pembaca, dapat mengetahui metode apa saja yang umumnya digunakan dalam metode klasifikasi. Kemampuan metode klasifikasi tersebut pada umumnya ketika dihadapkan pada kasus tertentu seperti data imbalance. Tinjauan ini menyoroti Support Vector Machine (SVM) sebagai metode klasifikasi paling menonjol sebesar 25%, diikuti oleh K-Nearest Neighbours (KNN) dan Random Forest dengan persentase 19%, Decision Tree, dan Naïve Bayes. Metode alternatif yang disesuaikan dengan tujuan penelitian dan tantangan tertentu juga dieksplorasi. Hasil persentase penggunaan metode tersebut didapat dari kumpulan jurnal yang peneliti kumpulkan dan telitihttps://ejournal.unuja.ac.id/index.php/jeecom/article/view/8510classification methodssuper vector machine (svm)k-nearest neighbors (knn)random forest, imbalance data |
spellingShingle | Muammar Reza Pahlawan Arief Setyanto M. Rudyanto Arief A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning Journal of Electrical Engineering and Computer classification methods super vector machine (svm) k-nearest neighbors (knn) random forest, imbalance data |
title | A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning |
title_full | A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning |
title_fullStr | A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning |
title_full_unstemmed | A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning |
title_short | A Comprehensive Review of Clasifier used with Imbalanced Data in Machine Learning |
title_sort | comprehensive review of clasifier used with imbalanced data in machine learning |
topic | classification methods super vector machine (svm) k-nearest neighbors (knn) random forest, imbalance data |
url | https://ejournal.unuja.ac.id/index.php/jeecom/article/view/8510 |
work_keys_str_mv | AT muammarrezapahlawan acomprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning AT ariefsetyanto acomprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning AT mrudyantoarief acomprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning AT muammarrezapahlawan comprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning AT ariefsetyanto comprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning AT mrudyantoarief comprehensivereviewofclasifierusedwithimbalanceddatainmachinelearning |