Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing
Klasifikasi merupakan teknik dalam data mining untuk mengelompokkan data berdasarkan keterikatan data terhadap data sampel. Pada penelitian ini, kami melakukan perbandingan 9 teknik klasifikasi untuk mengklasifikasi respon pelanggan pada dataset Bank Direct Marketing. Perbandingan teknik klasifikas...
Main Authors: | , |
---|---|
Format: | Article |
Language: | Indonesian |
Published: |
University of Brawijaya
2018-10-01
|
Series: | Jurnal Teknologi Informasi dan Ilmu Komputer |
Subjects: | |
Online Access: | https://jtiik.ub.ac.id/index.php/jtiik/article/view/958 |
_version_ | 1797220131619733504 |
---|---|
author | Irvi Oktanisa Ahmad Afif Supianto |
author_facet | Irvi Oktanisa Ahmad Afif Supianto |
author_sort | Irvi Oktanisa |
collection | DOAJ |
description | Klasifikasi merupakan teknik dalam data mining untuk mengelompokkan data berdasarkan keterikatan data terhadap data sampel. Pada penelitian ini, kami melakukan perbandingan 9 teknik klasifikasi untuk mengklasifikasi respon pelanggan pada dataset Bank Direct Marketing. Perbandingan teknik klasifikasi ini dilakukan untuk mengetahui model dalam teknik klasfikasi yang paling efektif untuk mengklasifikasi target pada dataset Bank Direct Marketing. Teknik klasifikasi yang digunakan yaitu Support Vector Machine, AdaBoost, Naïve Bayes, Constant, KNN, Tree, Random Forest, Stochastic Gradient Descent, dan CN2 Rule. Proses klasifikasi diawali dengan preprocessing data untuk melakukan penghilangan missing value dan pemilihan fitur pada dataset. Pada tahap evaluasi digunakan teknik 10 fold cross validation. Setelah dilakukan pengujian, didapatkan bahwa hasil klasifikasi menunjukkan akurasi terbaik diperoleh oleh model Tree, Constant, Naive Bayes, dan Stochastic Gardient Descent. Kemudian diikuti oleh model Random Forest, K-Nearest Neighbor, CN-2 Rule, AdaBoost dan Support Vector Machine. Dari keempat model yang menunjukkan hasil akurasi terbaik, untuk kasus ini Stochastic Gradient Descent terpilih sebagai model yang memiliki akurasi terbaik dengan nilai akurasi sebesar 0,972 dan hasil visualisasi yang dihasilkan lebih jelas untuk mengklasifikasi target pada dataset Bank Direct Marketing.
Abstract
Classification is a technique in data mining to classify data based on the attachment of data to the sample data.. In this paper, we present the comparison of 9 classification techniques performed to classify customer response on the dataset of Bank Direct Marketing. The techniques performed to find out the effectiveness model in the classification technique used to classify targets on the dataset of Bank Direct Marketing. The techniques used are Support Vector Machine, AdaBoost, Naïve Bayes, Constant, KNN, Tree, Random Forest, Stochastic Gradient Descent, and CN2 Rule. The classification process begins with preprocessing data to perform missing value omissions and feature selection on the dataset. Cross validation technique, with k value is 10, used in the evaluation stage. After testing, it was found that the classification results showed the best accuracy obtained when using the Tree model, Constant, Naive Bayes and Stochastic Gradient Descent. Afterwards the Random Forest model, K-Nearest Neighbor, CN-2 Rule, AdaBoost, and Support Vector Machine are followed. Of the four models with the high accuracy results, in this case Stochastic Gradient Descent was selected as the best accuracy model with an accuracy value of 0.972 and resulting visualization more clearly to classify targets on the dataset of Bank Direct Marketing. |
first_indexed | 2024-04-24T12:44:40Z |
format | Article |
id | doaj.art-5814ad4574b445f7be8b2b22995b7bff |
institution | Directory Open Access Journal |
issn | 2355-7699 2528-6579 |
language | Indonesian |
last_indexed | 2024-04-24T12:44:40Z |
publishDate | 2018-10-01 |
publisher | University of Brawijaya |
record_format | Article |
series | Jurnal Teknologi Informasi dan Ilmu Komputer |
spelling | doaj.art-5814ad4574b445f7be8b2b22995b7bff2024-04-07T08:47:35ZindUniversity of BrawijayaJurnal Teknologi Informasi dan Ilmu Komputer2355-76992528-65792018-10-015510.25126/jtiik.201855958341Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct MarketingIrvi Oktanisa0Ahmad Afif Supianto1Mahasiswa Magister Fakultas Ilmu Komputer - Universitas BrawijayaFakultas Ilmu Komputer, Universitas BrawijayaKlasifikasi merupakan teknik dalam data mining untuk mengelompokkan data berdasarkan keterikatan data terhadap data sampel. Pada penelitian ini, kami melakukan perbandingan 9 teknik klasifikasi untuk mengklasifikasi respon pelanggan pada dataset Bank Direct Marketing. Perbandingan teknik klasifikasi ini dilakukan untuk mengetahui model dalam teknik klasfikasi yang paling efektif untuk mengklasifikasi target pada dataset Bank Direct Marketing. Teknik klasifikasi yang digunakan yaitu Support Vector Machine, AdaBoost, Naïve Bayes, Constant, KNN, Tree, Random Forest, Stochastic Gradient Descent, dan CN2 Rule. Proses klasifikasi diawali dengan preprocessing data untuk melakukan penghilangan missing value dan pemilihan fitur pada dataset. Pada tahap evaluasi digunakan teknik 10 fold cross validation. Setelah dilakukan pengujian, didapatkan bahwa hasil klasifikasi menunjukkan akurasi terbaik diperoleh oleh model Tree, Constant, Naive Bayes, dan Stochastic Gardient Descent. Kemudian diikuti oleh model Random Forest, K-Nearest Neighbor, CN-2 Rule, AdaBoost dan Support Vector Machine. Dari keempat model yang menunjukkan hasil akurasi terbaik, untuk kasus ini Stochastic Gradient Descent terpilih sebagai model yang memiliki akurasi terbaik dengan nilai akurasi sebesar 0,972 dan hasil visualisasi yang dihasilkan lebih jelas untuk mengklasifikasi target pada dataset Bank Direct Marketing. Abstract Classification is a technique in data mining to classify data based on the attachment of data to the sample data.. In this paper, we present the comparison of 9 classification techniques performed to classify customer response on the dataset of Bank Direct Marketing. The techniques performed to find out the effectiveness model in the classification technique used to classify targets on the dataset of Bank Direct Marketing. The techniques used are Support Vector Machine, AdaBoost, Naïve Bayes, Constant, KNN, Tree, Random Forest, Stochastic Gradient Descent, and CN2 Rule. The classification process begins with preprocessing data to perform missing value omissions and feature selection on the dataset. Cross validation technique, with k value is 10, used in the evaluation stage. After testing, it was found that the classification results showed the best accuracy obtained when using the Tree model, Constant, Naive Bayes and Stochastic Gradient Descent. Afterwards the Random Forest model, K-Nearest Neighbor, CN-2 Rule, AdaBoost, and Support Vector Machine are followed. Of the four models with the high accuracy results, in this case Stochastic Gradient Descent was selected as the best accuracy model with an accuracy value of 0.972 and resulting visualization more clearly to classify targets on the dataset of Bank Direct Marketing.https://jtiik.ub.ac.id/index.php/jtiik/article/view/958Pebandinganklasifikasidata miningdecission treemachine learningbank direct marketing |
spellingShingle | Irvi Oktanisa Ahmad Afif Supianto Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing Jurnal Teknologi Informasi dan Ilmu Komputer Pebandingan klasifikasi data mining decission tree machine learning bank direct marketing |
title | Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing |
title_full | Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing |
title_fullStr | Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing |
title_full_unstemmed | Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing |
title_short | Perbandingan Teknik Klasifikasi Dalam Data Mining Untuk Bank Direct Marketing |
title_sort | perbandingan teknik klasifikasi dalam data mining untuk bank direct marketing |
topic | Pebandingan klasifikasi data mining decission tree machine learning bank direct marketing |
url | https://jtiik.ub.ac.id/index.php/jtiik/article/view/958 |
work_keys_str_mv | AT irvioktanisa perbandinganteknikklasifikasidalamdatamininguntukbankdirectmarketing AT ahmadafifsupianto perbandinganteknikklasifikasidalamdatamininguntukbankdirectmarketing |