Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study

A very important task of Natural Language Processing is text categorization (or text classification), which aims to automatically classify a document into categories. This kind of task includes numerous applications, such as sentiment analysis, language or intent detection, heavily used by social-/b...

Full description

Bibliographic Details
Main Authors:	George K. Sidiropoulos, Nikolaos Diamianos, Kyriakos D. Apostolidis, George A. Papakostas
Format:	Article
Language:	English
Published:	MDPI AG 2022-05-01
Series:	Information
Subjects:	Fuzzy Sets Intuitionistic Fuzzy Sets text classification fsmpy
Online Access:	https://www.mdpi.com/2078-2489/13/5/235

_version_	1797499006965776384
author	George K. Sidiropoulos Nikolaos Diamianos Kyriakos D. Apostolidis George A. Papakostas
author_facet	George K. Sidiropoulos Nikolaos Diamianos Kyriakos D. Apostolidis George A. Papakostas
author_sort	George K. Sidiropoulos
collection	DOAJ
description	A very important task of Natural Language Processing is text categorization (or text classification), which aims to automatically classify a document into categories. This kind of task includes numerous applications, such as sentiment analysis, language or intent detection, heavily used by social-/brand-monitoring tools, customer service, and the voice of customer, among others. Since the introduction of Fuzzy Set theory, its application has been tested in many fields, from bioinformatics to industrial and commercial use, as well as in cases with vague, incomplete, or imprecise data, highlighting its importance and usefulness in the fields. The most important aspect of the application of Fuzzy Set theory is the measures employed to calculate how similar or dissimilar two samples in a dataset are. In this study, we evaluate the performance of 43 similarity and 19 distance measures in the task of text document classification, using the widely used BBC News and BBC Sports benchmark datasets. Their performance is optimized through hyperparameter optimization techniques and evaluated via a leave-one-out cross-validation technique, presenting their performance using the accuracy, precision, recall, and F1-score metrics.
first_indexed	2024-03-10T03:41:17Z
format	Article
id	doaj.art-321be2509ec2489bb70d93f9d7419a61
institution	Directory Open Access Journal
issn	2078-2489
language	English
last_indexed	2024-03-10T03:41:17Z
publishDate	2022-05-01
publisher	MDPI AG
record_format	Article
series	Information
spelling	doaj.art-321be2509ec2489bb70d93f9d7419a612023-11-23T11:30:06ZengMDPI AGInformation2078-24892022-05-0113523510.3390/info13050235Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation StudyGeorge K. Sidiropoulos0Nikolaos Diamianos1Kyriakos D. Apostolidis2George A. Papakostas3MLV Research Group, Department of Computer Science, International Hellenic University, 65404 Kavala, GreeceMLV Research Group, Department of Computer Science, International Hellenic University, 65404 Kavala, GreeceMLV Research Group, Department of Computer Science, International Hellenic University, 65404 Kavala, GreeceMLV Research Group, Department of Computer Science, International Hellenic University, 65404 Kavala, GreeceA very important task of Natural Language Processing is text categorization (or text classification), which aims to automatically classify a document into categories. This kind of task includes numerous applications, such as sentiment analysis, language or intent detection, heavily used by social-/brand-monitoring tools, customer service, and the voice of customer, among others. Since the introduction of Fuzzy Set theory, its application has been tested in many fields, from bioinformatics to industrial and commercial use, as well as in cases with vague, incomplete, or imprecise data, highlighting its importance and usefulness in the fields. The most important aspect of the application of Fuzzy Set theory is the measures employed to calculate how similar or dissimilar two samples in a dataset are. In this study, we evaluate the performance of 43 similarity and 19 distance measures in the task of text document classification, using the widely used BBC News and BBC Sports benchmark datasets. Their performance is optimized through hyperparameter optimization techniques and evaluated via a leave-one-out cross-validation technique, presenting their performance using the accuracy, precision, recall, and F1-score metrics.https://www.mdpi.com/2078-2489/13/5/235Fuzzy SetsIntuitionistic Fuzzy Setstext classificationfsmpy
spellingShingle	George K. Sidiropoulos Nikolaos Diamianos Kyriakos D. Apostolidis George A. Papakostas Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study Information Fuzzy Sets Intuitionistic Fuzzy Sets text classification fsmpy
title	Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study
title_full	Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study
title_fullStr	Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study
title_full_unstemmed	Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study
title_short	Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study
title_sort	text classification using intuitionistic fuzzy set measures an evaluation study
topic	Fuzzy Sets Intuitionistic Fuzzy Sets text classification fsmpy
url	https://www.mdpi.com/2078-2489/13/5/235
work_keys_str_mv	AT georgeksidiropoulos textclassificationusingintuitionisticfuzzysetmeasuresanevaluationstudy AT nikolaosdiamianos textclassificationusingintuitionisticfuzzysetmeasuresanevaluationstudy AT kyriakosdapostolidis textclassificationusingintuitionisticfuzzysetmeasuresanevaluationstudy AT georgeapapakostas textclassificationusingintuitionisticfuzzysetmeasuresanevaluationstudy

Text Classification Using Intuitionistic Fuzzy Set Measures—An Evaluation Study

Similar Items