Türkçe için karşılaştırmalı metin sınıflandırma analizi
Metin Sınıflandırma Doğal Dil İşleme (DDİ) alanında önemli bir yere sahiptir. Son zamanlarda metinsel verilerin artması ve otomatik etiketlenmesi gerekliliği, metin sınıflandırma probleminin önemini artırmıştır. Geleneksel yaklaşımlardan öne çıkan kelime torbası yöntemi yıllardır metin sınıflandırma...
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Pamukkale University
2018-10-01
|
Series: | Pamukkale University Journal of Engineering Sciences |
Subjects: | |
Online Access: | https://dergipark.org.tr/tr/pub/pajes/issue/39683/469474 |
_version_ | 1828030560838090752 |
---|---|
author | Tuğba Yıldız Savaş Yıldırım |
author_facet | Tuğba Yıldız Savaş Yıldırım |
author_sort | Tuğba Yıldız |
collection | DOAJ |
description | Metin
Sınıflandırma Doğal Dil İşleme (DDİ) alanında önemli bir yere sahiptir. Son
zamanlarda metinsel verilerin artması ve otomatik etiketlenmesi gerekliliği,
metin sınıflandırma probleminin önemini artırmıştır. Geleneksel yaklaşımlardan
öne çıkan kelime torbası yöntemi yıllardır metin sınıflandırmasında başarılı
olmaktadır. Son zamanlarda sinir ağları dil modelleri DDİ problemlerine
başarılı bir şekilde uygulanmış ve bazı alanlarda büyük başarı kaydetmişlerdir.
Yapay Sinir Ağları (YSA) temelli mimarilerin en önemli avantajı daha etkili
kelime ve metin gösterilimlerin oluşturmasıdır. Bu gösterilimler, geleneksel
yöntemlere göre daha az boyutlu ve daha etkili bulunmuştur. Özellikle
anlambilimsel ve sözdizimsel analizlerde başarılı uygulamalar yapılmıştır. Öte
yandan daha uzun vektörlerle gösterilim kullanan geleneksel kelime torbası yöntemleri,
metin gösterilimleri anlamında hala gücünü korumaktadır. Ancak Türkçe için bu
iki yaklaşımın herhangi bir karşılaştırılması yapılmamıştır. Bu çalışmada,
geleneksel kelime torbası yaklaşımı ile sinir ağı temelli yeni gösterilim
yaklaşımları metin sınıflandırması açısından karşılaştırılmıştır. Bu
çalışmalarda gördük ki etkili özellik seçimleri geleneksel yöntemlerinin hala
yeni kuşak kelime gömme (word embeddings) yaklaşımı ile yarışacak düzeydedir.
Son olarak deneylerimizi bu iki yaklaşım açısından çeşitlendirerek raporladık
ve Türkçe için başarılı metin sınıflandırma mimarisini bu raporda ayrıntılı
tartıştık. |
first_indexed | 2024-04-10T14:30:04Z |
format | Article |
id | doaj.art-e43e49f4a5e24aadba84ab9b47ceeecf |
institution | Directory Open Access Journal |
issn | 1300-7009 2147-5881 |
language | English |
last_indexed | 2024-04-10T14:30:04Z |
publishDate | 2018-10-01 |
publisher | Pamukkale University |
record_format | Article |
series | Pamukkale University Journal of Engineering Sciences |
spelling | doaj.art-e43e49f4a5e24aadba84ab9b47ceeecf2023-02-15T16:08:52ZengPamukkale UniversityPamukkale University Journal of Engineering Sciences1300-70092147-58812018-10-01245879886218Türkçe için karşılaştırmalı metin sınıflandırma analiziTuğba YıldızSavaş YıldırımMetin Sınıflandırma Doğal Dil İşleme (DDİ) alanında önemli bir yere sahiptir. Son zamanlarda metinsel verilerin artması ve otomatik etiketlenmesi gerekliliği, metin sınıflandırma probleminin önemini artırmıştır. Geleneksel yaklaşımlardan öne çıkan kelime torbası yöntemi yıllardır metin sınıflandırmasında başarılı olmaktadır. Son zamanlarda sinir ağları dil modelleri DDİ problemlerine başarılı bir şekilde uygulanmış ve bazı alanlarda büyük başarı kaydetmişlerdir. Yapay Sinir Ağları (YSA) temelli mimarilerin en önemli avantajı daha etkili kelime ve metin gösterilimlerin oluşturmasıdır. Bu gösterilimler, geleneksel yöntemlere göre daha az boyutlu ve daha etkili bulunmuştur. Özellikle anlambilimsel ve sözdizimsel analizlerde başarılı uygulamalar yapılmıştır. Öte yandan daha uzun vektörlerle gösterilim kullanan geleneksel kelime torbası yöntemleri, metin gösterilimleri anlamında hala gücünü korumaktadır. Ancak Türkçe için bu iki yaklaşımın herhangi bir karşılaştırılması yapılmamıştır. Bu çalışmada, geleneksel kelime torbası yaklaşımı ile sinir ağı temelli yeni gösterilim yaklaşımları metin sınıflandırması açısından karşılaştırılmıştır. Bu çalışmalarda gördük ki etkili özellik seçimleri geleneksel yöntemlerinin hala yeni kuşak kelime gömme (word embeddings) yaklaşımı ile yarışacak düzeydedir. Son olarak deneylerimizi bu iki yaklaşım açısından çeşitlendirerek raporladık ve Türkçe için başarılı metin sınıflandırma mimarisini bu raporda ayrıntılı tartıştık.https://dergipark.org.tr/tr/pub/pajes/issue/39683/469474text classificationmachine learningartificial neural networkmetin sınıflandırmamakine öğrenmesiyapay sinir ağları |
spellingShingle | Tuğba Yıldız Savaş Yıldırım Türkçe için karşılaştırmalı metin sınıflandırma analizi Pamukkale University Journal of Engineering Sciences text classification machine learning artificial neural network metin sınıflandırma makine öğrenmesi yapay sinir ağları |
title | Türkçe için karşılaştırmalı metin sınıflandırma analizi |
title_full | Türkçe için karşılaştırmalı metin sınıflandırma analizi |
title_fullStr | Türkçe için karşılaştırmalı metin sınıflandırma analizi |
title_full_unstemmed | Türkçe için karşılaştırmalı metin sınıflandırma analizi |
title_short | Türkçe için karşılaştırmalı metin sınıflandırma analizi |
title_sort | turkce icin karsilastirmali metin siniflandirma analizi |
topic | text classification machine learning artificial neural network metin sınıflandırma makine öğrenmesi yapay sinir ağları |
url | https://dergipark.org.tr/tr/pub/pajes/issue/39683/469474 |
work_keys_str_mv | AT tugbayıldız turkceicinkarsılastırmalımetinsınıflandırmaanalizi AT savasyıldırım turkceicinkarsılastırmalımetinsınıflandırmaanalizi |