Türkçe için karşılaştırmalı metin sınıflandırma analizi

Metin Sınıflandırma Doğal Dil İşleme (DDİ) alanında önemli bir yere sahiptir. Son zamanlarda metinsel verilerin artması ve otomatik etiketlenmesi gerekliliği, metin sınıflandırma probleminin önemini artırmıştır. Geleneksel yaklaşımlardan öne çıkan kelime torbası yöntemi yıllardır metin sınıflandırma...

Full description

Bibliographic Details
Main Authors: Savaş Yıldırım, Tuğba Yıldız
Format: Article
Language:English
Published: Pamukkale University 2018-10-01
Series:Pamukkale University Journal of Engineering Sciences
Subjects:
Online Access:http://dergipark.gov.tr/pajes/issue/39683/469474?publisher=pamukkale
_version_ 1797916444020703232
author Savaş Yıldırım
Tuğba Yıldız
author_facet Savaş Yıldırım
Tuğba Yıldız
author_sort Savaş Yıldırım
collection DOAJ
description Metin Sınıflandırma Doğal Dil İşleme (DDİ) alanında önemli bir yere sahiptir. Son zamanlarda metinsel verilerin artması ve otomatik etiketlenmesi gerekliliği, metin sınıflandırma probleminin önemini artırmıştır. Geleneksel yaklaşımlardan öne çıkan kelime torbası yöntemi yıllardır metin sınıflandırmasında başarılı olmaktadır. Son zamanlarda sinir ağları dil modelleri DDİ problemlerine başarılı bir şekilde uygulanmış ve bazı alanlarda büyük başarı kaydetmişlerdir. Yapay Sinir Ağları (YSA) temelli mimarilerin en önemli avantajı daha etkili kelime ve metin gösterilimlerin oluşturmasıdır. Bu gösterilimler, geleneksel yöntemlere göre daha az boyutlu ve daha etkili bulunmuştur. Özellikle anlambilimsel ve sözdizimsel analizlerde başarılı uygulamalar yapılmıştır. Öte yandan daha uzun vektörlerle gösterilim kullanan geleneksel kelime torbası yöntemleri, metin gösterilimleri anlamında hala gücünü korumaktadır. Ancak Türkçe için bu iki yaklaşımın herhangi bir karşılaştırılması yapılmamıştır. Bu çalışmada, geleneksel kelime torbası yaklaşımı ile sinir ağı temelli yeni gösterilim yaklaşımları metin sınıflandırması açısından karşılaştırılmıştır. Bu çalışmalarda gördük ki etkili özellik seçimleri geleneksel yöntemlerinin hala yeni kuşak kelime gömme (word embeddings) yaklaşımı ile yarışacak düzeydedir. Son olarak deneylerimizi bu iki yaklaşım açısından çeşitlendirerek raporladık ve Türkçe için başarılı metin sınıflandırma mimarisini bu raporda ayrıntılı tartıştık.
first_indexed 2024-04-10T12:57:17Z
format Article
id doaj.art-90230050611042c8b918a58954fb7d40
institution Directory Open Access Journal
issn 1300-7009
2147-5881
language English
last_indexed 2024-04-10T12:57:17Z
publishDate 2018-10-01
publisher Pamukkale University
record_format Article
series Pamukkale University Journal of Engineering Sciences
spelling doaj.art-90230050611042c8b918a58954fb7d402023-02-15T16:13:23ZengPamukkale UniversityPamukkale University Journal of Engineering Sciences1300-70092147-58812018-10-01245879886218Türkçe için karşılaştırmalı metin sınıflandırma analiziSavaş YıldırımTuğba YıldızMetin Sınıflandırma Doğal Dil İşleme (DDİ) alanında önemli bir yere sahiptir. Son zamanlarda metinsel verilerin artması ve otomatik etiketlenmesi gerekliliği, metin sınıflandırma probleminin önemini artırmıştır. Geleneksel yaklaşımlardan öne çıkan kelime torbası yöntemi yıllardır metin sınıflandırmasında başarılı olmaktadır. Son zamanlarda sinir ağları dil modelleri DDİ problemlerine başarılı bir şekilde uygulanmış ve bazı alanlarda büyük başarı kaydetmişlerdir. Yapay Sinir Ağları (YSA) temelli mimarilerin en önemli avantajı daha etkili kelime ve metin gösterilimlerin oluşturmasıdır. Bu gösterilimler, geleneksel yöntemlere göre daha az boyutlu ve daha etkili bulunmuştur. Özellikle anlambilimsel ve sözdizimsel analizlerde başarılı uygulamalar yapılmıştır. Öte yandan daha uzun vektörlerle gösterilim kullanan geleneksel kelime torbası yöntemleri, metin gösterilimleri anlamında hala gücünü korumaktadır. Ancak Türkçe için bu iki yaklaşımın herhangi bir karşılaştırılması yapılmamıştır. Bu çalışmada, geleneksel kelime torbası yaklaşımı ile sinir ağı temelli yeni gösterilim yaklaşımları metin sınıflandırması açısından karşılaştırılmıştır. Bu çalışmalarda gördük ki etkili özellik seçimleri geleneksel yöntemlerinin hala yeni kuşak kelime gömme (word embeddings) yaklaşımı ile yarışacak düzeydedir. Son olarak deneylerimizi bu iki yaklaşım açısından çeşitlendirerek raporladık ve Türkçe için başarılı metin sınıflandırma mimarisini bu raporda ayrıntılı tartıştık.http://dergipark.gov.tr/pajes/issue/39683/469474?publisher=pamukkaleText classificationMachine learningArtificial neural networkMetin sınıflandırmaMakine öğrenmesiYapay sinir ağları
spellingShingle Savaş Yıldırım
Tuğba Yıldız
Türkçe için karşılaştırmalı metin sınıflandırma analizi
Pamukkale University Journal of Engineering Sciences
Text classification
Machine learning
Artificial neural network
Metin sınıflandırma
Makine öğrenmesi
Yapay sinir ağları
title Türkçe için karşılaştırmalı metin sınıflandırma analizi
title_full Türkçe için karşılaştırmalı metin sınıflandırma analizi
title_fullStr Türkçe için karşılaştırmalı metin sınıflandırma analizi
title_full_unstemmed Türkçe için karşılaştırmalı metin sınıflandırma analizi
title_short Türkçe için karşılaştırmalı metin sınıflandırma analizi
title_sort turkce icin karsilastirmali metin siniflandirma analizi
topic Text classification
Machine learning
Artificial neural network
Metin sınıflandırma
Makine öğrenmesi
Yapay sinir ağları
url http://dergipark.gov.tr/pajes/issue/39683/469474?publisher=pamukkale
work_keys_str_mv AT savasyıldırım turkceicinkarsılastırmalımetinsınıflandırmaanalizi
AT tugbayıldız turkceicinkarsılastırmalımetinsınıflandırmaanalizi