Türkçe ses tanıma sistemlerinde dil modeli boyutunun doğruluk oranına etkisi

Bu çalışmanın hedefi, Dil Modeli (DM) üretmek için kullanılan metin derlem büyüklüğünün, Ses Tanıma Sistemleri (STS) üzerindeki etkisini araştırmaktır. Çalışmada ayrıca DM elde etmek için yapılması gereken işler detaylı olarak anlatılmaktadır. DM istatistiksel olarak oluşturulduğundan, eğitim verisi...

Full description

Bibliographic Details
Main Authors: Behnam ASEFİSARAY, Erhan MENGÜŞOĞLU, Murat HACIÖMEROĞLU, Hayri SEVER
Format: Article
Language:English
Published: Pamukkale University 2016-05-01
Series:Pamukkale University Journal of Engineering Sciences
Subjects:
Online Access:https://dergipark.org.tr/tr/pub/pajes/issue/20566/219179?publisher=pamukkale
Description
Summary:Bu çalışmanın hedefi, Dil Modeli (DM) üretmek için kullanılan metin derlem büyüklüğünün, Ses Tanıma Sistemleri (STS) üzerindeki etkisini araştırmaktır. Çalışmada ayrıca DM elde etmek için yapılması gereken işler detaylı olarak anlatılmaktadır. DM istatistiksel olarak oluşturulduğundan, eğitim verisinde bulunan veri miktarı arttıkça STS doğruluğunun artması beklenmektedir. Fakat Türkçe gibi sondan eklemeli dillerde, kullanılan derlemin büyüklüğünün hangi noktaya kadar sistemin doğruluk oranı üzerinde etkin olacağı önem taşımaktadır. Bu çalışmada, toplanan farklı büyüklükteki metin derlemleri ile konuşma tanıma sisteminde Dil Model Ağırlığı (DMA) ve Aktif Token Sayısı (ATS) parametrelerini değiştirerek yapılan deneyler yer almaktadır. Bu çalışma DM boyutu büyüdükçe Türkçe konuşma tanıma başarımının yükseldiğini göstermektedir. Ancak, DMA ve ATS değerlerinde yapılan ayarlamaların tanıma başarımına olumlu bir etki yaptığı gözlemlenememiştir.
ISSN:1300-7009
2147-5881