Türkçe şarkılar için şarkı sözleri üzerinden müzik duygu sınıflandırması
Müzik insanlık tarihinde önemli bir yere sahiptir. Özellikle dijital çağda kişiler tarafından her gün yaratılan ve ulaşılan müzik koleksiyonlarının büyüklüğü ile müziğin önemi daha da artmış ve insanlar müzik içeren aktivitelere daha fazla zaman ayırmaya başlamışlardır. Bununla birlikte, müziğe bilg...
Main Authors: | , , , |
---|---|
Format: | Article |
Language: | English |
Published: |
Pamukkale University
2018-04-01
|
Series: | Pamukkale University Journal of Engineering Sciences |
Subjects: | |
Online Access: | http://dergipark.org.tr/pajes/issue/36922/419724?publisher=pamukkale |
Summary: | Müzik insanlık tarihinde önemli bir yere
sahiptir. Özellikle dijital çağda kişiler tarafından her gün yaratılan ve
ulaşılan müzik koleksiyonlarının büyüklüğü ile müziğin önemi daha da artmış ve
insanlar müzik içeren aktivitelere daha fazla zaman ayırmaya
başlamışlardır. Bununla birlikte, müziğe bilgi geri getirim
sürecini kolay ve etkin hale getirmek için yapılan katalog bazlı aramalar duygu
tabanlı etiketlere göre aramalara dönüşmüştür. Bu araştırmada amacımız şarkı
sözlerine göre bir şarkıdan algılanan duygunun otomatik olarak çıkarıldığı bir
model geliştirmektir. Model metin bazlı sınıflandırma için kullanılan makina
öğrenmesi algoritmaları ile oluşturulmuştur. Bu amaçla araştırmada 300 şarkı
seçilmiş ve bu şarkılar kişiler tarafından hissedilen duygularına göre
etiketlenmiştir. Devamında metin ön analizi ile şarkı sözleri Türkçe köklerine
ayrıştırılarak Unigram, Bigram ve Trigram kelime özellikleri çıkartılmıştır.
Ardından endeksleri terim sıklığı ve tf-idf değerleri olan doküman bazında
terim matrisleri yaratılmıştır. Bu matris değerleri 5 farklı sınıflandırma
algoritmasına girdi olarak verilerek en yüksek doğruluk sonuçları, hatırlama ve
kesinlik metrikleri üzerinden araştırılmıştır. Araştırmanın sonucunda en yüksek
kesinlik değeri Zemberek Uzun Kök Ayıştırma Metodu ile Unigram kelime
özelliklerine göre ayrıştırılmış ve endeksi terim sıklığına göre belirlenmiş
terim bazlı doküman matrisinin Katlıterim Naïve Bayes kümeleyicisinde verdiği
görülmüştür. Bu kombinasyonda hatırlama metriği değeri 43.7 iken kesinlik
metriği değeri 46.9’dur. |
---|---|
ISSN: | 1300-7009 2147-5881 |