Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi

Yazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya ha...

Full description

Bibliographic Details
Main Author: İbrahim Berkan Aydilek
Format: Article
Language:English
Published: Pamukkale University 2018-10-01
Series:Pamukkale University Journal of Engineering Sciences
Subjects:
Online Access:http://dergipark.org.tr/pajes/issue/39683/469485?publisher=pamukkale
_version_ 1797906119950073856
author İbrahim Berkan Aydilek
author_facet İbrahim Berkan Aydilek
author_sort İbrahim Berkan Aydilek
collection DOAJ
description Yazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir.
first_indexed 2024-04-10T10:17:15Z
format Article
id doaj.art-ce14fbd2f42948e68d81deedf65050d6
institution Directory Open Access Journal
issn 1300-7009
2147-5881
language English
last_indexed 2024-04-10T10:17:15Z
publishDate 2018-10-01
publisher Pamukkale University
record_format Article
series Pamukkale University Journal of Engineering Sciences
spelling doaj.art-ce14fbd2f42948e68d81deedf65050d62023-02-15T16:21:51ZengPamukkale UniversityPamukkale University Journal of Engineering Sciences1300-70092147-58812018-10-01245906914218Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesiİbrahim Berkan AydilekYazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir.http://dergipark.org.tr/pajes/issue/39683/469485?publisher=pamukkaleSoftware defect predictionDecision treesInformation gain ratioYazılım hata tahminiKarar ağaçlarıBilgi kazanç oranı
spellingShingle İbrahim Berkan Aydilek
Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
Pamukkale University Journal of Engineering Sciences
Software defect prediction
Decision trees
Information gain ratio
Yazılım hata tahmini
Karar ağaçları
Bilgi kazanç oranı
title Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_full Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_fullStr Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_full_unstemmed Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_short Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_sort yazilim hata tahmininde kullanilan metriklerin karar agaclarindaki bilgi kazanclarinin incelenmesi ve iyilestirilmesi
topic Software defect prediction
Decision trees
Information gain ratio
Yazılım hata tahmini
Karar ağaçları
Bilgi kazanç oranı
url http://dergipark.org.tr/pajes/issue/39683/469485?publisher=pamukkale
work_keys_str_mv AT ibrahimberkanaydilek yazılımhatatahminindekullanılanmetriklerinkararagaclarındakibilgikazanclarınınincelenmesiveiyilestirilmesi