Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi

Yazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya ha...

Full description

Bibliographic Details
Main Author: İbrahim Berkan AYDİLEK
Format: Article
Language:English
Published: Pamukkale University 2018-10-01
Series:Pamukkale University Journal of Engineering Sciences
Subjects:
Online Access:https://dergipark.org.tr/tr/pub/pajes/issue/39683/469485?publisher=pamukkale
_version_ 1797923541313650688
author İbrahim Berkan AYDİLEK
author_facet İbrahim Berkan AYDİLEK
author_sort İbrahim Berkan AYDİLEK
collection DOAJ
description Yazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir.
first_indexed 2024-04-10T14:48:10Z
format Article
id doaj.art-7c0d6858e4094d69a8724b7ee241df02
institution Directory Open Access Journal
issn 1300-7009
2147-5881
language English
last_indexed 2024-04-10T14:48:10Z
publishDate 2018-10-01
publisher Pamukkale University
record_format Article
series Pamukkale University Journal of Engineering Sciences
spelling doaj.art-7c0d6858e4094d69a8724b7ee241df022023-02-15T16:07:45ZengPamukkale UniversityPamukkale University Journal of Engineering Sciences1300-70092147-58812018-10-01245906914218Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesiİbrahim Berkan AYDİLEKYazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir.https://dergipark.org.tr/tr/pub/pajes/issue/39683/469485?publisher=pamukkalesoftware defect predictiondecision treesinformation gain ratioyazılım hata tahminikarar ağaçlarıbilgi kazanç oranı
spellingShingle İbrahim Berkan AYDİLEK
Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
Pamukkale University Journal of Engineering Sciences
software defect prediction
decision trees
information gain ratio
yazılım hata tahmini
karar ağaçları
bilgi kazanç oranı
title Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_full Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_fullStr Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_full_unstemmed Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_short Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
title_sort yazilim hata tahmininde kullanilan metriklerin karar agaclarindaki bilgi kazanclarinin incelenmesi ve iyilestirilmesi
topic software defect prediction
decision trees
information gain ratio
yazılım hata tahmini
karar ağaçları
bilgi kazanç oranı
url https://dergipark.org.tr/tr/pub/pajes/issue/39683/469485?publisher=pamukkale
work_keys_str_mv AT ibrahimberkanaydilek yazılımhatatahminindekullanılanmetriklerinkararagaclarındakibilgikazanclarınınincelenmesiveiyilestirilmesi