Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi
Yazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya ha...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
Pamukkale University
2018-10-01
|
Series: | Pamukkale University Journal of Engineering Sciences |
Subjects: | |
Online Access: | http://dergipark.org.tr/pajes/issue/39683/469485?publisher=pamukkale |
_version_ | 1797906119950073856 |
---|---|
author | İbrahim Berkan Aydilek |
author_facet | İbrahim Berkan Aydilek |
author_sort | İbrahim Berkan Aydilek |
collection | DOAJ |
description | Yazılım
kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım
metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve
Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek
olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya
meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve
zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için
kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı
kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle
dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme
yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları
ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi
algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini
için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE
yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri
artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı
yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı
performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç
oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir. |
first_indexed | 2024-04-10T10:17:15Z |
format | Article |
id | doaj.art-ce14fbd2f42948e68d81deedf65050d6 |
institution | Directory Open Access Journal |
issn | 1300-7009 2147-5881 |
language | English |
last_indexed | 2024-04-10T10:17:15Z |
publishDate | 2018-10-01 |
publisher | Pamukkale University |
record_format | Article |
series | Pamukkale University Journal of Engineering Sciences |
spelling | doaj.art-ce14fbd2f42948e68d81deedf65050d62023-02-15T16:21:51ZengPamukkale UniversityPamukkale University Journal of Engineering Sciences1300-70092147-58812018-10-01245906914218Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesiİbrahim Berkan AydilekYazılım kalitesinin somut bir şekilde ölçülebilmesi için kullanılan sayısal yazılım metrikleri içinde bilinen ve yaygın şekilde kullanılanlar arasında McCabe ve Halstead yöntem-seviye metrikleri bulunmaktadır. Yazılım hata tahmini, geliştirilecek olan yazılımda bulunan alt modüllerin hangisi veya hangilerinin daha çok hataya meyilli olabileceğini konusunda öngörüde bulunabilmektedir. Böylece işgücü ve zaman konusundaki kayıpların önüne geçilebilmektedir. Yazılım hata tahmini için kullanılan veri kümelerinde, hata var sınıflı kayıt sayısı, hata yok sınıflı kayıt sayısına göre daha az sayıda olabildiğinden bu veri kümeleri genellikle dengeli olmayan bir sınıf dağılımına sahip olmakta ve makine öğrenme yöntemlerinin sonuçlarını olumsuz etkilemektedir. Bilgi kazancı, karar ağaçları ve karar ağacı temeline dayanan kural sınıflayıcı, nitelik seçimi gibi algoritma ve yöntemlerde kullanılmaktadır. Bu çalışmada, yazılım hata tahmini için önemli bilgiler sunan yazılım metrikleri incelenmiş, NASA’nın PROMISE yazılım veri deposundan CM1, JM1, KC1 ve PC1 veri kümeleri sentetik veri artırım Smote algoritması ile daha dengeli hale getirilerek bilgi kazancı yönünden iyileştirilmiştir. Sonuçta karar ağaçlarında sınıflama başarı performansı daha yüksek yazılım hata tahmini veri kümeleri ve bilgi kazanç oranı yükseltilmiş yazılım metrik değerleri elde edilmiştir.http://dergipark.org.tr/pajes/issue/39683/469485?publisher=pamukkaleSoftware defect predictionDecision treesInformation gain ratioYazılım hata tahminiKarar ağaçlarıBilgi kazanç oranı |
spellingShingle | İbrahim Berkan Aydilek Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi Pamukkale University Journal of Engineering Sciences Software defect prediction Decision trees Information gain ratio Yazılım hata tahmini Karar ağaçları Bilgi kazanç oranı |
title | Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi |
title_full | Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi |
title_fullStr | Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi |
title_full_unstemmed | Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi |
title_short | Yazılım hata tahmininde kullanılan metriklerin karar ağaçlarındaki bilgi kazançlarının incelenmesi ve iyileştirilmesi |
title_sort | yazilim hata tahmininde kullanilan metriklerin karar agaclarindaki bilgi kazanclarinin incelenmesi ve iyilestirilmesi |
topic | Software defect prediction Decision trees Information gain ratio Yazılım hata tahmini Karar ağaçları Bilgi kazanç oranı |
url | http://dergipark.org.tr/pajes/issue/39683/469485?publisher=pamukkale |
work_keys_str_mv | AT ibrahimberkanaydilek yazılımhatatahminindekullanılanmetriklerinkararagaclarındakibilgikazanclarınınincelenmesiveiyilestirilmesi |