Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes Untuk Prediksi Cacat Software

Nurul Ichsan, Haerul Fatah, Erni Ermawati, Indriyanti Indriyanti, Tri Wahyuni

Abstract


Software berkualitas tinggi adalah software yang tidak ditemukan cacat (defect) selama proses pemeriksaan atau pengujian. Biaya perbaikan cacat software jauh lebih mahal dibanding biaya saat pengembangan. Prediksi cacat software diusulkan untuk menentukan prioritas modul software yang akan diuji, sehingga mampu meningkatkan kualitas software serta mungurangi biaya. Masalah utama dalam software defect prediction adalah redundant data, korelasi, fitur yang tidak relevan dan missing samples.  62 penelitian dari 208 penelitian dalam pengembangan model prediksi cacat software menggunakan dataset NASA (National Aeronautics and Space Administration) MDP Repository. Penanganan imbalance class dilakukan dengan menggunakan sampling technique Distribution Based Balance dan pendekatan level algoritma dengan teknik ensemble learning menggunakan Bagging. Algoritma klasifikasi yang digunakan dalam penelitian ini yaitu classifier Naïve Bayes. Hasil  penelitian  menunjukkan  bahwa  model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih tinggi. Pada Model Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes rata-rata nilai akurasi mencapai 98,71%, rata-rata nilai AUC 0.987 dengan nilai rata-rata peningkatan presentase AUC mencapai 0.373. Sedangkan pada model pembanding yaitu Integrasi SMOTE dan Teknik Ensemble Naïve Bayes rata-rata nilai akurasi mencapai 73,30%, rata-rata nilai AUC 0,639 dengan nilai rata-rata peningkatan presentase AUC mencapai 0,025. Dari hasil tersebut dapat disimpulkan  bahwa  model  yang  diusulkan  yaitu Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes merupakan  model  terbaik  untuk menangani imbalance class.


Keywords


Distribution Based Balance; Bagging, Naïve Bayes; Imbalance Class

References


A. Hardoni, D. P. Rini, and S. Sukemi, “Integrasi SMOTE pada Naive Bayes dan Logistic Regression Berbasis Particle Swarm Optimization untuk Prediksi Cacat Perangkat Lunak,†J. Media Inform. Budidarma, vol. 5, no. 1, p. 233, 2021, doi: 10.30865/mib.v5i1.2616.

R. Prasetyo, I. Nawawi, A. Fauzi, and G. Ginabila, “Komparasi Algoritma Logistic Regression dan Random Forest pada Prediksi Cacat Software,†J. Tek. Inform. UNIKA St. Thomas, vol. 06, no. Siringoringo 2017, pp. 275–281, 2021, doi: 10.54367/jtiust.v6i2.1522.

N. Ichsan, “Metoda Distribution Based Balance dan Bagging C4 . 5,†Indones. J. Comput. Inf. Technol., vol. 4, no. 2, pp. 215–224, 2019.

Sugiono, A. Taufik, and R. Faizal Amir, “Penerapan Penerapan Teknik Pso Over Sampling Dan Adaboost J48 Untuk Memprediksi Cacat Software,†J. Responsif Ris. Sains dan Inform., vol. 2, no. 2, pp. 198–203, 2020, doi: 10.51977/jti.v2i2.249.

S. A. Putri, “Prediksi Cacat Software Dengan Teknik Sampel Dan Seleksi Fitur Pada Bayesian Network,†J. Kaji. Ilm., vol. 19, no. 1, p. 17, 2019, doi: 10.31599/jki.v19i1.314.

R. F. Amir, I. A. Sobari, and R. Rousyati, “Penerapan PSO Over Sampling Dan Adaboost Random Forest Untuk Memprediksi Cacat Software,†Indones. J. Softw. Eng., vol. 6, no. 2, pp. 230–239, 2020, doi: 10.31294/ijse.v6i2.9258.

M. F. Akbar, I. Kurniawan, and A. Fauzi, “Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique,†J. Inform., vol. 6, no. 1, pp. 107–113, 2019, doi: 10.31311/ji.v6i1.5448.

A. Hardoni and D. P. Rini, “Integrasi Pendekatan Level Data Pada Logistic Regression Untuk Prediksi Cacat Perangkat Lunak,†JIKO (Jurnal Inform. dan Komputer), vol. 3, no. 2, pp. 101–106, 2020, doi: 10.33387/jiko.v3i2.1734.

R. S. Wahono, “A Systematic Literature Review of Software Defect Prediction : Research Trends , Datasets , Methods and Frameworks,†J. Softw. Eng., vol. 1, no. 1, 2015.

A. Fauzi and Ginabila, “Komparasi Algoritma Dengan Pendekatan Random,†J. PILAR Nusa Mandiri, vol. 15, no. 1, pp. 27–34, 2019.

T. Hall, S. Beecham, D. Bowes, D. Gray, and S. Counsell, “A Systematic Literature Review on Fault Prediction Performance in Software Engineering,†IEEE Trans. Softw. Eng., vol. 38, no. 6, pp. 1276–1304, 2012.

N. Hidayati, J. Suntoro, and G. G. Setiaji, “Perbandingan Algoritma Klasifikasi untuk Prediksi Cacat Software dengan Pendekatan CRISP-DM,†J. Sains dan Inform., vol. 7, no. 2, pp. 117–126, 2021, doi: 10.34128/jsi.v7i2.313.

R. S. Wahono and N. Suryana, “Combining particle swarm optimization based feature selection and bagging technique for software defect prediction,†Int. J. Softw. Eng. its Appl., vol. 7, no. 5, pp. 153–166, 2013, doi: 10.14257/ijseia.2013.7.5.16.




DOI: https://doi.org/10.35194/mji.v14i2.2623

Refbacks

  • There are currently no refbacks.


Copyright (c) 2022 Media Jurnal Informatika

Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

This Journal is licensed under a Attribution-NonCommercial-ShareAlike 4.0 License.

©All rights reserved 2017. Media Jurnal Informatika ISSN: 2477-2542 (online); 2088-2114 (cetak).


Gedung Fakultas Teknik UNSUR Jl. Pasir Gede Raya, Cianjur, Jawa Barat 43216| Telp./Fax. (0263) 283578 |E-mail: mji@unsur.ac.id; info@ft.unsur.ac.id


Media Jurnal Informatika Indexed By:

sinta-logogarudagooglecrossref