Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes Untuk Prediksi Cacat Software

Authors

  • Nurul Ichsan Universitas Bina Sarana Informatika
  • Haerul Fatah Sistem Informasi Kampus Kota Tasikmalaya (D3) Universitas Bina Sarana Informatika
  • Erni Ermawati Sistem Informasi Kampus Kabupaten Karawang (D3) Universitas Bina Sarana Informatika
  • Indriyanti Indriyanti
  • Tri Wahyuni Ilmu Komputer (S1) Universitas Bina Sarana Informatika

DOI:

https://doi.org/10.35194/mji.v14i2.2623

Keywords:

Distribution Based Balance, Bagging, Naïve Bayes, Imbalance Class

Abstract

Software berkualitas tinggi adalah software yang tidak ditemukan cacat (defect) selama proses pemeriksaan atau pengujian. Biaya perbaikan cacat software jauh lebih mahal dibanding biaya saat pengembangan. Prediksi cacat software diusulkan untuk menentukan prioritas modul software yang akan diuji, sehingga mampu meningkatkan kualitas software serta mungurangi biaya. Masalah utama dalam software defect prediction adalah redundant data, korelasi, fitur yang tidak relevan dan missing samples.  62 penelitian dari 208 penelitian dalam pengembangan model prediksi cacat software menggunakan dataset NASA (National Aeronautics and Space Administration) MDP Repository. Penanganan imbalance class dilakukan dengan menggunakan sampling technique Distribution Based Balance dan pendekatan level algoritma dengan teknik ensemble learning menggunakan Bagging. Algoritma klasifikasi yang digunakan dalam penelitian ini yaitu classifier Naïve Bayes. Hasil  penelitian  menunjukkan  bahwa  model yang diusulkan mencapai akurasi dan AUC klasifikasi yang lebih tinggi. Pada Model Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes rata-rata nilai akurasi mencapai 98,71%, rata-rata nilai AUC 0.987 dengan nilai rata-rata peningkatan presentase AUC mencapai 0.373. Sedangkan pada model pembanding yaitu Integrasi SMOTE dan Teknik Ensemble Naïve Bayes rata-rata nilai akurasi mencapai 73,30%, rata-rata nilai AUC 0,639 dengan nilai rata-rata peningkatan presentase AUC mencapai 0,025. Dari hasil tersebut dapat disimpulkan  bahwa  model  yang  diusulkan  yaitu Integrasi Distribution Based Balance dan Teknik Ensemble Bagging Naive Bayes merupakan  model  terbaik  untuk menangani imbalance class.

Author Biography

Indriyanti Indriyanti

Sistem Informasi Kampus Kabupaten Banyumas (D3) Universitas Bina Sarana Informatika

References

[1] A. Hardoni, D. P. Rini, and S. Sukemi, “Integrasi SMOTE pada Naive Bayes dan Logistic Regression Berbasis Particle Swarm Optimization untuk Prediksi Cacat Perangkat Lunak,” J. Media Inform. Budidarma, vol. 5, no. 1, p. 233, 2021, doi: 10.30865/mib.v5i1.2616.
[2] R. Prasetyo, I. Nawawi, A. Fauzi, and G. Ginabila, “Komparasi Algoritma Logistic Regression dan Random Forest pada Prediksi Cacat Software,” J. Tek. Inform. UNIKA St. Thomas, vol. 06, no. Siringoringo 2017, pp. 275–281, 2021, doi: 10.54367/jtiust.v6i2.1522.
[3] N. Ichsan, “Metoda Distribution Based Balance dan Bagging C4 . 5,” Indones. J. Comput. Inf. Technol., vol. 4, no. 2, pp. 215–224, 2019.
[4] Sugiono, A. Taufik, and R. Faizal Amir, “Penerapan Penerapan Teknik Pso Over Sampling Dan Adaboost J48 Untuk Memprediksi Cacat Software,” J. Responsif Ris. Sains dan Inform., vol. 2, no. 2, pp. 198–203, 2020, doi: 10.51977/jti.v2i2.249.
[5] S. A. Putri, “Prediksi Cacat Software Dengan Teknik Sampel Dan Seleksi Fitur Pada Bayesian Network,” J. Kaji. Ilm., vol. 19, no. 1, p. 17, 2019, doi: 10.31599/jki.v19i1.314.
[6] R. F. Amir, I. A. Sobari, and R. Rousyati, “Penerapan PSO Over Sampling Dan Adaboost Random Forest Untuk Memprediksi Cacat Software,” Indones. J. Softw. Eng., vol. 6, no. 2, pp. 230–239, 2020, doi: 10.31294/ijse.v6i2.9258.
[7] M. F. Akbar, I. Kurniawan, and A. Fauzi, “Mengatasi Imbalanced Class Pada Software Defect Prediction Menggunakan Two-Step Clustering-Based Undersampling dan Bagging Tehcnique,” J. Inform., vol. 6, no. 1, pp. 107–113, 2019, doi: 10.31311/ji.v6i1.5448.
[8] A. Hardoni and D. P. Rini, “Integrasi Pendekatan Level Data Pada Logistic Regression Untuk Prediksi Cacat Perangkat Lunak,” JIKO (Jurnal Inform. dan Komputer), vol. 3, no. 2, pp. 101–106, 2020, doi: 10.33387/jiko.v3i2.1734.
[9] R. S. Wahono, “A Systematic Literature Review of Software Defect Prediction : Research Trends , Datasets , Methods and Frameworks,” J. Softw. Eng., vol. 1, no. 1, 2015.
[10] A. Fauzi and Ginabila, “Komparasi Algoritma Dengan Pendekatan Random,” J. PILAR Nusa Mandiri, vol. 15, no. 1, pp. 27–34, 2019.
[11] T. Hall, S. Beecham, D. Bowes, D. Gray, and S. Counsell, “A Systematic Literature Review on Fault Prediction Performance in Software Engineering,” IEEE Trans. Softw. Eng., vol. 38, no. 6, pp. 1276–1304, 2012.
[12] N. Hidayati, J. Suntoro, and G. G. Setiaji, “Perbandingan Algoritma Klasifikasi untuk Prediksi Cacat Software dengan Pendekatan CRISP-DM,” J. Sains dan Inform., vol. 7, no. 2, pp. 117–126, 2021, doi: 10.34128/jsi.v7i2.313.
[13] R. S. Wahono and N. Suryana, “Combining particle swarm optimization based feature selection and bagging technique for software defect prediction,” Int. J. Softw. Eng. its Appl., vol. 7, no. 5, pp. 153–166, 2013, doi: 10.14257/ijseia.2013.7.5.16.

Published

2022-12-07