Klasifikasi Malware Dengan Machine Learning

Penulis

  • Natnanael Andra Wijaya Telkom University
  • Wahyu Adi Prabowo Telkom University
  • Trihastuti Yuniati Telkom University

Abstrak

Perkembangan malware yang pesat menjadi tantangan besar bagi keamanan sistem informasi. Berdasarkan data G Data Security Labs, pada 2022 ditemukan lebih dari 50 juta jenis malware baru. Penelitian ini mengimplementasikan tiga algoritma machine learning yaitu Logistic Regression, XGBoost, dan Convolutional Neural Network (CNN) untuk
mengklasifikasikan malware melalui analisis data statis. Dataset terdiri dari 130.046 sampel malware dan benign yang diperoleh dari Kaggle serta VirusShare. Proses penelitian meliputi prapemrosesan data, pembagian dataset menjadi 80% data latih dan 20% data uji, pelatihan model, serta evaluasi kinerja menggunakan metrik akurasi, presisi, recall, dan F1-score. Hasil pengujian menunjukkan XGBoost sebagai model dengan performa terbaik dengan akurasi 99,31%, precision 99,30%, recall 99,33%, dan F1-score 99,31%. CNN berada di posisi kedua dengan akurasi 98,89%, precision 98,91%, recall 98,88%, dan F1- score 98,89%. Logistic Regression mencatat akurasi 96,11%, precision 96,07%, recall 96,15%, dan F1-score 96,11%. XGBoost terbukti menjadi model paling efektif dalam klasifikasi malware pada penelitian ini sehingga berpotensi meningkatkan akurasi dan efisiensi sistem deteksi malware.
Kata kunci— Machine Learning, Logistic Regression, XGBoost, Convolutional Neural Network , Malware

##submission.downloads##

Diterbitkan

2025-12-29

Terbitan

Bagian

Prodi S1 Teknik Informatika - Kampus Purwokerto