Klasifikasi Serangan Malware Menggunakan Machine Learning

Authors

  • Dian Ristey Ajeng Pramono Telkom University
  • Wahyu Adi Prabowo Telkom University
  • Muhammad Fajar Sidiq Telkom University

Abstract

Serangan malware merupakan ancaman signifikan dalam era digitalisasi dengan lebih dari 6,5 miliar serangan tercatat pada tahun 2024. Penelitian ini bertujuan mengevaluasi dan membandingkan performa tiga algoritma machine learning yaitu Random Forest, Support Vector Machine (SVM), dan Naïve Bayes dalam mengklasifikasi serangan malware. Dataset pe-files-malwares dari Kaggle dengan 19.611 sampel dan 79 fitur digunakan sebagai basis eksperimen. Metodologi penelitian meliputi exploratory data analysis, preprocessing dengan normalisasi StandardScaler, seleksi fitur menggunakan SelectKBest, penanganan ketidakseimbangan kelas dengan SMOTE, dan pembagian data dengan rasio 80:20. Evaluasi model menggunakan confusion matrix dengan metrik accuracy, precision, recall, dan F1-score.
Hasil penelitian menunjukkan Random Forest memberikan performa terbaik dengan akurasi 98,8%, precision 98,7%,
recall 99,7%, dan F1-score 99,2%. SVM mencapai akurasi 96,7% dengan F1-score 97,7%, sedangkan Naïve Bayes
memperoleh akurasi 88,2% dengan F1-score 91,7%. Random Forest terbukti paling efektif dalam mendeteksi malware
dengan tingkat false negative terendah, menjadikannya solusi optimal untuk implementasi sistem keamanan siber.
Kata kunci— Malware, Klasifikasi, Cybersecurity,Algorithm, Detection

Published

2025-12-29

Issue

Section

Prodi S1 Teknik Informatika - Kampus Purwokerto