Penerapan Algoritma C4.5 Untuk Menentukan Prioritas Fitur Dalam Memprediksi Potensi Penjualan Di Toko Rumahbayitaz
Abstrak
UMKM di Indonesia menghadapi tantangan dalam menentukan strategi produk baru, terutama risiko overstock dan understock akibat keputusan pengadaan yang bersifat spekulatif. Penelitian ini bertujuan membangun model prediksi kelarisan produk baru menggunakan algoritma C4.5 berbasis decision tree. Data diambil dari laporan Shopee Seller Center milik Toko RumahBayiTAZ untuk periode 2023–2024, dengan atribut seperti Produk Dilihat, Total Pengunjung, Total Pembeli Baru, dan Total Potensi Pembeli. Untuk mengatasi ketidakseimbangan kelas, diterapkan teknik SMOTE (Synthetic Minority Oversampling Technique). Model dibangun dengan pustaka ChefBoost dalam bahasa pemrograman Python dan dievaluasi menggunakan Confusion Matrix serta teknik K-Fold Cross Validation. Hasil penelitian menunjukkan akurasi rata-rata 88,9%, dengan fitur Produk Dilihat sebagai simpul akar pohon keputusan. Model ini tidak hanya mampu mengklasifikasikan produk ke dalam kategori Laris, Sedang, dan Tidak Laris, tetapi juga membantu pelaku usaha mengidentifikasi fitur-fitur penting untuk perencanaan stok dan strategi promosi produk baru.
Keywords— Algoritma C4.5, Klasifikasi, UMKM, SMOTE, Pohon Keputusan
Referensi
N. Azwanti, “Optimalisasi pengelolaan stok barang menggunakan algoritma C4.5,” Jurnal Sistem Informasi dan Teknologi Informasi, vol. 4, no. 1, pp. 12–20, 2018.
M. Barwa, “Manajemen stok barang dengan teknik data mining,” Jurnal Teknik dan Informatika, vol. 7, no. 3, pp. 45–58, 2019.
A. Izyuddin and S. Wibisono, “Prediksi penjualan produk AC dengan algoritma C4.5,” Jurnal Informatika dan Sistem Informasi, vol. 12, no. 2, pp. 87–95, 2020.
R. Rofiani, L. Oktaviani, D. Vernanda, and T. Hendriawan, “Penerapan metode klasifikasi decision tree dalam prediksi kanker paru-paru menggunakan algoritma C4.5,” Jurnal Tekno Kompak, vol. 18, no. 1, pp. 34–45, 2021.
A. I. Shafarindu, E. Patimah, Y. M. Siahaan, A. W. Wardhana, B. V. Haekal, and D. S. Prasvita, “Pengelompokan data penjualan supermarket menggunakan algoritma C4.5,” Jurnal Teknologi Informasi, vol. 9, no. 2, pp. 29–42, 2021.
D. E. Sinaga, A. P. Windarto, and R. A. Nasution, “Evaluasi algoritma C4.5 menggunakan teknik cross validation dan confusion matrix pada data penjualan,” Jurnal Sistem Informasi dan Manajemen Data, vol. 10, no. 3, pp. 65–78, 2022.
D. Nababan and A. V. Tanlim, “Optimalisasi stok barang dengan analisis data historis penjualan,” Jurnal Sistem dan Teknologi Informasi, vol. 5, no. 1, pp. 18–27, 2019.
S. Sukmawati, “Analisis pola penjualan menggunakan teknik data mining,” Jurnal Komputer dan Informatika, vol. 8, no. 1, pp. 23–36, 2020.
P. P. Putra and A. S. Chan, “Pemanfaatan algoritma C4.5 untuk analisis data penjualan e-commerce,” Jurnal Rekayasa Sistem dan Teknologi Informasi, vol. 14, no. 2, pp. 40–56, 2021.
A. D. Saputra and A. Qoiriah, “Perbandingan teknik klasifikasi untuk prediksi penjualan produk di pasar daring,” Jurnal Sistem Cerdas dan Aplikasi Komputer, vol. 7, no. 2, pp. 12–23, 2020.
F. Nasari, “Strategi pengelolaan stok berbasis data mining menggunakan algoritma decision tree,” Jurnal Ekonomi dan Bisnis Digital, vol. 11, no. 4, pp. 75–88, 2021.
J. R. Quinlan, C4.5: Programs for Machine Learning. San Mateo, CA: Morgan Kaufmann, 1993.
A. Kristianus Lalo, P. Batarius, and Y. C. Hoar Siki, “Implementasi decision tree untuk prediksi produk terlaris di e-commerce,” Jurnal Sistem Informasi dan Komputerisasi, vol. 3, no. 3, pp. 22–35, 2020.
G. L. Pritalia, “Analisis data penjualan supermarket menggunakan metode klasifikasi,” Jurnal Teknologi Informasi dan Komunikasi, vol. 5, no. 3, pp. 55–67, 2021.
R. Rofiani, “Penerapan decision tree untuk prediksi kebutuhan stok di pasar ritel,” Jurnal Informatika dan Sistem, vol. 8, no. 1, pp. 30–40, 2021.
N. F. Muhidin, D. Gustian, and Sihabudin, “Analisis dan penerapan algoritma C4.5 untuk memprediksi kualitas penelitian dan publikasi ilmiah,” Jurnal Media Informatika Budidarma, vol. 6, no. 4, pp. 2454–2460, 2022.
J. Erbani, P.-É. Portier, E. Egyed-Zsigmond, and D. Nurbakova, “Confusion matrices: A unified theory,” IEEE Access, vol. 12, pp. 181372–181379, 2024.
Murlena and D. Apriana, “Penerapan data mining untuk memprediksi ketersediaan stok produk HNI HPAI menggunakan algoritma C4.5,” Arcitech: Journal of Computer Science and Artificial Intelligence, vol. 2, no. 1, pp. 19–32, 2022.
M. Liandana and I. M. D. Susila, “Pengaruh jumlah fitur pada algoritma machine learning dalam memprediksi aktivitas jatuh,” Jurnal Sistem dan Informatika, vol. 17, no. 2, pp. 109–120, 2023.
D. Ruswanti, D. Susilo, and Riani, “Implementasi CRISP-DM pada data mining untuk melakukan prediksi pendapatan dengan algoritma C4.5,” GO Infotech: Jurnal Ilmiah STMIK AUB, vol. 30, no. 1, pp. 111–121, 2024.
N. C. Yulianto and A. Y. Nisrina, “Klasifikasi penderita diabetes mellitus menggunakan metode SVM, regresi logistik biner, decision tree, dan random forest,” Institut Teknologi Sepuluh Nopember, 2023.



