Penggunaan Algoritma Reduct untuk Penyaringan Data dalam Klasifikasi Pelanggan E-commerce dengan Machine Learning
Abstrak
Dalam era digital saat ini, pengelompokan pelanggan berdasarkan data numerik menjadi kebutuhan penting dalam pengambilan keputusan strategis, terutama di sektor e-commerce. Penelitian ini bertujuan untuk membangun sistem klasifikasi pelanggan menggunakan pendekatan machine learning, dengan fokus pada algoritma Support Vector Machine (SVM) dan metode feature selection berbasis algoritma Reduct. Tujuannya adalah meningkatkan efisiensi klasifikasi tanpa mengorbankan akurasi dan kualitas hasil prediksi. Dataset yang digunakan bersumber dari Feed Grains Database milik USDA, yang berisi atribut numerik seperti harga, hasil panen, stok, dan suplai. Data tersebut diproses melalui pemilihan fitur manual dan Reduct untuk menyaring fitur yang relevan. Setelah dilakukan proses klasifikasi, hasil menunjukkan bahwa meskipun nilai akurasi model relatif konstan (57,14%), terjadi peningkatan pada nilai precision dan recall, yang mengindikasikan peningkatan kualitas segmentasi antara kelas Murah dan Mahal. Penelitian ini menyimpulkan bahwa penerapan algoritma Reduct mampu menyederhanakan struktur data, meningkatkan efisiensi sistem, serta tetap menjaga performa klasifikasi. Sistem ini berpotensi diterapkan pada berbagai domain lain yang mengandalkan klasifikasi berbasis data numerik, serta dapat dikembangkan menjadi alat bantu analisis pelanggan dalam sistem informasi e-commerce.
Kata kunci — machine learning, support vector machine, feature selection, Reduct, klasifikasi pelanggan
Referensi
Chen, L., Xu, W., & Wang, J. (2024). Interpretability of machine learning models through feature selection techniques. Computational Intelligence and Applications, 21(1), 27–40. https://doi.org/10.1007/s12345-024-01234
Duda, R. O., Hart, P. E., & Stork, D. G. (2012). Pattern classification (2nd ed.). Wiley-Interscience.
Haykin, S. (2009). Neural networks and learning machines (3rd ed.). Pearson.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, É. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825–2830.
Platt, J. (1999). Fast training of support vector machines using sequential minimal optimization. In B. Schölkopf, C. J. C. Burges, & A. J. Smola (Eds.), Advances in kernel methods: Support vector learning (pp. 185–208). MIT Press.
USDA. (2024). Feed grains database. United States Department of Agriculture. https://catalog.data.gov/dataset/feed-grains-database
Vapnik, V. N. (1995). The nature of statistical learning theory. Springer. https://doi.org/10.1007/978-1-4757-2440-0
Wang, H., & Zhang, F. (2022). Reduct-based feature selection in large-scale data: A comparative study. Journal of Computational Intelligence, 14(3), 102–115. https://doi.org/10.1016/j.compint.2022.102115
Zhang, Y., Li, Q., & Xie, M. (2021). A feature selection method based on rough set reduct for classification tasks. Journal of Machine Learning Research, 22(85), 1–18. http://jmlr.org/papers/v22/20-985.html
Shalev-Shwartz, S., & Ben-David, S. (2014). Understanding machine learning: From theory to algorithms. Cambridge University Press.



