Penggunaan Algoritma Reduct untuk Penyaringan Data dalam Klasifikasi Pelanggan E-commerce dengan Machine Learning

Ben Haryo  Habsobowo

Authors

Ben Haryo Habsobowo

Abstract

Dalam era digital saat ini, pengelompokan pelanggan berdasarkan data numerik menjadi kebutuhan penting dalam pengambilan keputusan strategis, terutama di sektor e-commerce. Penelitian ini bertujuan untuk membangun sistem klasifikasi pelanggan menggunakan pendekatan machine learning, dengan fokus pada algoritma Support Vector Machine (SVM) dan metode feature selection berbasis algoritma Reduct. Tujuannya adalah meningkatkan efisiensi klasifikasi tanpa mengorbankan akurasi dan kualitas hasil prediksi. Dataset yang digunakan bersumber dari Feed Grains Database milik USDA, yang berisi atribut numerik seperti harga, hasil panen, stok, dan suplai. Data tersebut diproses melalui pemilihan fitur manual dan Reduct untuk menyaring fitur yang relevan. Setelah dilakukan proses klasifikasi, hasil menunjukkan bahwa meskipun nilai akurasi model relatif konstan (57,14%), terjadi peningkatan pada nilai precision dan recall, yang mengindikasikan peningkatan kualitas segmentasi antara kelas Murah dan Mahal. Penelitian ini menyimpulkan bahwa penerapan algoritma Reduct mampu menyederhanakan struktur data, meningkatkan efisiensi sistem, serta tetap menjaga performa klasifikasi. Sistem ini berpotensi diterapkan pada berbagai domain lain yang mengandalkan klasifikasi berbasis data numerik, serta dapat dikembangkan menjadi alat bantu analisis pelanggan dalam sistem informasi e-commerce.

Kata kunci — machine learning, support vector machine, feature selection, Reduct, klasifikasi pelanggan

References

Chen, L., Xu, W., & Wang, J. (2024). Interpretability of machine learning models through feature selection techniques. Computational Intelligence and Applications, 21(1), 27–40. https://doi.org/10.1007/s12345-024-01234

Duda, R. O., Hart, P. E., & Stork, D. G. (2012). Pattern classification (2nd ed.). Wiley-Interscience.

Haykin, S. (2009). Neural networks and learning machines (3rd ed.). Pearson.

Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., … & Duchesnay, É. (2011). Scikit-learn: Machine learning in Python. Journal of Machine Learning Research, 12, 2825–2830.

Platt, J. (1999). Fast training of support vector machines using sequential minimal optimization. In B. Schölkopf, C. J. C. Burges, & A. J. Smola (Eds.), Advances in kernel methods: Support vector learning (pp. 185–208). MIT Press.

USDA. (2024). Feed grains database. United States Department of Agriculture. https://catalog.data.gov/dataset/feed-grains-database

Vapnik, V. N. (1995). The nature of statistical learning theory. Springer. https://doi.org/10.1007/978-1-4757-2440-0

Wang, H., & Zhang, F. (2022). Reduct-based feature selection in large-scale data: A comparative study. Journal of Computational Intelligence, 14(3), 102–115. https://doi.org/10.1016/j.compint.2022.102115

Zhang, Y., Li, Q., & Xie, M. (2021). A feature selection method based on rough set reduct for classification tasks. Journal of Machine Learning Research, 22(85), 1–18. http://jmlr.org/papers/v22/20-985.html

Shalev-Shwartz, S., & Ben-David, S. (2014). Understanding machine learning: From theory to algorithms. Cambridge University Press.

Penggunaan Algoritma Reduct untuk Penyaringan Data dalam Klasifikasi Pelanggan E-commerce dengan Machine Learning

Authors

Abstract

References

Downloads

Published

Issue

Section

Developed By

Language