Prediksi Return Saham Berbasis Clustering Menggunakan K-Means Clustering dan Convolutional Neural Network

Authors

  • Rizaldi Maulid Fathurachman Telkom University
  • Deni Saepudin Telkom University

Abstract

Abstrak - Prediksi harga saham di masa depan merupakan sebuah masalah yang menantang. Dalam penelitian ini telah diterapkan pendekatan clustering untuk mengelompokkan saham-saham yang menunjukkan kesamaan dalam prediksi harga. Proses ini membantu dalam mempermudah prediksi harga, karena saham yang ada dalam 1 cluster yang sama diharapkan mempunyai pola yang lebih mirip. Melalui clustering, saham-saham yang memiliki prediksi harga yang sama dikelompokkan berdasarkan cluster yang telah terbentuk. Kemudian, dilakukan training model menggunakan data rata-rata dari harga saham dalam setiap cluster untuk menghasilkan prediksi harga yang lebih tepat. Dalam penelitian ini metode K-Means digunakan untuk mengelompokkan saham berdasarkan rata-rata return dan standar deviasi, sedangkan CNN digunakan untuk memprediksi harga saham harian. Selanjutnya prediksi return dapat dihitung berdasarkan prediksi harga yang telah diperoleh. Dataset harga saham LQ45 dibagi menjadi dua bagian, yaitu training data dan test data. Data training digunakan untuk melatih model CNN untuk menganalisis data harga saham historis yang dapat membantu memprediksi return saham di masa depan, sedangkan data test digunakan untuk mengevaluasi kinerja model yang telah dilatih. Hasil penelitian ini menunjukkan bahwa, dengan melihat kriteria elbow maka clustering dengan metode K-Means akan diambil dengan jumlah clusternya adalah sebanyak 4 cluster. Dan setelah itu di lakukan prediksi melalui CNN dan hasilnya mampu menghasilkan prediksi harga saham harian dengan baik, dibuktikan dengan nilai RMSE prediksi untuk 1 hari ke depan pada cluster 1 adalah 0,09, Untuk cluster 2, RMSE yang diperoleh adalah 0,05, Sementara itu, cluster 3 memiliki RMSE sebesar 0,07, dan untuk cluster 4 memiliki RMSE yang diperoleh yaitu 0,57. Setelah itu, dihasilkan dari prediksi saham-saham di setiap cluster yang menghasilkan prediksi return tertinggi di setiap harinya. Kemudian dibuat prediksi kinerja portofolio menggunakan equal weight dengan hasil ratarata return sebesar 0,0009 dan standar deviasi sebesar 0,0209 yang lebih baik dibandingkan dengan indeks LQ45.

Kata kunci - Prediksi return saham, clustering, K-means, Convolutional Neural Network (CNN), portofolio investasi.

References

Ashrafzadeh, M., Taheri, H. M., Gharehgozlou, M., & Zolfani, S. H. (2023). Clustering-based return prediction model for stock pre-selection in portfolio optimization using PSO-CNN+ MVF. Journal of King Saud University-Computer and Information Sciences, 35(9), 101737.

Fang, Z., & Chiao, C. (2021). Research on prediction and recommendation of financial stocks based on K-means clustering algorithm optimization. Journal of Computational Methods in Sciences and Engineering, 21(5), 1081-1089.

Chusyairi, A., & Saputra, P. R. N. (2019). Pengelompokan Data Puskesmas Banyuwangi Dalam Pemberian Imunisasi Menggunakan Metode K-Means Clustering. Telematika, 12(2), 139-148.

Chen, S., & He, H. (2018, November). Stock prediction using convolutional neural networks. In IOP Conference series: materials science and engineering (Vol. 435, p. 012026). IOP Publishing.

Shawel, B. S., Bantigegn, F., Debella, T. T., Pollin, S., & Woldegebreal, D. H. (2022). K-Means Clustering Assisted Spectrum Utilization Prediction with Deep Learning Models. Engineering Proceedings, 18(1), 2.

Kassambara, A. (2023). Practical guide to cluster analysis in R: Unsupervised machine learning. STHDA.

Wu, J. M. T., Li, Z., Herencsar, N., Vo, B., & Lin, J. C. W. (2021). A graph-based CNN-LSTM stock price prediction algorithm with leading indicators. Multimedia Systems, 1-20.

Yuliya Plyakha, Raman Uppal, Grigory Vilkov (2020). Why Does an Equal-Weighted Portfolio Outperform Value- and Price-Weighted Portfolios? EDHEC Risk Climate Impact Institute.

Tsantekidis, A., Passalis, N., Tefas, A., Kanniainen, J., Gabbouj, M., & Iosifidis, A. (2020). Forecasting stock prices from the limit order book using convolutional neural networks. In 2020 25th International Conference on Pattern Recognition (ICPR) (pp. 7928-7935). IEEE

Zhang, Z., Zohren, S., & Roberts, S. (2022). Deep learning for financial time series forecasting: A survey. Journal of Financial Data Science, 4(1), 70-91.

Published

2025-04-10

Issue

Section

Program Studi S1 Informatika