Handling Imbalanced Data Pada Prediksi Churn Menggunakan Metode Smote Dan Knn Based On Kernel
Abstract
Customer churn merupakan masalah umum yang ditemui diperindustrian telekomunikasi. Customer churn didefinisikan sebagai kecenderungan customer berhenti melakukan bisnis dengan suatu perusahaan. Tetapi hanya terdapat sedikit sekali churn customer yang ada. Kekurangan data yang menunjukan bahwa customer tersebut termasuk churn customer menyebabkan masalah imbalanced data. pada tugas akhir ini penulis membuat sebuah sistem yang dapat melakukan penanganan terkait imbalanced data menggunakan SMOTE (Synthetic Minority Over-sampling Technique). Classifier yang digunakan untuk menentukan suatu customer apakah termasuk churn atau tidak, menggunakan metode Improve KNN Algorithm Based on Kernel Method. Metode ini merupakan perkembangan dari metode KNN Standard. Dimana pada metode KNN Standard proses klasifikasi dilakukan dengan melihat sejumlah k tetangga terdekat, dan akan diklasifikasikan berdasarkan jumlah kelas terbanyak pada sejumlah k tetangga terdekatnya. Classifier tersebut diuji menggunakan 3 fungsi Kernel dan 40 kombinasi parameter untuk menemukan performansi tertinggi. Performansi tertinggi yang didapat dari kombinasi parameter tersebut diukur menggunakan f1-measure dan akurasi secara berurut pada data tanpa smote, smote 1:3, smote 1:2, smote 3:4, dan smote 1:1, yaitu: 0,314 & 97,58%, 0,449 & 94,55%, 0,413 & 93,70%, 0,382 & 92,74% dan 0,363 & 92,08%. Kata Kunci: Churn Prediction, Over-sampling, SMOTE (Synthetic Minority Over-sampling Technique), Improve KNN Algorithm Based on Kernel Method.Downloads
Published
2017-12-01
Issue
Section
Program Studi S1 Informatika