Uji Konsep Paralel Svm Dengan Dekomposisi Smo Pada Data Set Microarray

Authors

  • Rahmat Ramadan Prasojoe Telkom University
  • Setyorini Setyorini Telkom University

Abstract

Abstrak Support Vector Machine (SVM) adalah metode yang andal untuk melakukan klasifikasi dan regresi terutama dalam supervised machine learning. Akan tetapi SVM memiliki masalah skalabilitas dalam waktu komputasi dan penggunaan memori. Oleh karena itu banyak diusulkan Parallel Support Vector Machine (PSVM) untuk menambang data yang besekala besar. Pada penelitian ini penulis melakukan uji konsep PSVM dengan dekomposisi SMO yang dapat mendeteksi dan mengklasifikasika kanker dengan menggunakan data microarray. Penulis menerapkan teknik Sequential Minimal Optimization (SMO) yang menggunakan lagrange multipliers menyelesaikan masalah quadratic programming (QP) yang muncul selama pelatihan. Untuk menguji konsep dekomposisi SMO, data set akan dipecah ke dalam beberapa subset kemudia melakukan pelatihan SMO setiap subset secara independen dan menggabungkan setiap hasil pelatihan ke dalam satu model klasifikasi SMO. Evaluasi dilakukan dengan membandingkan akurasi dan performan dekomposisi SMO dan non-dekomposisi SMO. Evaluasi menghasilkan akurasi dekomposisi SMO 75% dan non-dekomposisi SMO 63% serta waktu pelatihan dekomposisi SMO 5.7 kali lebih cepat daripada non-dekomposisi SMO Kata kunci : Microarray, Suport Vector Machine (SVM), Parallel Suport Vector Machine (PSVM), Sequential Minimal Optimization(SMO), Microarray Abstract Support Vector Machine (SVM) is a reliable method for performing classification and regression especially in supervised machine learning. However, SVM has scalability issues in compute time and memory usage. Therefore, there are many proposals for Parallel Support Vector Machine (PSVM) for mining large-scale data. In this study, the authors conducted a PSVM concept test with SMO decomposition that could be handled and classified cancer using microarray data. The author applies the Sequential Minimal Optimization (SMO) technique which uses lagrange multipliers to solve quadratic programming (QP) problems that arise during training. To test the concept of SMO decomposition, the data set will be broken down into several subsets and then independently conduct SMO training for each subset and combine each training result into one SMO classification model. Evaluation is done by comparing the accuracy and performance of SMO decomposition and non-decomposition SMO. Evaluation increased SMO decomposition 75% and non-SMO decomposition 63% as well as SMO decomposition training time 5.7 times faster according to non-SMO decomposition Keywords: Microarray, Suport Vector Machine (SVM), Parallel Suport Vector Machine (PSVM), Sequential Minimal Optimization(SMO)

Downloads

Published

2021-04-01

Issue

Section

Program Studi S1 Informatika