Uji Konsep Paralel Svm Dengan Dekomposisi Smo Pada Data Set Microarray
Abstract
Abstrak
Support Vector Machine (SVM) adalah metode yang andal untuk melakukan klasifikasi dan regresi
terutama dalam supervised machine learning. Akan tetapi SVM memiliki masalah skalabilitas dalam waktu
komputasi dan penggunaan memori. Oleh karena itu banyak diusulkan Parallel Support Vector Machine
(PSVM) untuk menambang data yang besekala besar. Pada penelitian ini penulis melakukan uji konsep
PSVM dengan dekomposisi SMO yang dapat mendeteksi dan mengklasifikasika kanker dengan
menggunakan data microarray. Penulis menerapkan teknik Sequential Minimal Optimization (SMO) yang
menggunakan lagrange multipliers menyelesaikan masalah quadratic programming (QP) yang muncul
selama pelatihan. Untuk menguji konsep dekomposisi SMO, data set akan dipecah ke dalam beberapa
subset kemudia melakukan pelatihan SMO setiap subset secara independen dan menggabungkan setiap
hasil pelatihan ke dalam satu model klasifikasi SMO. Evaluasi dilakukan dengan membandingkan akurasi
dan performan dekomposisi SMO dan non-dekomposisi SMO. Evaluasi menghasilkan akurasi dekomposisi
SMO 75% dan non-dekomposisi SMO 63% serta waktu pelatihan dekomposisi SMO 5.7 kali lebih cepat
daripada non-dekomposisi SMO
Kata kunci : Microarray, Suport Vector Machine (SVM), Parallel Suport Vector Machine (PSVM),
Sequential Minimal Optimization(SMO), Microarray
Abstract
Support Vector Machine (SVM) is a reliable method for performing classification and regression especially
in supervised machine learning. However, SVM has scalability issues in compute time and memory usage.
Therefore, there are many proposals for Parallel Support Vector Machine (PSVM) for mining large-scale
data. In this study, the authors conducted a PSVM concept test with SMO decomposition that could be
handled and classified cancer using microarray data. The author applies the Sequential Minimal
Optimization (SMO) technique which uses lagrange multipliers to solve quadratic programming (QP)
problems that arise during training. To test the concept of SMO decomposition, the data set will be broken
down into several subsets and then independently conduct SMO training for each subset and combine each
training result into one SMO classification model. Evaluation is done by comparing the accuracy and
performance of SMO decomposition and non-decomposition SMO. Evaluation increased SMO
decomposition 75% and non-SMO decomposition 63% as well as SMO decomposition training time 5.7
times faster according to non-SMO decomposition
Keywords: Microarray, Suport Vector Machine (SVM), Parallel Suport Vector Machine (PSVM),
Sequential Minimal Optimization(SMO)
Support Vector Machine (SVM) adalah metode yang andal untuk melakukan klasifikasi dan regresi
terutama dalam supervised machine learning. Akan tetapi SVM memiliki masalah skalabilitas dalam waktu
komputasi dan penggunaan memori. Oleh karena itu banyak diusulkan Parallel Support Vector Machine
(PSVM) untuk menambang data yang besekala besar. Pada penelitian ini penulis melakukan uji konsep
PSVM dengan dekomposisi SMO yang dapat mendeteksi dan mengklasifikasika kanker dengan
menggunakan data microarray. Penulis menerapkan teknik Sequential Minimal Optimization (SMO) yang
menggunakan lagrange multipliers menyelesaikan masalah quadratic programming (QP) yang muncul
selama pelatihan. Untuk menguji konsep dekomposisi SMO, data set akan dipecah ke dalam beberapa
subset kemudia melakukan pelatihan SMO setiap subset secara independen dan menggabungkan setiap
hasil pelatihan ke dalam satu model klasifikasi SMO. Evaluasi dilakukan dengan membandingkan akurasi
dan performan dekomposisi SMO dan non-dekomposisi SMO. Evaluasi menghasilkan akurasi dekomposisi
SMO 75% dan non-dekomposisi SMO 63% serta waktu pelatihan dekomposisi SMO 5.7 kali lebih cepat
daripada non-dekomposisi SMO
Kata kunci : Microarray, Suport Vector Machine (SVM), Parallel Suport Vector Machine (PSVM),
Sequential Minimal Optimization(SMO), Microarray
Abstract
Support Vector Machine (SVM) is a reliable method for performing classification and regression especially
in supervised machine learning. However, SVM has scalability issues in compute time and memory usage.
Therefore, there are many proposals for Parallel Support Vector Machine (PSVM) for mining large-scale
data. In this study, the authors conducted a PSVM concept test with SMO decomposition that could be
handled and classified cancer using microarray data. The author applies the Sequential Minimal
Optimization (SMO) technique which uses lagrange multipliers to solve quadratic programming (QP)
problems that arise during training. To test the concept of SMO decomposition, the data set will be broken
down into several subsets and then independently conduct SMO training for each subset and combine each
training result into one SMO classification model. Evaluation is done by comparing the accuracy and
performance of SMO decomposition and non-decomposition SMO. Evaluation increased SMO
decomposition 75% and non-SMO decomposition 63% as well as SMO decomposition training time 5.7
times faster according to non-SMO decomposition
Keywords: Microarray, Suport Vector Machine (SVM), Parallel Suport Vector Machine (PSVM),
Sequential Minimal Optimization(SMO)
Full Text:
PDFRefbacks
- There are currently no refbacks.