Perbandingan Akurasi Algoritma Random Forest Dan Algoritma Artificial Neural Network Untuk Klasifikasi Penyakit Diabetes

Authors

  • Eky Cahya Putra Witjaksana Telkom University
  • Rd. Rohmat Saedudin Telkom University
  • Vandha Pradwiyasma Widartha Telkom University

Abstract

Penyakit diabetes adalah gangguan pada metabolisme yang bersifat kronis pada tubuh manusia ditandai dengan kadar gula darah yang tinggi dan disertai dengan gangguan metabolisme karbohidrat, lipid dan protein sebagai akibat dari ketidakmampuan insulin untuk menjalankan fungsinya secara memadai. Berdasarkan data International Diabetes Federation (IDF), Indonesia berada distatus waspada diabetes dengan menempati urutan ke-7 dari 10 negara dengan jumlah pasien diabetes tertinggi di dunia. Untuk melakukan Klasifikasi penyakit diabetes hal yang bisa dilakukan salah satunya adalah dengan melakukan pengklasifikasian terhadap penyakit diabetes. Salah satu cara untuk melakukan pengklasifikasian adalah dengan dilakukannya klasifikasi dalam Machine Learning. Machine Learning sendiri dapat mempermudah penulis untuk mendapatkan hasil prediktif untuk penyakit diabetes, dataset yang akan digunakan pada penelitian kali ini adalah pima-indian-diabetes dengan dataset 768 data, dari data tersebut terdapat delapan data attribut yang diantaranya adalah Pregnancies, Glucose, BloodPressure, SkinThickness, Insulin, BMI (Body Mass Index), Diabetes Pedigree Function, Age dan outcome. Di dalam Penelitian ini penulis akan membandingkan hasil akurasi dari Algoritma Random Forest dan Algoritma Artificial Neural Network dalam melakukan klasifikasi terhadap dataset pima-indian-diabetes. Sebelum dilakukan perbandingan hasil akurasi dari kedua Algoritma tersebut, penulis melakukan tahapan preprocessing terhadap dataset dengan cara melakukan pembersihan dataset, membuat matrix of features, melakukan Spliting data, dan melakukan feature scaling. Setelah data melewati tahapan preprocessing, tahapan selanjutnya adalah mencari akurasi terbaik yang didapatkan dengan cara membuat Confusion Matrix untuk menemukan hasil dari ROC AUC dan hasil F1-Score dari setiap Algoritma yang digunakan. Hasil analisa menunjukkan bahwa Algoritma Random Forest memiliki nilai akurasi sebesar 90.62%. Nilai akurasi yang didapatkan oleh Algoritma Random Forest memiliki nilai yang lebih baik jika dibandingkan dengan Algoritma Artificial Neural Network yang memiliki nilai akurasi sebesar 82.29%. Kata Kunci : Random Forest, Artificial Neural Network, Diabetes, Data Mining

Downloads

Published

2021-10-01

Issue

Section

Program Studi S1 Sistem Informasi