Klasifikasi Email Multi Kelas Menggunakan Ensemble Bagging

Authors

  • Ali Helmut Telkom Univeristy
  • Adiwijaya Adiwijaya Telkom University
  • Danang Triantoro Murdiansyah Telkom University

Abstract

Abstrak Email merupakan teknologi komunikasi yang umum dalam kehidupan modern ini. Semakin banyak email yang kita terima semakin sulit dan membutuhkan waktu untuk memilah. salah satu solusi untuk mengatasi masalah ini dengan cara membuat model matematis menggunakan pembelajaran mesin untuk memilah email berdasarkan konteks tertentu. Setiap jenis pembelajaran mesin dan distribusi data menghasilkan performansi yang berbeda. Ensemble merupakan suatu metode untuk megabungkan beberapa model menjadi satu kesatuan untuk mendapatkan performansi yang lebih baik. maka pada penelitian kami kami mencoba mengkombinasikan model pembelajaran, sampling dan beberapa kelas data untuk mendapatkan pengaruh bagging dan voting terhadap performansi macro average f1 score suatu model ensemble dan membandingkan dengan model non-ensemble. Hasil penelitian ini menunjukan sensitifitas Naïve Bayes terhadap data tak imbang terbantu oleh bagging dan voting dengan delta performansi 0.0001 – 0.0018, logistic regresi memiliki kenaikan performansi relative rendah untuk bagging dan voting dengan delta performansi 0.0001-0.00015, dan voting decision tree memiliki performansi yang terbebankan oleh Naïve Bayes dengan delta performansi -0.01. Kata Kunci : Ensemble Learning, Bagging , Email-klasifikasi, Abstract Email is a common communication technology in modern life. The more emails we receive the more difficult and require time to sort. one solution to overcome this problem is by creating a mathematical model using machine learning to sort email based on certain contexts. Each type of machine learning and data distribution results in different performance. Ensemble is a method for combining several models into a single unit to get better performance. then in our study we tried to combine the learning model, sampling and some class data to get bagging and voting participation on the average macro performance of the f1 score of an ensemble model and compare it with the non-ensemble model. The results of this study indicate the sensitivity of Naïve Bayes to unbalanced data helped by bagging and voting with delta performance beetween 0.0001-0.0018, logistic regression increases the relatively low performance for bagging and voting with delta performance beetween 0.0001-0.00015, and the voting decision tree has the performance paid for by Naïve Bayes with delta performance -0.01. Keywords — Ensemble learning, Bagging , Klasifikasi email

Downloads

Published

2020-04-01

Issue

Section

Program Studi S1 Informatika