Analisis Implementasi Sistem Olap Dan Klasifikasi Ketepatan Waktu Lulus Dan Undur Diri Mahasiswa Teknik Informatika Universitas Telkom Menggunakan Random Forest
Abstract
Abstrak
Informasi kelulusan dan undur diri mahasiswa merupakan salah satu tolak ukur untuk mengevaluasi keberhasilan sebuah universitas. Begitu pula dengan program studi S1 Teknik Informatika, Universitas Telkom, yang memanfaatkan informasi kelulusan dan undur diri sebagai salah satu pendukung dalam kegiatan perencanaan dan evaluasi dalam mempertahankan kualitas kelulusan dan akreditasi program studi. Pada kenyataanya, pihak prodi memiliki permasalahan dalam melakukan evaluasi kelulusan, dikarenakan prodi belum bisa mendapatkan informasi yang lengkap, cepat dan akurat, padahal setiap tahunnya permasalahan mengenai kelulusan yaitu jumlah mahasiswa lulus tidak tepat waktu yang lebih besar dibanding dengan jumlah mahasiswa yang lulus tepat waktu dapat mempengaruhi kualitas kelulusan dan akreditasi prodi. Pada tugas akhir, dilakukan pembangunan sistem OLAP yang meliputi ektraksi data operasional ke dalam sebuah data warehouse untuk kemudian dilanjutkan dengan kegiatan analisis data menggunakan teknik klasifikasi data mining dengan random forest untuk menganalisis pola dari penyebab ketepatan waktu lulus dan undur diri mahasiswa. Hasil klasifikasi dievaluasi menggunakan micro average f1-score untuk mengetahui performansi sistem. Berdasarkan data akademik yang digunakan untuk klasifikasi menggunakan Random forest, nilai micro average f1-score tertinggi yang diperoleh sebesar 77%.
Kata Kunci:Data mining, random forest, Online Analytical Processing (OLAP), data warehouse.
Abstract
Information graduation and student retirement is one of the benchmarks for a university. Similarly, S1 Informatics Engineering course, Telkom University, which uses existing information and one of the most effective in planning and evaluation activities in graduation and accreditation courses. In fact, the parties that determine in the evaluation of graduation, because the program has not been able to get complete information, fast and accurate, whereas people who produce graduation ie the number of students is not in accordance with the time is greater than the number of students who can successfully affect the quality of graduation and accreditation of study program. Many factors that affect the timeliness of passing and not repeating are some of the grades of subjects, GPA, presence and more. In the final stages, the OLAP system is developed which includes the extraction of operational data into a data warehouse and then proceeded by using data mining techniques with random forest to analyze the patterns of various timeliness of pass and retreat students. From the result of the grouping that has been done using student academic data of the most influential factor yait The classification results are evaluated using the average micro-f1-score to determine the performance of the system. Based on the academic data used to use Random forest, the highest average micro value obtained is 77%.
Keywords :Data mining, random forest, Online Analytical Processing (OLAP), data warehouse.