Analisis Klasifikasi Kualitas Udara Menggunakan Metode Algoritma K-Nearest Neighbor Pada Provinsi Dki Jakarta
Abstrak
Abstrak : Udara sangat penting bagi keberlangsungan
makhluk hidup, udara membuat makhluk hidup bisa
beraktifitas dengan baik. Namun dengan meningkatnya
pencemaran udara seiring waktu karena besar nya
pertumbuhan pada bidang industri dan banyaknya
masyarakat memiliki kendaraan bermotor. Pada tahun
2019 indonesia termasuk pada titik pencemaran udara
terburuk yang sudah mencapai titik merah yang
menandakan tidak sehat nya udara yang ada pada DKI
Jakarta serta memburuknya udara membuat Provinsi
DKI Jakarta menduduki posisi ke 5 pencemaran udara
terburuk pada IQair dunia. Untuk mengetahui dan
monitoring serta mendeteksi informasi kualitas udara
maka yang dapat dilakukan klasifikasi. Klasifikasi
digunakan karena dapat memonitor informasi kualitas
udara berdasarkan pengolahan data ISPU yang sudah
memiliki label target. Klasifikasi dilakukan dengan
menggunakan dataset ISPU pencemaran udara Provinsi
DKI Jakarta dari tahun 2019 sampai 2022. Pada
penelitian ini akan mengklasifikasikan data ISPU
menggunakan algoritma K-Nearest Neighbor. Dengan
menggunakan 5 atribut PM10, SO2, NO, O3, dan CO2
serta kategori sebagai target label dalam penelitian ini.
Hasil dari penelitian menunjukan algoritma KNN
mendapatkan akurasi tertinggi pada pengujian awal
dengan rasio 80:20 dengan ketetanggaan K = 5 dengan
nilai akurasi sebesar 90.98%. pengujian kedua dengan
tuning hyperparameter yang menghasilkan akurasi
tertinggi pada rasio 80:20 dengan ketetanggan k = 7
dengan kombinasi parameter weight <distance=, p <1=
sebesar 91,37%, presisi 82,87%, recall 85,22% dan f1-
score 84.03%. dan validasi algoritma menggunakan KFold Cross Validation dengan jumlah fold 10
menghasilkan rata rata sebesar 89,43%.
Kata kunci— Udara, klasifikasi, KNN, DKI Jakarta
Referensi
Abidin, J., Artauli Hasibuan, F., kunci, K., Udara, P., &
Gauss, D. (2019). Pengaruh Dampak Pencemaran
Udara Terhadap Kesehatan Untuk Menambah
Pemahaman Masyarakat Awam Tentang Bahaya
Dari Polusi Udara. In Prosiding SNFUR-4.
Apriawati, E., & Kiswandono, A. A. (2017). Kajian
Indeks Standar Polusi Udara (ISPU) Nitrogen
Dioksida (NO2) di Tiga Lokasi Kota Bandar
Lampung. Analytical and Environmental
Chemistry, 2(01), 42-51.
Firdaus, D. (2017). Penggunaan Data Mining dalam
Kegiatan Sistem Pembelajaran Berbantuan
Komputer. In Jurnal (Vol. 6).
Gilabert, P. L., Gadringer, M. E., Montoro, G., Mayer, M.
L., Silveira, D. D., predistortion and ofdm clipping
for power amplifiers. International Journal of RF
and Microwave Computer-Aided Engineering,
(5), 583-591.
://doi.org/10.1002/mmce.20381
Identifying the Main Sources of Air Pollution in Jakarta:
A Source Apportionment Study - Vital Strategies.
(n.d.). Retrieved March 17, 2023, from
://www.vitalstrategies.org/resources/identifyin
g-the-main-sources-of-air-pollution-in-jakarta-asource-apportionment-study/
Rizi, U. F., Suradi, Sunaryo, Agus, A., Ahmad, M.,
Kusumaningtyas, S. D. A., Nurhayati, H., Khoir, A.
N., Sucianingsih, C., & W, N. F. P. (2019). Analisis
Dampak Diterapkannya Kebijakan Working From
Home Saat Pandemi Covid-19 Terhadap Kondisi
Kualitas Udara Di Jakarta. Jurnal Meteorologi
Klimatologi Dan Geofisika, 6(3), 6-14.
https://jurnal.stmkg.ac.id/index.php/jmkg/article/vi
ew/141
Roihan, A., Sunarya, P. A.4, & Rafika, A. S. (2020).
Pemanfaatan Machine Learning dalam Berbagai
Bidang: Review paper. IJCIT (Indonesian Journal
on Computer and Information Technology), 5(1),
-82. https://doi.org/10.31294/ijcit.v5i1.7951
Silaparasetty, N., & Silaparasetty, N. (2020). Machine
Learning vs. Deep Learning. In Machine Learning
Concepts with Python and the Jupyter Notebook
Environment. /doi.org/10.1007/978-1-4842-5967-2_4
Sodiq, M. J., & Sela, E. I. (2019). Perbandingan Metode
Naive Bayes Dan K-Nearest Neighbor Pada
Klasifikasi Kualitas Udara Di Dki Jakarta.
Wahyono, T. (2018). Fundamental of Python for Machine
Learning: Dasar-Dasar Pemrograman Python untuk
Machine Learning dan Kecerdasan Buatan.
SeAmbarwari, A., Jafar Adrian, Q., & Herdiyeni, Y.
(2020). Analysis of the Effect of Data Scaling on the
Performance of the Machine Learning Algorithm
for Plant Identification. Jurnal RESTI (Rekayasa
Sistem Dan Teknologi Informasi), 4(1), 117-122. oi.org/10.29207/resti.v4i1.1517
Anggada Maulana. (2018). Konsep Dasar Data Mining.
Konsep Data Mining, 1, 1-16.
Azis, H., Purnawansyah, P., Fattah, F., & Putri, I. P.
(2020). Performa Klasifikasi K-NN dan Cross
Validation Pada Data Pasien Pengidap Penyakit
Jantung. ILKOM Jurnal Ilmiah, 12(2), 81-86. doi.org/10.33096/ilkom.v12i2.507.81-86
Belete, D. M., & Huchaiah, M. D. (2022). Grid search in
hyperparameter optimization of machine learning
models for prediction of HIV/AIDS test results.
International Journal of Computers and
Applications, 44(9), 875-886.
https://doi.org/10.1080/1206212X.2021.1974663
BPS Provinsi DKI Jakarta. (n.d.). Retrieved March 16,
, from
Firdaus, D. (2017). Penggunaan Data Mining dalam
Kegiatan Sistem Pembelajaran Berbantuan
Komputer. In Jurnal (Vol. 6).
Khairi, A. (2021). Implementasi K-Nearest Neighbor
(KNN) untuk Klasifikasi Masyarakat Pra Sejahtera
Desa Sapikerap Kecamatan Sukarapu. Jurnal
TRILOGI, 2(3), 319-323.ejournal.unuja.ac.id/index.php/trilogi/article/
view/2878
Klein, R. H., Klein, D. B., & Luciano, E. M. (2018). Open
Government Data: Concepts, Approaches and
Dimensions Over Time. Revista Economia &
Gestao, 18(49), 4-24.doi.org/10.5752/p.1984-
2018v18n49p4-24
Kusnandar, M. (2020). Permen LHK Nomor 14 Tahun
Permen LHK Nomor 14 Tahun 2020 Tentang
Indeks Standar Pencemar Udara (ISPU), 1-16.
Ndaumanu, R. I., & Arief, Kusrini, M. R. (2014). Analisis
Prediksi Tingkat Pengunduran Diri Mahasiswa
dengan Metode K-Nearest Neighbor. Jatisi, 1(1), 1-
www.mdp.ac.id/jatisi/vol-1-no1/JATISI_Vol_1_No_1_September_2014_1.pdf
Normawati, D., & Ismi, D. P. (2019). K-Fold Cross
Validation for Selection of Cardiovascular Disease
Diagnosis Features by Applying Rule-Based
Datamining. Signal and Image Processing Letters,
(2), 23-35. https://doi.org/10.31763/simple.v1i2.3
Nurdalia, Zilrahmi, Permana, D., & Salma, A. (2023).
Comparison of Naive Bayes and K-Nearest
Neighbor for DKI Jakarta Air Pollution Standard
Index Classification. UNP Journal of Statistics and
Data Science, 1(2), 67-73. doi.org/10.24036/ujsds/vol1-iss2/29



