Aplikasi Berbasis Dataset E-commerce Untuk Prediksi Kemiskinan Menggunakan Algoritma NaÃve Bayes, Xgboost Dan Similarity Based Feature Selection

Sherla Yualinda, Dedy Rahman Wijaya, Elis Hernawati

Abstract

Abstrak Kemiskinan menginterpretasikan salah suatu keadaan seseorang tidak mampu untukmemenuhi kebutuhan dasar mereka seperti halnya sandang, papan, pangan, kesehatan, dalam menuntut ilmu, dll. Badan Pusat Statistik atau lebih dikenal dengan sebutan BPS menggunakan konsep kemampuan untuk dapat memenuhi kebutuhan (basic needs approach) guna mengukur tingkat kemiskinan di Indonesia. Dengan menggunakan konsep ini, pengeluaran menjadi tolak ukur dari kemiskinan yang dipandang sebagai ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan pangan dan non pangan, sehingga penduduk yang tidak mampu (miskin) adalah penduduk yang memiliki pengeluaran perkapita perbulan dibawah garis kemiskinan. Metode lain yang diusulkan penulis untuk melengkapi hasil survei dan sensus guna memprediksi kemiskinan di suatu daerah di Indonesia adalah menggunakan naive bayes dengan metode XGBoost dan Similarity Based berbasis e-commerce. Dalam percobaan yang telah dilakukan, nilainya cukup relevan antara fitur dan nilai asli. Banyaknya fitur yang terlalu sedikit tidak selalu menghasilkan nilai akurasi yang juga kecil, demikian juga sebaliknya, di mana penggunaan sejumlah besar fitur tidak selalu menghasilkan akurasi yang tinggi. Kata Kunci: Kemiskinan, BPS, Naive Bayes, XGBoost, Similarity Based, data e- commerce. Abstract Poverty interprets one of the conditions a person is unable to meet their basic needs such as clothing, shelter, food, health, in studying, etc. The Central Statistics Agency or better known as BPS uses the concept of ability to be able to meet needs (basic needs approach) to measure poverty levels in Indonesia. By using this concept, expenditure becomes a benchmark of poverty which is seen as an inability from the economic side to meet food and non-food needs, so that the poor can be those who have per capita expenditure per month below the poverty line. Another method proposed by the author to supplement survey and census results to predict poverty in an area in Indonesia is to use Naive Bayes with XGBoost and Similarity Based e-commerce methods. In the experiments that have been carried out, the value is quite relevant between the features and the original values. The number of features that are too little does not always produce a value of accuracy that is also small, as well as vice versa, where the use of a large number of features does not always produce high accuracy. Keywords: Poverty, BPS, Naive Bayes, XGBoost, Similarity Based, e-commerce data

Full Text:

PDF

Refbacks

  • There are currently no refbacks.
max_upload :0