Sms Filtering Menggunakan Naive Bayes Classifier Dan Fp-growth Algorithm Frequent Itemset
Abstract
Abstrak
SMS (Short Message Service) masih menjadi pilihan utama sebagai media komunikasi walaupun sekarang ponsel semakin berkembang dengan berbagai media komunikasi aplikasi messenger. Seiring dengan berkembangnya berbagai media komunikasi lain, beberapa operator di beberapa negara menurunkan tarif SMS untuk tetap menarik minat pengguna ponsel. Namun penurunan tarif ini menyebabkan meningkatnya SMS spam, karena dimanfaatkan oleh beberapa pihak sebagai salah satu alternatif untuk iklan hingga penipuan. Hal itu menjadi permasalahan penting karena dapat mengganggu dan merugikan pengguna. Naive Bayes dianggap sebagai salah satu learning algorithm yang sangat efektif dan penting untuk machine learning dalam information retrieval. Naive Bayes terbukti memiliki kinerja yang baik dalam klasifikasi teks dan deteksi SMS spam [2,10] dengan menunjukan akurasi yang tinggi. Dengan dikolaborasikan algoritma yang mampu menentukan frequent itemset dengan baik maka mampu menghasilkan tingkat akurasi yang lebih baik [2]. Karena tidak hanya setiap kata yang dianggap mutually independent, tetapi juga kata yang frequent sebagai kata yang single, independent dan mutually exclusive [2], sehingga mampu meningkatkan nilai peluang dan menyebabkan sistem lebih tepat dalam klasifikasi. Dalam hal ini digunakan FP-Growth untuk mining frequent pattern yang memiliki performansi yang baik dan efisien karena tidak membutuhkan pembangkitan kandidat frequent [4]. Hasil penelitian penggunan kolaborasi antara Naive Bayes dan FP-Growth menghasilkan akurasi rata- rata terbesar sebesar 98, 506% dan lebih unggul 0,025% dari metode tanpa melibatkan FP-Growth untuk dataset SMS Spam Collection v.1, serta meningkatkan nilai precision sehingga hasil klasifikasi lebih akurat.
Kata Kunci: ekstraksi kata kunci, KEA, social media