Analisis dan Deteksi Risiko Fraud Pada Data Program Indonesia Pintar (PIP) Menggunakan Algoritma Machine Learning (Studi Kasus Penyaluran Dana PIP di Kab. Cianjur)

Authors

  • Rizki Izandi Gumay Teknik Informatika, Program Pascasarjana, Universitas Pamulang
  • Sajarwo Anggai Teknik Informatika, Program Pascasarjana, Universitas Pamulang

Keywords:

Machine Learning, Data Mining, Fraud Detection, Naïve Bayes, Random Forest, Support Vector Machine

Abstract

Program Indonesia Pintar (PIP) merupakan program strategis nasional yang diharapkan mampu menjamin peserta didik dapat melanjutkan pendidikan sampai dengan menyelesaikan pendidikan menengah, dan menarik siswa putus sekolah atau tidak melanjutkan pendidikan agar kembali mendapatkan layanan pendidikan. Program ini akan berjalan dengan lancar sesuai dengan tujuannya jika yang diberikan bantuan tepat jumlah yaitu peserta didik yang menerima dana PIP sesuai dengan nilai bantuan yang disalurkan. Penelitian ini bertujuan untuk mengetahui kinerja algoritma klasifikasi yang digunakan yaitu Support Vector Machine(SVM), Random Forest Classifier(RFC) dan Naïve Bayes (NB). selanjutnya melakukan analisa perbandingan kinerja, terhadap data yang telah dilakukan normalisasi data dan penanganan outlier pada ketiga algoritma tersebut. Hasil penelitian menunjukkan bahwa model algoritma RFC memiliki kinerja paling baik dengan nilai akurasi sebesar 0.948 dan logloss 0.272 dibandingkan dengan SVM dan NB.

References

[1] S. Suyanto, Machine Learning tingkat Dasar Dan Lanjut. Informatika Bandung, 2018.

[2] I Kadek Juni Arta, Gede Indrawan, Gede Rasben Dantes, “Data Mining Rekomendasi Calon Mahasiswa Berprestasi Di STIMIK Denpasar Menggunakan Metode Technique For Others Reference By Similarity To Ideal Solution,†Jurnal Ilmu Komputer Indonesia (JIKI) Vol: 4, No. 1, Februari 2019.

[3] Matin N. Ashtiani And Bijan Raahemi, “Intelligent Fraud Detection in Financial Statements Using Machine Learning and Data Mining: A Systematic Literature Review,†IEEE Access Digital Object Identifier 10.1109/ACCESS.2021.3096799 Volume 10, 2022.

[4] Hozairi, Anwari, Syariful Alim, “Orange Data Mining Implementation For Student Graduation Classification Using K-Nearest Neighbor, Decision Tree And Naive Bayes Models,†Jurnal Ilmiah Nero Vol. 6 No. 2, 2021.

[5] Muhammad Radhi, Amalia, Daniel Ryan Hamonangan Sitompul, Stiven Hamonangan Sinurat, Evta Indra, “Analisis Big Data Dengan Metode Exploratory Data Analysis (EDA) Dan Metode Visualisasi Menggunakan Jupyter Notebook,†Jusikom Prima, Vol. 4 No. 2 Februari 2021 E-ISSN : 2580-2879.

[6] D. A. Nasution, H. H. Khotimah, dan N. Chamidah,“Perbandingan Normalisasi Data Untuk Klasifikasi Wine Menggunakan Algoritma K-NN,†CESS (Journal Comput. Eng. Syst. Sci., vol. 4, no. 1, hal. 78– 82, 2019.

[7] Puji Puspa Sari, Erna Tri Herdiani, Nurtiti Sunusi,“ Outlier Detection Using Minimum Vector Variance Algorithm with Depth Function and Mahalanobis Distance,†Jurnal Matematika, Statistika & Komputasi, E-ISSN 2614-8811 Vol. 17, No. 3, 418 - 427, May, 2021DOI: 10.20956/j.v17i3.12629.

[8] H. Derajad Wijaya and S. Dwiasnati, “Implementasi Data Mining dengan Algoritma Naïve Bayes pada Penjualan Obat,†Jurnal Informatika, vol. 7, no. 1, 2020, [Online]. Available: http://ejournal.bsi.ac.id/ejurnal/index.php/ji.

[9] S. A. Taher, K. A. Akhter, and K. M. A. Hasan, “N-Gram Based Sentiment Mining for Bangla Text Using Support Vector Machine,†in 2018 International Conference on Bangla Speech and Language Processing (ICBSLP), 2018, pp. 1–5. doi: 10.1109/ICBSLP.2018.8554716.

[10] S. Huang, C. A. I. Nianguang, P. Penzuti Pacheco, S. Narandes, Y. Wang, and X. U. Wayne, “Applications of support vector machine (SVM) learning in cancer genomics,†Cancer Genomics and Proteomics, vol. 15, no. 1, pp. 41–51, 2018, doi: 10.21873/cgp.20063.

[11] S. Ghosh, A. Dasgupta, and A. Swetapadma, “A Study on Support Vector Machine based Linear and Non-Linear Pattern Classification,†in 2019 International Conference on Intelligent Sustainable Systems (ICISS), 2019, pp. 24–28. doi: 10.1109/ISS1.2019.8908018.

[12] L. Yahaya, N. D. Oye, and E. J. Garba, “A Comprehensive Review on Heart Disease Prediction Using Data Mining and Machine Learning Techniques,†Am. J. Artif. Intell., vol. 4, no.1, pp. 20–29, 2020, doi: 10.11648/j.ajai.20200401.12.

[13] Mohamad Efendi Lasulika, “Komparasi Naïve Bayes, Support Vector Machine Dan K- Nearest Neighbor Untuk Mengetahui Akurasi Tertinggi Pada Prediksi Kelancaran Pembayaran TV Kabel†ILKOM Jurnal Ilmiah Volume 11 Nomor 1 April 2019 e-ISSN 2548-7779.

[14] Breiman, L. (2001). Random Forests. (R. E. Schapire, Ed.) Machine Learning, 45, 5-32. Retrieved April 22, 2021, from https://link.springer.com/article/10.1023/A:1010933404324.

[15] Pertiwi, D. P., Wiranto, & Anggrainingsih, R. (2019). Evaluation Of Campaign Categories On Kitabisa.Com By Naive Bayes Classifier Method. ITSMART: Jurnal Ilmiah Teknologi dan Informasi, 8(1), 26-33.

[16] Gorunescu, Data Mining: Concepts, Models and Techniques, Springer, 2011.

Downloads

Published

2023-12-31

How to Cite

Gumay, R. I., & Anggai, S. (2023). Analisis dan Deteksi Risiko Fraud Pada Data Program Indonesia Pintar (PIP) Menggunakan Algoritma Machine Learning (Studi Kasus Penyaluran Dana PIP di Kab. Cianjur). Prosiding Seminar Kecerdasan Artifisial, Sains Data, Dan Pendidikan Masa Depan, 1, 140–148. Retrieved from https://openjournal.unpam.ac.id/index.php/PROKASDADIK/article/view/37356