Analisis Prediktif Penyakit Menular dengan Menggunakan K-Nearest Neighbors dan Naïve Bayes di Indonesia
Keywords:
Tuberkulosis, Prediksi Penyakit, K-Nearest Neighbors, Decision Tree, Naïve Bayes, Pembelajaran MesinAbstract
Penyakit menular, khususnya Tuberkulosis (TB), tetap menjadi tantangan kesehatan utama di Indonesia. Penggunaan metode prediktif berbasis pembelajaran mesin dapat membantu dalam mengidentifikasi pola penyebaran penyakit dan mendukung upaya pencegahan yang lebih efektif. Penelitian ini bertujuan untuk menganalisis performa tiga algoritma pembelajaran mesin, yaitu K-Nearest Neighbors (KNN), Decision Tree, dan Naïve Bayes, dalam memprediksi jumlah kasus TB di berbagai provinsi di Indonesia berdasarkan data jumlah penduduk. Data yang digunakan dalam penelitian ini diperoleh dari laporan kesehatan publik dan statistik populasi, mencakup informasi tentang jumlah kasus TB dan jumlah penduduk di berbagai provinsi. Setelah melakukan pra-pemrosesan data, termasuk pembersihan, normalisasi, dan pembagian data menjadi set latih dan uji, ketiga algoritma tersebut diterapkan dan dievaluasi. Hasil penelitian menunjukkan bahwa algoritma Decision Tree memberikan performa terbaik dalam regresi, dengan Mean Absolute Error (MAE) sebesar 11,948.45 dan R-squared (R²) sebesar 0.6247, menunjukkan kemampuan yang lebih baik dalam menangkap pola dari dataset dibandingkan dengan KNN. Algoritma KNN menunjukkan nilai MAE sebesar 16,298.91 dan R-squared sebesar 0.3424, mengindikasikan performa yang kurang memuaskan. Sementara itu, Naïve Bayes menunjukkan performa yang sangat baik dalam klasifikasi dengan akurasi sempurna (1.0), precision, recall, dan f1-score masing-masing sebesar 1.0. Berdasarkan hasil ini, Decision Tree direkomendasikan untuk prediksi jumlah kasus TB dalam pendekatan regresi, sementara Naïve Bayes sangat cocok untuk tugas klasifikasi. Penelitian ini memberikan kontribusi penting dalam penggunaan algoritma pembelajaran mesin untuk prediksi penyakit menular dan dapat membantu dalam strategi pencegahan dan pengendalian penyakit di Indonesia.
References
[1] Chen, L., et al. (2018). "Machine Learning for Public Health: A Review of Methods and Applications." Annual Review of Public Health, 39: 193-213.
[2] Cover, T., and Hart, P. (1967). "Nearest neighbor pattern classification." IEEE Transactions on Information Theory, 13(1): 21-27.
[3] Perez, L., et al. (2019). "Data Mining in Epidemiology: A Review." Journal of Biomedical Informatics, 94: 103181.
[4] Quinlan, J. R. (1986). "Induction of decision trees." Machine Learning, 1(1): 81-106.
[5] Rish, I. (2001). "An empirical study of the naive Bayes classifier." IJCAI 2001 Workshop on Empirical Methods in AI, 3: 41-46.
[6] World Health Organization. Global Tuberculosis Report 2020. WHO, 2020
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Bery Agustianto
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.