Analisis KNN dan Decision Tree untuk Prediksi Curah Hujan di Tangerang Selatan
Keywords:
Prediksi, Hujan, Data Mining, KNN, C4.5Abstract
Fenomena curah hujan variatif dan hujan ekstrem dengan intensitas tinggi dalam waktu singkat kerap terjadi di Kota Tangerang Selatan dan berdampak pada gangguan aktivitas masyarakat. Ketidakpastian pola curah hujan harian menjadi tantangan serius dalam mitigasi bencana dan perencanaan wilayah. Kondisi ini menuntut adanya pendekatan ilmuah berbasis data historis yang mampu mengenali pola cuaca secara akurat. Namun, penelitian komparatif antara dua algoritma data mining yaitu K-Nearest Neighbor dan Decision Tree C4.5 untuk prediksi curah hujan di Kota Tangerang Selatan masih terbatas, sehingga diperlukan analisis lebih mendalam terhadap performa keduanya. Penelitian ini bertujuan untuk menganalisa dan membandingkan kinerja antara K-Nearest Neighbor dan Decision Tree C4.5 dalam prediksi curah hujan dengan klasifikasi cuaca sebagai kategori di Kota Tangerang Selatan. Data diperoleh dari BMKG periode 2022-2024 dan diolah dengan perangkat lunak RapidMiner melalui tahap preprocessing, pembersihan data, normalisasi, split data, evaluasi model hingga pengujian dengan cross validation 5-fold dan 10-fold. Evaluasi menggunakan metrik akurasi, recall, precision, F1-score, dan kappa. Hasil penelitian yang diharapkan adalah diperolehnya algoritma klasifikasi yang mampu memprediksi curah hujan secara akurat dan konsisten berdasarkan pola cuaca historis. Berdasarkan hasil pengujian, Decision Tree C4.5 menunjukan tingkat akurasi yang lebih tinggi dibandingkan KNearest Neighbor, sehingga dapat menjadi landasan ilmiah bagi Pemerintah Kota Tangerang Selatan untuk pengembangan selanjutnya.
References
Agung, A. S., Fauzi, A. A., Nur Risal, A. A., & Adiba, F. (2023). Implementasi Teknik Data Mining terhadap Klasifikasi Data Prediksi Curah Hujan BMKG Di Sulawesi Selatan. Jurnal Tekno Insentif, 17(1), 22–23. https://doi.org/10.36787/jti.v17i1.955
Al Arif, A., Firdaus, M., Rahmaddeni, & Maruhawa, Y. (2022). Perbandingan Metode Data Mining untuk Prediksi Curah Hujan dengan Algoritma C4.5, Naïve Bayes, dan KNN. SENTIMAS: Seminar Nasional Penelitian Dan Pengabdian Masyarakat, 187–197.
Ananda, N., & Gaol, G. . M. L. (2024). Estimasi Curah Hujan Bulanan Menggunakan Multi Layer Perceptron Di Kota Tangerang Selatan. Buletin Meteorologi,Klimatologi, Dan Geofisika, 5(4), 17–26.
Badan Pusat Statistik. (2025). Statistik Daerah Kota Tangerang Selatan 2025. BPS Kota Tangerang Selatan, 1–22.
Fatikah, I. H., & Khazizah, N. (2022). Analisis cuaca di Kota Jakarta bulan Januari tahun 2018 menggunakan Algoritma Decision Tree. Jurnal Poros Teknik, 14(1), 33–37. https://www.kaggle.com/datasets/msf1203/pr
Fatmawati. (2016). Perbandingan Algoritma Klasifikasi Data Mining Model C4.5 Dan Naive Bayes Untuk Prediksi Penyakit Diabetes. Jurnal Techno Nusa Mandiri, XIII(1), 50.
Limahelu, E. L., Thenu, Y. M., Umar, N., Putri, A. P. S., P.A.B, M. S., Antariksa, A. J., & Hakim, L. (2020). Buletin Meteorologi Analisis Cuaca Bulan Juni 2020. Buletin Meteorologi Stasiun Meteorologi Umbu Mehang Kunda Sumba Timur, 1–20.
Miller, C., Portlock, T., Nyaga, D. M., & O’Sullivan, J. M. (2024). A review of model evaluation metrics for machine learning in genetics and genomics. Frontiers in Bioinformatics, 4, 1–13. https://doi.org/10.3389/fbinf.2024.1457619
Pertiwi, D. A. S., & Paski, J. A. I. (2022). Analisis Dinamika Atmosfer Kejadian Hujan Ekstrim ( Studi Kasus Banjir Di Tangerang Analysis Of The Atmospheric Dynamics Of Extreme Rainfall Event ( Case Study Of Flood In Tangerang Selatan On 7 Th November 2021 ). Buletin Meteorologi, Klimatologi, Dan Geofisika, 2(2), 1–10.
Supriatna, D., & Uliyatunisa. (2025). Komparasi Model LSTM dan CNN-LSTM untuk Peramalan Curah Hujan di Kota Tangerang Selatan. Buletin Of Information Technology, 6(3), 294–301. https://doi.org/10.47065/bit.v5i2.2235
Susilawati Sugiana, N. S., & Musty, B. (2023). Analisis Data Sistem Informasi Monitoring Marketing; Tools Pengambilan Keputusan Strategic. Jutisi : Jurnal Ilmiah Teknik Informatika Dan Sistem Informasi, 12(2), 696. https://doi.org/10.35889/jutisi.v12i2.1240
Zidane, M. Y., Nurina Sari, B., Maulana, I., Primaya, A., & Garno, G. (2024). Penerapan Data Mining Dalam Klasifikasi Data Transaksi Produk Koperasi Di Smk Pgri 2 Karawang. JATI (Jurnal Mahasiswa Teknik Informatika), 9(1), 263–269. https://doi.org/10.36040/jati.v9i1.12196


