Analisis Transaksi Pembayaran Tiket Kereta Api (KAI) Dengan Pembayaran Via Bank Menggunakan Metode K-Nearest Neighbors Dan Naïve Bayes Studi kasus PT XYZ

Authors

  • Rizki Agustian Program Studi Teknik Informatika S-2, Universitas Pamulang
  • Murni Handayani Program Studi Teknik Informatika S-2, Universitas Pamulang
  • Abu Khalid Rivai Program Studi Teknik Informatika S-2, Universitas Pamulang

Keywords:

K-Nearest Neighbors (KNN), Naïve Bayes, data classification, train ticket transactions, RapidMiner

Abstract

In the digital era, train ticket payment patterns are increasingly complex with the increasing use of bank payment methods. PT XYZ, as a train ticket service provider, faces challenges in understanding customer behavior based on available transaction data. The main problem in this study is how to effectively group customer data based on their transaction characteristics to support service improvement and marketing strategies. This study implements two data mining classification algorithms, namely K-Nearest Neighbors (KNN) and Naïve Bayes, to analyze train ticket payment transaction patterns. Processing is carried out through the RapidMiner application, with an approach based on historical transaction data collected and processed using Microsoft Excel. The research methodology includes the stages of data collection, preprocessing, classification modeling, and model performance evaluation based on accuracy, precision, and recall metrics. The results show that the Naïve Bayes algorithm has superior performance compared to KNN, with an accuracy of 99.10%, a precision of 99.07%, and a recall of 99.14%. This indicates that Naïve Bayes is more effective in classifying customer transaction data. Companies can implement the Naïve Bayes algorithm in internal analytics systems to support data-driven decision-making, particularly in marketing strategies and customer service personalization

References

[1] Alghifari, F. and Juardi, D. (2021) ‘Penerapan Data Mining Pada Penjualan Makanan Dan Minuman Menggunakan Metode Algoritma Naïve Bayes’, Jurnal Ilmiah Informatika, 9(02), pp. 75–81. Available at: https://doi.org/10.33884/jif.v9i02.3755.

[2] Amanda Pratiwi, Ananto Tri Sasongko and K. Pramudito, D. (2023) ‘Analisis Prediksi Gilingan Plastik Terlaris Menggunakan Algoritma K-Nearest Neighbor Di Cv Menembus Batas’, Jurnal Informatika Teknologi dan Sains (Jinteks), 5(3), pp. 437–445. Available at: https://doi.org/10.51401/jinteks.v5i3.3323.

[3] Apriyadi, A., Lubis, M.R. and Damanik, B.E. (2022) ‘Penerapan Algoritma C5.0 Dalam Menentukan Tingkat Pemahaman Mahasiswa Terhadap Pembelajaran Daring’, Komputa : Jurnal Ilmiah Komputer dan Informatika, 11(1), pp. 11–20. Available at: https://doi.org/10.34010/komputa.v11i1.7386.

[4] Arta, I.K.J., Indrawan, G. and Rasben Dantes, G. (2019) ‘Data Mining Rekomemdasi Calon Mahasiswa Berprestasi di STMIK Denpasar Menggunakan Metode Technique For Other Reference By Similarity to Ideal Solution’, Jurnal Ilmu Komputer Indonesia (JIKI), 4(1), pp. 11–21.

[5] Azizah, Q., Masriah, M. and Atmojo, W.T. (2022) ‘Perancangan Data Warehouse Sistem Penerimaan Siswa Baru Menggunakan Online Analytical Processing (OLAP) di TK IT Mutiara’, Dirgamaya: Jurnal Manajemen dan Sistem Informasi, 2(2), pp. 35–47. Available at: https://doi.org/10.35969/dirgamaya.v2i2.273.

[6] Diana, Y. et al. (2023) ‘Analisa Penjualan Menggunakan Algoritma K-Medoids Untuk Mengoptimalkan Penjualan Barang’, JOISIE Journal Of Information System And Informatics Engineering, 7(1), pp. 97–103.

[7] Eka Saputri, Danilla Oktaviyana Nurlyta Lestariningsih, E. (2023) ‘Implementasi Data Mining Pada Penjualan Sepatu Menggunakan Algoritma Apriori (Kasus Toko Sepatu 3Stripesid)’, Jurnal Algoritma, 4(1), pp. 667–676.

[8] Ferdyandi, M., Setiawan, N.Y. and Abdurrachman Bachtiar, F. (2022) ‘Prediksi Potensi Penjualan Makanan Beku Berdasarkan Ulasan Pengguna Shopee Menggunakan Metode Decision Tree Algoritma C4.5 Dan Random Forest (Studi Kasus Dapur Lilis)’, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 6(2), pp. 588–596. Available at: http://j-ptiik.ub.ac.id.

[9] Fitrianti, I., Voutama, A. and Umaidah, Y. (2023) ‘Clustering Film Populer Pada Aplikasi Netflix Dengan Menggunakan Algoritma K-Means Dan Metode CRISP-DM Clustering Popular Movies on Netflix App Using K-Means Algorithm and CRISP-DM Method’, Jtsi, 4(2), pp. 301–311.

[10] Ghita, F. and Trisminingsih, R. (2021) ‘Pengujian Data Warehouse SOLAP untuk Komoditas Pertanian Indonesia Data Warehouse Testing in SOLAP for Indonesia Agricultural Commodities’, Jurnal Ilmu Komputer Agri-Informatika, 8(1), pp. 42–56. Available at: http://solap.apps.cs.ipb.ac.id.

[11] Hijrah, Maulidar and Adria (2022) ‘Analisis RapidMiner Dan Weka Dalam MemprediksiKualitas Kinerja Karyawan Menggunakan MetodeAlgoritma C4.5’, Http://Jurnal.Mdp.Ac.Id, 9(2), pp. 1655–1665.

[12] Ismiyana Putri, D. and Yudhi Putra, M. (2023) ‘Komparasi Algoritma Dalam Memprediksi Perubahan Harga Saham Goto Menggunakan Rapidminer’, Jurnal Khatulistiwa Informatika, 11(1), pp. 14–20. Available at: https://doi.org/10.31294/jki.v11i1.16153.

[13] Manalu, D.A. and Gunadi, G. (2022) ‘Implementasi Metode Data Mining K-Means Clustering Terhadap Data Pembayaran Transaksi Menggunakan Bahasa Pemrograman Python Pada Cv Digital Dimensi’, Infotech: Journal of Technology Information, 8(1), pp. 43–54. Available at: https://doi.org/10.37365/jti.v8i1.131.

[14] Mardiani, E. et al. (2023) ‘Komparasi Metode Knn, Naive Bayes, Decision Tree, Ensemble, Linear Regression Terhadap Analisis Performa Pelajar Sma’, Innovative: Journal Of …, 3(2), pp. 13880–13892. Available at: http://j-innovative.org/index.php/Innovative/article/view/1949%0Ahttp://j-innovative.org/index.php/Innovative/article/download/1949/1468.

[15] Mukrodin, M., Taufiq, R. and Ermi, D.S.R. (2023) ‘Data Mining Clustering Data Obat-Obatan Menggunakan Algoritma K-Means Pada Rsu an Ni’Mah Wangon’, JIKA (Jurnal Informatika), 7(2), p. 165. Available at: https://doi.org/10.31000/jika.v7i2.7553.

[16] Naldy, E.T. and Andri, A. (2021) ‘Penerapan Data Mining Untuk Analisis Daftar Pembelian Konsumen Dengan Menggunakan Algoritma Apriori Pada Transaksi Penjualan Toko Bangunan MDN’, Jurnal Nasional Ilmu Komputer, 2(2), pp. 89–101. Available at: https://doi.org/10.47747/jurnalnik.v2i2.525.

[17] Purwanto, J. and Renny, R. (2021) ‘Perancangan Data Warehouse Rumah Sakit Berbasis Online Analytical Processing (OLAP)’, Jurnal Teknologi Informasi dan Ilmu Komputer, 8(5), pp. 1077–1088. Available at: https://doi.org/10.25126/jtiik.2021854232.

[18] Rafi Nahjan, M., Nono Heryana and Apriade Voutama (2023) ‘Implementasi Rapidminer Dengan Metode Clustering K-Means Untuk Analisa Penjualan Pada Toko Oj Cell’, JATI (Jurnal Mahasiswa Teknik Informatika), 7(1), pp. 101–104. Available at: https://doi.org/10.36040/jati.v7i1.6094.

[19] Ramadhantya, A.S. (2024) ‘Penggunaan Rapidminer Untuk Memprediksi Kelulusan Mahasiswa Dengan Algorithm Naive Bayes’, 10(1), pp. 52–60.

[20] Rizal, R., Martanto, M. and Arie Wijaya, Y. (2022) ‘Analisa Dataset Software Defined Network Intrusion Menggunakan Algoritma Deep Learning H2O’, JATI (Jurnal Mahasiswa Teknik Informatika), 6(2), pp. 747–757. Available at: https://doi.org/10.36040/jati.v6i2.5724.

[21] Rizkiawan, A. and Wahyudi, T. (2023) ‘Implementasi Data Mining Untuk Memprediksi Member Baru Menggunakan Linear Regression Pada Pt. Gsi’, Jurnal Tekinkom (Teknik Informasi dan Komputer), 6(1), pp. 118–126. Available at: https://doi.org/10.37600/tekinkom.v6i1.707.

[22] Romli, I. (2021) ‘Penerapan Data Mining Menggunakan Algoritma K-Means Untuk Klasifikasi Penyakit Ispa’, Indonesian Journal of Business Intelligence (IJUBI), 4(1), p. 10. Available at: https://doi.org/10.21927/ijubi.v4i1.1727.

[23] Rosika, H. et al. (2024) ‘Pakaian Menggunakan Metode K-Means Pada era digital perkembangan teknologi semakin berkembang khusunya pengelolaan data penjualan menjadi semakin krusial bagi bisnis untuk memahami perilaku konsumen , mengedentifikasi beberapa kelompok atau cluster memili’, 5, pp. 221–231.

[24] Rusdah, R. and Bregastantyo, B.A. (2023) ‘Model Prognosis Masa Pengobatan Pasien Tuberkulosis Dengan Metode C4.5’, Jurnal Teknologi Informasi dan Ilmu Komputer, 10(6), pp. 1197–1204. Available at: https://doi.org/10.25126/jtiik.1067393.

[25] Saputra, D.B. et al. (2024) ‘Penerapan Model Crisp-Dm Pada Prediksi Nasabah Kredit’, 7(2021), pp. 240–247.

[26] Virza, V.P., Tri Pranot, G. and Eko Putra, F. (2023) ‘Klasifikasi Kebutuhan Sparepart Dengan Algoritma K-Nearest Neighbor Untuk Meningkatkan Penjualan Sparepart’, Bulletin of Information Technology (BIT), 4(3), pp. 287–293. Available at: https://doi.org/10.47065/bit.v4i3.729.

[27] Winantu, A. and Khatimah, C. (2023) ‘Perbandingan Metode Klasifikasi Naive Bayes Dan K-Nearest Neighbor Dalam Memprediksi Prestasi Siswa’, INTEK : Jurnal Informatika dan Teknologi Informasi, 6(1), pp. 58–64. Available at: https://doi.org/10.37729/intek.v6i1.3006.

[28] Yoliadi, D.N. (2023) ‘Data Mining Dalam Analisis Tingkat Penjualan Barang Elektronik Menggunakan Algoritma K-Means’, Insearch: Information System Research Journal, 3(01). Available at: https://doi.org/10.15548/isrj.v3i01.5829.

[29] Yudiana, Y., Yulia Agustina, A. and Nur Khofifah, dan (2023) ‘Prediksi Customer Churn Menggunakan Metode CRISP-DM Pada Industri Telekomunikasi Sebagai Implementasi Mempertahankan Pelanggan’, Indonesian Journal of Islamic Economics and Business, 8(1), pp. 01–20. Available at: http://e-journal.lp2m.uinjambi.ac.id/ojp/index.php/ijoieb.

[30] Zahra, F., Ridla, M.A. and Azise, N. (2024) ‘Implementasi Data Mining Menggunakan Algoritma Apriori Dalam Menentukan Persediaan Barang (Studi Kasus : Toko Sinar Harahap)’, JUSTIFY : Jurnal Sistem Informasi Ibrahimy, 3(1), pp. 55–65. Available at: https://doi.org/10.35316/justify.v3i1.5335.

Downloads

Published

2025-07-31