Analisis Performa K-Nearest Neighbor, Naive Bayes, Decision Tree, dan Logistic Regression Untuk Klasifikasi Kanker Payudara Menggunakan Orange Data Mining

Authors

  • Angga Firmansyah Teknik Informatika, Program Pascasarjana, Universitas Pamulang

Keywords:

K-Nearest Neighbor (K-NN), Naive Bayes, Decision Tree, Logistic Regression, Kanker Payudara

Abstract

Kanker payudara merupakan jenis kanker yang sering muncul di dalam sel-sel payudara, dan pertumbuhan sel kanker tersebut seringkali sulit untuk dikendalikan. Di Indonesia, kanker payudara menjadi kasus kanker yang paling umum, dan juga salah satu penyebab utama kematian. Oleh karena itu, sangat penting untuk mengklasifikasikan pasien yang menderita kanker payudara dan orang yang sehat sebagai langkah awal dalam mendeteksi penyakit ini lebih awal, yang dapat meningkatkan peluang kesembuhan pasien. Dalam penelitian ini, dilakukan evaluasi terhadap empat algoritma klasifikasi yang umum digunakan, yaitu K-Nearest Neighbor (K-NN), Naive Bayes, Decision Tree, dan Logistic Regression, untuk mengklasifikasikan kanker payudara. Menggunakan perangkat lunak Orange Data Mining sebagai alat utama dalam implementasi dan percobaan. Data yang digunakan dalam penelitian ini berasal dari Breast Cancer Coimbra dari UCI Machine Learning Repository. Tujuan dari penelitian ini adalah untuk membandingkan kinerja masing-masing algoritma klasifikasi dalam pengenalan kanker payudara dan mengevaluasi tingkat akurasi mereka. Hasil eksperimen menunjukkan bahwa tiap algoritma memiliki keunggulan dan kelemahan tersendiri dalam hal akurasi, sensitivitas, dan spesifisitas. Analisis kinerja ini akan memberikan panduan yang berharga dalam pemilihan algoritma klasifikasi yang paling sesuai untuk tugas mengklasifikasikan kanker payudara.

References

[1] S. Nurwenda, “Deteksi Dini Kanker: Mengapa dan Bagaimana?,†Direktorat Jenderal Pelayanan Kesehatan Kemenkes RI, 2022. https://yankes.kemkes.go.id/view_artikel/173/deteksi-dini-kanker-mengapa-dan-bagaimana (accessed Oct. 25, 2023).

[2] C. M. Annur, “Kanker Payudara, Penyakit Kanker Paling Banyak Dialami Masyarakat Indonesia,†databoks.katadata.co.id, 2022. https://databoks.katadata.co.id/datapublish/2022/10/11/kanker-payudara-penyakit-kanker-paling-banyak-dialami-masyarakat-indonesia (accessed Oct. 25, 2023).

[3] R. Fadli, “Kanker Payudara,†halodoc.com, 2022. https://www.halodoc.com/kesehatan/kanker-payudara (accessed Oct. 25, 2023).

[4] Pittara, “Kanker Payudara,†alodokter.com, 2023. https://www.alodokter.com/kanker-payudara (accessed Oct. 30, 2023).

[5] H. K. Nurwigati Sumartiningtyas, “Kanker Payudara Paling Banyak Didiagnosis di Dunia, Studi Jelaskan,†kompas.com, 2021. https://www.kompas.com/sains/read/2021/02/05/192600023/kanker-payudara-paling-banyakdidiagnosis-di-dunia-studi-jelaskan (accessed Oct. 30, 2023).

[6] D. Andriani, “Ini Jenis Kanker yang Paling Banyak Diderita Masyarakat Indonesia,†lifestyle.bisnis.com, 2020. https://lifestyle.bisnis.com/read/20200225/106/1205840/ini-jenis-kanker-yang-paling-banyak-diderita-masyarakat-indonesia (accessed Oct. 30, 2023).

[7] N. Wardani, “Penerapan Data Mining Dalam Analytic CRM,†Yayasan Kita Menulis. pp. 47–48, 2020.

[8] R. Ordila, R. Wahyuni, Y. Irawan, and M. Y. Sari, “Penerapan Data Mining Untuk Pengelompokan Data Rekam Medis Pasien Berdasarkan Jenis Penyakit Dengan Algoritma Clustering …,†J. Ilmu Komput., vol. 9, no. 2, pp. 148–153, 2020.

[9] Sukamto, Y. Adriyani, and R. Aulia, “Prediksi Kelompok UKT Mahasiswa Menggunakan Algoritma K-Nearest Neighbor,†JUITA J. Inform., vol. 8, no. 1, p. 121, 2020.

[10] R. Sari, “Analisis Sentimen pada Review Objek Wisata Dunia Fantasi Menggunakan Algoritma K-Nearest Neighbor (K-NN),†Evolusi J. Sains dan Manaj., Vol. 8, No. 1, pp. 10–17, 2020.

[11] O. S. Bachri and R. M. Herdian Bhakti, “Penentuan Status Stunting pada Anak dengan Menggunakan Algoritma KNN,†J. Ilm. Intech Inf. Technol. J. UMUS, vol. 3, no. 02, pp. 130–137, 2021.

[12] S. H. Rukmawan, F. R. Aszhari, Z. Rustam, and J. Pandelaki, “Cerebral Infarction Classification Using the K-Nearest Neighbor and Naive Bayes Classifier,†J. Phys. Conf. Ser., vol. 1752, no. 1, 2021.

[13] D. Kurniawan, Pengenalan Machine Learning Python. Jakarta: PT ELEX MEDIA KOMPUTINDO, 2020.

[14] J. O. Onah, S. M. Abdulhamid, M. Abdullahi, I. H. Hassan, and A. Al-Ghusham, “Genetic Algorithm based feature selection and Naïve Bayes for anomaly detection in fog computing environment,†Mach. Learn. with Appl., vol. 6, p. 100156, 2021.

[15] A. Z. Zami, O. Nurdiawan, and G. Dwilestari, “Klasifikasi Kondisi Gizi Bayi Bawah Lima Tahun Pada Posyandu Melati Dengan Menggunakan Algoritma Decision Tree,†J. Sist. Komput. Dan Inform., vol. 3, pp. 305–310, 2022.

[16] S. A. T. Al Azhima, D. Darmawan, N. F. A. Hakim, I. Kustiawan, M. Al Qibtiya, and N. S. Syafei, “Hybrid Machine Learning Model untuk Memprediksi Penyakit Jantung dengan Metode Logistic Regression dan Random Forest,†J. Teknol. Terpadu, vol. 8, no. 1, pp. 40–46, 2022.

[17] R. H. Situngkir and P. Sembiring, “Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Kesejahteraan Masyarakat Kabupaten/Kota Di Pulau Nias,†Jurnal Matematika dan Pendidikan Matematika, vol. 6, no. 1, pp. 25–31, 2023.

[18] I. B. P. Jayawiguna, “Comparison of Model Prediction for Tile Production in Tabanan Regency with Orange Data Mining Tool,†in International Journal of Engineering and Emerging Technology, vol. 5, no. 2, pp. 72–76, 2020.

[19] R. Puspita and A. Widodo, “Perbandingan Metode KNN, Decision Tree, dan Naive Bayes Terhadap Analisis Sentimen Pengguna Layanan BPJS,†J. Inform. Univ. Pamulang, vol. 5, no. 4, p. 646-654, 2021.

[20] H. Hozairi, A. Anwari, and S. Alim, “Implementasi Orange Data Mining Untuk Klasifikasi Kelulusan Mahasiswa Dengan Model K-nearest Neighbor, Decision Tree Serta Naive Bayes,†Jurnal Ilmiah NERO, vol. 6, no. 2, 2021.

Downloads

Published

2023-12-01

How to Cite

Firmansyah, A. (2023). Analisis Performa K-Nearest Neighbor, Naive Bayes, Decision Tree, dan Logistic Regression Untuk Klasifikasi Kanker Payudara Menggunakan Orange Data Mining. Prosiding Seminar Kecerdasan Artifisial, Sains Data, Dan Pendidikan Masa Depan, 1, 32–41. Retrieved from https://openjournal.unpam.ac.id/index.php/PROKASDADIK/article/view/35781