Analisis Performa K-Nearest Neighbor, Naive Bayes, Decision Tree, dan Logistic Regression Untuk Klasifikasi Kanker Payudara Menggunakan Orange Data Mining
Keywords:
K-Nearest Neighbor (K-NN), Naive Bayes, Decision Tree, Logistic Regression, Kanker PayudaraAbstract
Kanker payudara merupakan jenis kanker yang sering muncul di dalam sel-sel payudara, dan pertumbuhan sel kanker tersebut seringkali sulit untuk dikendalikan. Di Indonesia, kanker payudara menjadi kasus kanker yang paling umum, dan juga salah satu penyebab utama kematian. Oleh karena itu, sangat penting untuk mengklasifikasikan pasien yang menderita kanker payudara dan orang yang sehat sebagai langkah awal dalam mendeteksi penyakit ini lebih awal, yang dapat meningkatkan peluang kesembuhan pasien. Dalam penelitian ini, dilakukan evaluasi terhadap empat algoritma klasifikasi yang umum digunakan, yaitu K-Nearest Neighbor (K-NN), Naive Bayes, Decision Tree, dan Logistic Regression, untuk mengklasifikasikan kanker payudara. Menggunakan perangkat lunak Orange Data Mining sebagai alat utama dalam implementasi dan percobaan. Data yang digunakan dalam penelitian ini berasal dari Breast Cancer Coimbra dari UCI Machine Learning Repository. Tujuan dari penelitian ini adalah untuk membandingkan kinerja masing-masing algoritma klasifikasi dalam pengenalan kanker payudara dan mengevaluasi tingkat akurasi mereka. Hasil eksperimen menunjukkan bahwa tiap algoritma memiliki keunggulan dan kelemahan tersendiri dalam hal akurasi, sensitivitas, dan spesifisitas. Analisis kinerja ini akan memberikan panduan yang berharga dalam pemilihan algoritma klasifikasi yang paling sesuai untuk tugas mengklasifikasikan kanker payudara.References
[1] S. Nurwenda, “Deteksi Dini Kanker: Mengapa dan Bagaimana?,†Direktorat Jenderal Pelayanan Kesehatan Kemenkes RI, 2022. https://yankes.kemkes.go.id/view_artikel/173/deteksi-dini-kanker-mengapa-dan-bagaimana (accessed Oct. 25, 2023).
[2] C. M. Annur, “Kanker Payudara, Penyakit Kanker Paling Banyak Dialami Masyarakat Indonesia,†databoks.katadata.co.id, 2022. https://databoks.katadata.co.id/datapublish/2022/10/11/kanker-payudara-penyakit-kanker-paling-banyak-dialami-masyarakat-indonesia (accessed Oct. 25, 2023).
[3] R. Fadli, “Kanker Payudara,†halodoc.com, 2022. https://www.halodoc.com/kesehatan/kanker-payudara (accessed Oct. 25, 2023).
[4] Pittara, “Kanker Payudara,†alodokter.com, 2023. https://www.alodokter.com/kanker-payudara (accessed Oct. 30, 2023).
[5] H. K. Nurwigati Sumartiningtyas, “Kanker Payudara Paling Banyak Didiagnosis di Dunia, Studi Jelaskan,†kompas.com, 2021. https://www.kompas.com/sains/read/2021/02/05/192600023/kanker-payudara-paling-banyakdidiagnosis-di-dunia-studi-jelaskan (accessed Oct. 30, 2023).
[6] D. Andriani, “Ini Jenis Kanker yang Paling Banyak Diderita Masyarakat Indonesia,†lifestyle.bisnis.com, 2020. https://lifestyle.bisnis.com/read/20200225/106/1205840/ini-jenis-kanker-yang-paling-banyak-diderita-masyarakat-indonesia (accessed Oct. 30, 2023).
[7] N. Wardani, “Penerapan Data Mining Dalam Analytic CRM,†Yayasan Kita Menulis. pp. 47–48, 2020.
[8] R. Ordila, R. Wahyuni, Y. Irawan, and M. Y. Sari, “Penerapan Data Mining Untuk Pengelompokan Data Rekam Medis Pasien Berdasarkan Jenis Penyakit Dengan Algoritma Clustering …,†J. Ilmu Komput., vol. 9, no. 2, pp. 148–153, 2020.
[9] Sukamto, Y. Adriyani, and R. Aulia, “Prediksi Kelompok UKT Mahasiswa Menggunakan Algoritma K-Nearest Neighbor,†JUITA J. Inform., vol. 8, no. 1, p. 121, 2020.
[10] R. Sari, “Analisis Sentimen pada Review Objek Wisata Dunia Fantasi Menggunakan Algoritma K-Nearest Neighbor (K-NN),†Evolusi J. Sains dan Manaj., Vol. 8, No. 1, pp. 10–17, 2020.
[11] O. S. Bachri and R. M. Herdian Bhakti, “Penentuan Status Stunting pada Anak dengan Menggunakan Algoritma KNN,†J. Ilm. Intech Inf. Technol. J. UMUS, vol. 3, no. 02, pp. 130–137, 2021.
[12] S. H. Rukmawan, F. R. Aszhari, Z. Rustam, and J. Pandelaki, “Cerebral Infarction Classification Using the K-Nearest Neighbor and Naive Bayes Classifier,†J. Phys. Conf. Ser., vol. 1752, no. 1, 2021.
[13] D. Kurniawan, Pengenalan Machine Learning Python. Jakarta: PT ELEX MEDIA KOMPUTINDO, 2020.
[14] J. O. Onah, S. M. Abdulhamid, M. Abdullahi, I. H. Hassan, and A. Al-Ghusham, “Genetic Algorithm based feature selection and Naïve Bayes for anomaly detection in fog computing environment,†Mach. Learn. with Appl., vol. 6, p. 100156, 2021.
[15] A. Z. Zami, O. Nurdiawan, and G. Dwilestari, “Klasifikasi Kondisi Gizi Bayi Bawah Lima Tahun Pada Posyandu Melati Dengan Menggunakan Algoritma Decision Tree,†J. Sist. Komput. Dan Inform., vol. 3, pp. 305–310, 2022.
[16] S. A. T. Al Azhima, D. Darmawan, N. F. A. Hakim, I. Kustiawan, M. Al Qibtiya, and N. S. Syafei, “Hybrid Machine Learning Model untuk Memprediksi Penyakit Jantung dengan Metode Logistic Regression dan Random Forest,†J. Teknol. Terpadu, vol. 8, no. 1, pp. 40–46, 2022.
[17] R. H. Situngkir and P. Sembiring, “Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Kesejahteraan Masyarakat Kabupaten/Kota Di Pulau Nias,†Jurnal Matematika dan Pendidikan Matematika, vol. 6, no. 1, pp. 25–31, 2023.
[18] I. B. P. Jayawiguna, “Comparison of Model Prediction for Tile Production in Tabanan Regency with Orange Data Mining Tool,†in International Journal of Engineering and Emerging Technology, vol. 5, no. 2, pp. 72–76, 2020.
[19] R. Puspita and A. Widodo, “Perbandingan Metode KNN, Decision Tree, dan Naive Bayes Terhadap Analisis Sentimen Pengguna Layanan BPJS,†J. Inform. Univ. Pamulang, vol. 5, no. 4, p. 646-654, 2021.
[20] H. Hozairi, A. Anwari, and S. Alim, “Implementasi Orange Data Mining Untuk Klasifikasi Kelulusan Mahasiswa Dengan Model K-nearest Neighbor, Decision Tree Serta Naive Bayes,†Jurnal Ilmiah NERO, vol. 6, no. 2, 2021.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Angga Firmansyah
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.