ANALISIS KOMPARATIF ALGORITMA DECISION TREE DAN RANDOM FOREST UNTUK KLASIFIKASI PENJUALAN PRODUK PADA DATASET SUPERSTORE
Keywords:
Decision Tree, Random Forest, Klasifikasi, Penjualan Produk, Machine LearningAbstract
Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma klasifikasi machine learning, yaitu Decision Tree dan Random Forest, dalam mengklasifikasikan produk berdasarkan data penjualan pada dataset Sample Superstore. Tujuan klasifikasi adalah untuk mengelompokkan produk ke dalam dua kategori, yaitu “laris” dan “tidak laris”, berdasarkan perbandingan antara nilai Quantity dengan nilai rata-rata dataset. Penelitian diawali dengan tahapan pra-pemrosesan seperti penghapusan data duplikat, pengolahan variabel kategorikal dengan label encoding, standardisasi fitur numerik, dan pembentukan variabel target biner. Model klasifikasi dilatih dan dievaluasi menggunakan confusion matrix serta metrik performa seperti akurasi, precision, recall, dan F1-score. Tuning parameter dilakukan pada kedua model menggunakan GridSearchCV dengan validasi silang lima lipat. Hasil evaluasi menunjukkan bahwa algoritma Decision Tree memperoleh akurasi tertinggi sebesar 73,1%, sedikit lebih baik dibandingkan Random Forest yang mencapai akurasi 72,7% setelah dilakukan tuning. Meskipun Random Forest dikenal sebagai algoritma ensemble yang lebih stabil, pada kasus ini performanya tidak menunjukkan peningkatan signifikan. Temuan ini memperkuat pentingnya pemilihan algoritma yang disesuaikan dengan karakteristik dan struktur data.
References
1. Calistus, R. 2022. Superstore [Dataset]. Kaggle. https://www.kaggle.com/datasets/roopacalistus/superstore/code
2. Eska, J. 2016. Penerapan Data Mining untuk Prediksi Penjualan Wallpaper Menggunakan Algoritma C4.5. JURTEKSI (Jurnal Teknologi dan Sistem Informasi), 2(2), 9–13.
3. Fadli, M., & Saputra, R. A. 2023. Klasifikasi dan Evaluasi Performa Model Random Forest untuk Prediksi Stroke. Jurnal Teknik, 12(2), 72–80.
4. Firnanda, P. A., Shofwatillah, L., Rahma, F., & Fauzi, F. 2023. Analisis Perbandingan Decision Tree dan Random Forest dalam Klasifikasi Penjualan Produk pada Supermarket. Emerging Statistics and Data Science Journal, 3(1), 45–54.
5. Sinambela, D. P., Naparin, H., Zulfadhilah, M., & Hidayah, N. 2022. Implementasi Algoritma Decision Tree dan Random Forest dalam Prediksi Perdarahan Pascasalin. Jurnal Informasi dan Teknologi, 5(3), 58–64.
6. Sun, Y., Zhang, H., Zhao, T., Zou, Z., Shen, B., & Yang, L. 2020. A New Convolutional Neural Network With Random Forest Method for Hydrogen Sensor Fault Diagnosis. INFOTEK Mesin, 16(1), 127–134.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Rezza Debby Kurniawan, Dian Natasia Dewanti Sukarman, Kartini Wika Rumaropen, Caecilia Bintang Girik Allo

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
As an Author, you have the right to a variety of uses for your article, including institutions or companies. The author's rights might do without the need for special permission.
Authors who publish in the Jurnal Jurnal Statistika dan Matematika (Statmat) have broad rights to use their works for education and scientific purposes without permission, including:
Used to discuss in a class by the author or the author's body and presentations at meetings or conferences and participant approval;
Used for internal training by the author's company;
Distribution to colleagues for the use of their research;
Used in preparation for further author's works;
Included in a thesis or dissertation;
Partial or extra reuse of articles in other works (with full acknowledgment of the last item);
Prepare derivatives (other than for commercial purposes);
Post voluntarily on a website opened by the author or approve the author for scientific purposes (follow CC with a SA License).
