ANALISIS KOMPARATIF ALGORITMA DECISION TREE DAN RANDOM FOREST UNTUK KLASIFIKASI PENJUALAN PRODUK PADA DATASET SUPERSTORE

Authors

  • Rezza Debby Kurniawan Universitas Cenderawasih
  • Dian Natasia Dewanti Sukarman Universitas Cenderawasih
  • Kartini Wika Rumaropen Universitas Cenderawasih
  • Caecilia Bintang Girik Allo Universitas Cenderawasih

Keywords:

Decision Tree, Random Forest, Klasifikasi, Penjualan Produk, Machine Learning

Abstract

Penelitian ini bertujuan untuk membandingkan kinerja dua algoritma klasifikasi machine learning, yaitu Decision Tree dan Random Forest, dalam mengklasifikasikan produk berdasarkan data penjualan pada dataset Sample Superstore. Tujuan klasifikasi adalah untuk mengelompokkan produk ke dalam dua kategori, yaitu “laris” dan “tidak laris”, berdasarkan perbandingan antara nilai Quantity dengan nilai rata-rata dataset. Penelitian diawali dengan tahapan pra-pemrosesan seperti penghapusan data duplikat, pengolahan variabel kategorikal dengan label encoding, standardisasi fitur numerik, dan pembentukan variabel target biner. Model klasifikasi dilatih dan dievaluasi menggunakan confusion matrix serta metrik performa seperti akurasi, precision, recall, dan F1-score. Tuning parameter dilakukan pada kedua model menggunakan GridSearchCV dengan validasi silang lima lipat. Hasil evaluasi menunjukkan bahwa algoritma Decision Tree memperoleh akurasi tertinggi sebesar 73,1%, sedikit lebih baik dibandingkan Random Forest yang mencapai akurasi 72,7% setelah dilakukan tuning. Meskipun Random Forest dikenal sebagai algoritma ensemble yang lebih stabil, pada kasus ini performanya tidak menunjukkan peningkatan signifikan. Temuan ini memperkuat pentingnya pemilihan algoritma yang disesuaikan dengan karakteristik dan struktur data.

References

1. Calistus, R. 2022. Superstore [Dataset]. Kaggle. https://www.kaggle.com/datasets/roopacalistus/superstore/code

2. Eska, J. 2016. Penerapan Data Mining untuk Prediksi Penjualan Wallpaper Menggunakan Algoritma C4.5. JURTEKSI (Jurnal Teknologi dan Sistem Informasi), 2(2), 9–13.

3. Fadli, M., & Saputra, R. A. 2023. Klasifikasi dan Evaluasi Performa Model Random Forest untuk Prediksi Stroke. Jurnal Teknik, 12(2), 72–80.

4. Firnanda, P. A., Shofwatillah, L., Rahma, F., & Fauzi, F. 2023. Analisis Perbandingan Decision Tree dan Random Forest dalam Klasifikasi Penjualan Produk pada Supermarket. Emerging Statistics and Data Science Journal, 3(1), 45–54.

5. Sinambela, D. P., Naparin, H., Zulfadhilah, M., & Hidayah, N. 2022. Implementasi Algoritma Decision Tree dan Random Forest dalam Prediksi Perdarahan Pascasalin. Jurnal Informasi dan Teknologi, 5(3), 58–64.

6. Sun, Y., Zhang, H., Zhao, T., Zou, Z., Shen, B., & Yang, L. 2020. A New Convolutional Neural Network With Random Forest Method for Hydrogen Sensor Fault Diagnosis. INFOTEK Mesin, 16(1), 127–134.

Downloads

Published

2025-08-31

How to Cite

Kurniawan, R. D., Sukarman, D. N. D., Rumaropen, K. W., & Allo, C. B. G. (2025). ANALISIS KOMPARATIF ALGORITMA DECISION TREE DAN RANDOM FOREST UNTUK KLASIFIKASI PENJUALAN PRODUK PADA DATASET SUPERSTORE. STATMAT : JURNAL STATISTIKA DAN MATEMATIKA, 7(2), 94–103. Retrieved from https://openjournal.unpam.ac.id/index.php/sm/article/view/48856

Issue

Section

Articles