Komparasi Hasil Segmentasi Metode K-Means dan Agglomerative Hierarchical Terhadap Provinsi di indonesia Berdasarkan Profil Perjalanan Wisata Tahun 2024
DOI:
https://doi.org/10.32493/sm.v7i3.49999Keywords:
Tujuan Wisata, K-Means, Agglomerative Hierarchical Clustering, Travel DestinationAbstract
Indonesia merupakan negara dengan kekayaan alam dan budaya yang beragam sehingga memiliki potensi pariwisata yang sangat besar. Salah satu faktor penting dalam pertumbuhan sektor pariwisata adalah pergerakan wisatawan nusantara. Kegiatan wisata yang dilakukan oleh wisatawan nusantara memiliki berbagai tujuan, seperti liburan, kunjungan keluarga, keagamaan, maupun urusan pekerjaan. Keanekaragaman tersebut mencerminkan adanya perbedaan karakteristik lokasi wisata di setiap provinsi sehingga diperlukan analisis lebih lanjut untuk mengelompokkan provinsi berdasarkan profil perjalanan wisata. Penelitian ini bertujuan untuk membandingkan hasil segmentasi menggunakan metode K-Means dan Agglomerative Hierarchical Clustering (AHC) terhadap provinsi di Indonesia berdasarkan data perjalanan wisata tahun 2024 yang bersumber dari Badan Pusat Statistik (BPS). Evaluasi hasil cluster dengan metode K-Means menunjukkan terbentuknya 3 cluster dengan Silhouette Score sebesar 0,662. Sedangkan, dengan metode Agglomerative Hierarchical Clustering (AHC) terbentuk 3 cluster yang memiliki nilai Silhouette Score sebesar 0,9535 menggunakan pemilihan jarak average linkage. Hal tersebut menunjukkan bahwa objek atau data sudah berada pada cluster yang sesuai. Indonesia is a country with diverse natural and cultural resources, giving it enormous tourism potential. One important factor in the growth of the tourism sector is the movement of domestic tourists. Domestic tourists engage in various types of tourism activities, such as vacations, family visits, religious pilgrimages, and business trips. This diversity reflects the differing characteristics of tourist destinations across provinces, necessitating further analysis to group provinces based on travel profiles. This study aims to compare the results of segmentation using the K-Means method and Agglomerative Hierarchical Clustering (AHC) for provinces in Indonesia based on 2024 travel data sourced from the Central Statistics Agency (BPS). The evaluation of the cluster results using the K-Means method shows the formation of 3 clusters with a Silhouette Score of 0.662. Meanwhile, using the Agglomerative Hierarchical Clustering (AHC) method, 3 clusters were formed with a Silhouette Score of 0.9535 using the average linkage distance selection. This indicates that the objects or data are already in the appropriate clusters.
References
1. Wijaya A, Fasa H, Berliandaldo M, Andriani D, Prasetio A, Strategis BK, Film G, Indonesia P. Implikasi Penerapan Kebijakan Golden Visa dalam Rangka Mendorong Pengembangan Investasi pada Sektor Pariwisata. Jurnal Kepariwisataan [Internet]. 2023;22(2):159–175. https://doi.org/10.52352/jpar.v22i2.1117
2. Prayitno ARD, Purwantoro A, Astuti NW, Haryanto T. Analisis Produktivitas Pariwisata: Studi Kasus pada Beberapa Negara berdasarkan Perbedaan Karakter Wilayah. Jurnal Pendidikan Ekonomi (JUPE) [Internet]. 2023;11(3):304–312. https://doi.org/10.26740/jupe.v11n3.p304-312
3. Aprilia K, Sembiring F. Analisis Garis Kemiskinan Makanan Menggunakan Metode Algoritma K-Means Clustering. Seminar Nasional Sistem Informasi dan Manajemen Informatika (SISMATIK). 2021;1:1–10.
4. Nugroho MR, Hendrawan IE, Purwantoro. Penerapan Algoritma K-Means Untuk Klasterisasi Data Bbat pada Rumah Sakit ASRI. Jurnal Nuansa Informatika [Internet]. 2022;16(1):125–133. https://doi.org/10.25134/nuansa.v16i1.5294
5. Murtagh F, Contreras P. Hierarchical clustering: A survey. Wiley Interdiscip Rev Data Min Knowl Discov. 2020;10(1):e1254. doi:10.1002/widm.1254
6. Fitrayana, P., & Saputro, D. Algoritma Clustering Large Application (CLARA) untuk Menangani Data Outlier. PRISMA, Prosiding Seminar Nasional Matematika [internet]. 2022;5;721-725.
7. Sihombing PR, Suryadiningrat S, Sunarjo DA, Yuda YP. Identifikasi Data Outlier (Pencilan) dan Kenormalan Data Pada Data Univariat serta Alternatif Penyelesaiannya. Berdikari: Jurnal Ekonomi Dan Statistik Indonesia [Internet] 2023;2(3);307-316. https://doi.org/10.11594/jesi.02.03.07
8. Saputri NA. Pengaruh Media Exposure, Profitabilitas Dan Ukuran Perusahaan Terhadap Carbon Emission Disclosure. Jurnal Ilmu dan Riset Akuntansi [Internet]. 2023;12(8).
9. Allorerung, P. P., Erna, A., Bagussahrir, M., & Alam, S. Analisis Performa Normalisasi Data untuk Klasifikasi K-Nearest Neighbor pada Dataset Penyakit. JISKA (Jurnal Informatika Sunan Kalijaga) [Internet. 2024;9(3);178–191. https://doi.org/10.14421/jiska.2024.9.3.178-191
10. Nazori S, Rendra G, & Destria, A. Klasifikasi Penyakit TBC Menggunakan Metode UMAP dan K-NN. Bit-Tech [Internet] 2025;7(3);843–852. https://doi.org/10.32877/bt.v7i3.2227
11. Sulistiyawati A & Supriyanto E. Implementasi Algoritma K-Means Clustering dalam Penentuan Siswa Kelas Unggulan. Jurnal Tekno Kompak [Internet]. 2021;15(2);25-36.
12. Pribadi WW, Yunus A, Wiguna AS. Perbandingan Metode K-Means Euclidean Distance Dan Manhattan Distance Pada Penentuan Zonasi Covid-19 Di Kabupaten Malang. JATI (Jurnal Mahasiswa Teknik Informatika) [Internet] 2022;6(2);493-500. https://doi.org/10.36040/jati.v6i2.4808
13. Supardi R & Kanedi I. Implementasi Metode Algoritma K-Means Clustering Pada Toko Eidelweis. Jurnal Teknologi Informasi [Internet]. 2020;4(2);270-277
14. Harani NH, Prianto C, Nugraha FA. Segmentasi Pelanggan Produk Digital Service Indihome Menggunakan Algoritma K-Means Berbasis Python. Jurnal Manajemen Informatika (JAMIKA) [Internet]. 2022;10;2;133-146. https://doi.org/10.34010/jamika.v10i2.2683
15. Riani AP, Voutama A, Ridwan T. Penerapan K-Means Clustering Dalam Pengelompokan Hasil Belajar Peserta Didik Dengan Metode Elbow. Jurnal Teknologi Sistem Informasi dan Sistem Komputer TGD [Internet]. 2023;6(1);164-172. https://doi.org/10.53513/jsk.v6i1.7351
16. Nellie V, Mawardi VC, Perdana NJ. IMPLEMENTASI METODE AGGLOMERATIVE HIERARCHICAL CLUSTERING UNTUK SISTEM REKOMENDASI FILM. Jurnal Ilmu Komputer dan Sistem Informasi [Internet].
17. Matdoan, M. Y., & Noya Van Delsen, M. S. Penerapan Analisis Cluster Dengan Metode Hierarki Untuk Klasifikasi Kabupaten/Kota Di Provinsi Maluku Berdasarkan Indikator Indeks Pembangunan Manusia. Statmat : Jurnal Statistika Dan Matematika [Internet] 2020;2(2);123–130. https://doi.org/10.32493/sm.v2i2.4740
18. Drl, I. R., Chrisnanto, Y. H., & Umbara, F. R. Analisis Cluster Pada Kelompok Masyarakat Yang Rentan Terhadap Paparan Covid-19 Menggunakan Metode K-Means Clustering Dan Visualisasi Dengan Sig. Informatics and Digital Expert (INDEX) [Internet] 2024;4(2);61–69. https://doi.org/10.36423/index.v4i2.885
19. Nurhaliza S & Mukhti TO. Clustering Regions in West Sumatera Based on the Special Protection Index for Children Using K-Means Clustering with Silhouette Coefficient . UNP Journal of Statistics and Data Science [Internet] 2025;3(1);123–129. https://doi.org/10.24036/ujsds/vol3-iss1/356
20. Fauziah, & Basir, C. (2024). Analisis Klaster dengan Metode K-Means Berdasarkan Usia Warga yang Divaksin Covid-19 di Kelurahan Grogol Selatan. Jurnal Bayesian: Jurnal Ilmiah Statistika dan Ekonometrika, 4(1), 53-62. https://bayesian.lppmbinabangsa.id/index.php/home/article/view/76
21. Permata Sari, Y., & Basir, C. (2025). Analisis Klaster dengan Metode K-Means pada Persebaran Kasus Covid-19 Berdasarkan Desa di Kecamatan Kemang-Bogor. Pelita : Jurnal Penelitian Dan Karya Ilmiah, 24(2), 33–45. https://doi.org/10.33592/pelita.v24i2.5504
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Ni Luh Ayu Nariswari Dewi

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
As an Author, you have the right to a variety of uses for your article, including institutions or companies. The author's rights might do without the need for special permission.
Authors who publish in the Jurnal Jurnal Statistika dan Matematika (Statmat) have broad rights to use their works for education and scientific purposes without permission, including:
Used to discuss in a class by the author or the author's body and presentations at meetings or conferences and participant approval;
Used for internal training by the author's company;
Distribution to colleagues for the use of their research;
Used in preparation for further author's works;
Included in a thesis or dissertation;
Partial or extra reuse of articles in other works (with full acknowledgment of the last item);
Prepare derivatives (other than for commercial purposes);
Post voluntarily on a website opened by the author or approve the author for scientific purposes (follow CC with a SA License).
