Komparasi Hasil Segmentasi Metode K-Means dan Agglomerative Hierarchical Terhadap Provinsi di indonesia Berdasarkan Profil Perjalanan Wisata Tahun 2024

Authors

  • Ni Luh Ayu Nariswari Dewi UPN Veteran Jawa Timur
  • Azizah Zalfa Assyadida UPN Veteran Jawa Timur
  • Steffany Marcellia Witanto UPN Veteran Jawa Timur
  • Muhammad Nasrudin UPN Veteran Jawa Timur
  • Kartika Maulida Hindrayani UPN Veteran Jawa Timur

DOI:

https://doi.org/10.32493/sm.v7i3.49999

Keywords:

Tujuan Wisata, K-Means, Agglomerative Hierarchical Clustering, Travel Destination

Abstract

Indonesia merupakan negara dengan kekayaan alam dan budaya yang beragam sehingga memiliki potensi pariwisata yang sangat besar. Salah satu faktor penting dalam pertumbuhan sektor pariwisata adalah pergerakan wisatawan nusantara. Kegiatan wisata yang dilakukan oleh wisatawan nusantara memiliki berbagai tujuan, seperti liburan, kunjungan keluarga, keagamaan, maupun urusan pekerjaan. Keanekaragaman tersebut mencerminkan adanya perbedaan karakteristik lokasi wisata di setiap provinsi sehingga diperlukan analisis lebih lanjut untuk mengelompokkan provinsi berdasarkan profil perjalanan wisata. Penelitian ini bertujuan untuk membandingkan hasil segmentasi menggunakan metode K-Means dan Agglomerative Hierarchical Clustering (AHC) terhadap provinsi di Indonesia berdasarkan data perjalanan wisata tahun 2024 yang bersumber dari Badan Pusat Statistik (BPS). Evaluasi hasil cluster dengan metode K-Means menunjukkan terbentuknya 3 cluster dengan Silhouette Score sebesar 0,662. Sedangkan, dengan metode Agglomerative Hierarchical Clustering (AHC) terbentuk 3 cluster yang memiliki nilai Silhouette Score sebesar 0,9535 menggunakan pemilihan jarak average linkage. Hal tersebut menunjukkan bahwa objek atau data sudah berada pada cluster yang sesuai. Indonesia is a country with diverse natural and cultural resources, giving it enormous tourism potential. One important factor in the growth of the tourism sector is the movement of domestic tourists. Domestic tourists engage in various types of tourism activities, such as vacations, family visits, religious pilgrimages, and business trips. This diversity reflects the differing characteristics of tourist destinations across provinces, necessitating further analysis to group provinces based on travel profiles. This study aims to compare the results of segmentation using the K-Means method and Agglomerative Hierarchical Clustering (AHC) for provinces in Indonesia based on 2024 travel data sourced from the Central Statistics Agency (BPS). The evaluation of the cluster results using the K-Means method shows the formation of 3 clusters with a Silhouette Score of 0.662. Meanwhile, using the Agglomerative Hierarchical Clustering (AHC) method, 3 clusters were formed with a Silhouette Score of 0.9535 using the average linkage distance selection. This indicates that the objects or data are already in the appropriate clusters.

References

1. Wijaya A, Fasa H, Berliandaldo M, Andriani D, Prasetio A, Strategis BK, Film G, Indonesia P. Implikasi Penerapan Kebijakan Golden Visa dalam Rangka Mendorong Pengembangan Investasi pada Sektor Pariwisata. Jurnal Kepariwisataan [Internet]. 2023;22(2):159–175. https://doi.org/10.52352/jpar.v22i2.1117

2. Prayitno ARD, Purwantoro A, Astuti NW, Haryanto T. Analisis Produktivitas Pariwisata: Studi Kasus pada Beberapa Negara berdasarkan Perbedaan Karakter Wilayah. Jurnal Pendidikan Ekonomi (JUPE) [Internet]. 2023;11(3):304–312. https://doi.org/10.26740/jupe.v11n3.p304-312

3. Aprilia K, Sembiring F. Analisis Garis Kemiskinan Makanan Menggunakan Metode Algoritma K-Means Clustering. Seminar Nasional Sistem Informasi dan Manajemen Informatika (SISMATIK). 2021;1:1–10.

4. Nugroho MR, Hendrawan IE, Purwantoro. Penerapan Algoritma K-Means Untuk Klasterisasi Data Bbat pada Rumah Sakit ASRI. Jurnal Nuansa Informatika [Internet]. 2022;16(1):125–133. https://doi.org/10.25134/nuansa.v16i1.5294

5. Murtagh F, Contreras P. Hierarchical clustering: A survey. Wiley Interdiscip Rev Data Min Knowl Discov. 2020;10(1):e1254. doi:10.1002/widm.1254

6. Fitrayana, P., & Saputro, D. Algoritma Clustering Large Application (CLARA) untuk Menangani Data Outlier. PRISMA, Prosiding Seminar Nasional Matematika [internet]. 2022;5;721-725.

7. Sihombing PR, Suryadiningrat S, Sunarjo DA, Yuda YP. Identifikasi Data Outlier (Pencilan) dan Kenormalan Data Pada Data Univariat serta Alternatif Penyelesaiannya. Berdikari: Jurnal Ekonomi Dan Statistik Indonesia [Internet] 2023;2(3);307-316. https://doi.org/10.11594/jesi.02.03.07

8. Saputri NA. Pengaruh Media Exposure, Profitabilitas Dan Ukuran Perusahaan Terhadap Carbon Emission Disclosure. Jurnal Ilmu dan Riset Akuntansi [Internet]. 2023;12(8).

9. Allorerung, P. P., Erna, A., Bagussahrir, M., & Alam, S. Analisis Performa Normalisasi Data untuk Klasifikasi K-Nearest Neighbor pada Dataset Penyakit. JISKA (Jurnal Informatika Sunan Kalijaga) [Internet. 2024;9(3);178–191. https://doi.org/10.14421/jiska.2024.9.3.178-191

10. Nazori S, Rendra G, & Destria, A. Klasifikasi Penyakit TBC Menggunakan Metode UMAP dan K-NN. Bit-Tech [Internet] 2025;7(3);843–852. https://doi.org/10.32877/bt.v7i3.2227

11. Sulistiyawati A & Supriyanto E. Implementasi Algoritma K-Means Clustering dalam Penentuan Siswa Kelas Unggulan. Jurnal Tekno Kompak [Internet]. 2021;15(2);25-36.

12. Pribadi WW, Yunus A, Wiguna AS. Perbandingan Metode K-Means Euclidean Distance Dan Manhattan Distance Pada Penentuan Zonasi Covid-19 Di Kabupaten Malang. JATI (Jurnal Mahasiswa Teknik Informatika) [Internet] 2022;6(2);493-500. https://doi.org/10.36040/jati.v6i2.4808

13. Supardi R & Kanedi I. Implementasi Metode Algoritma K-Means Clustering Pada Toko Eidelweis. Jurnal Teknologi Informasi [Internet]. 2020;4(2);270-277

14. Harani NH, Prianto C, Nugraha FA. Segmentasi Pelanggan Produk Digital Service Indihome Menggunakan Algoritma K-Means Berbasis Python. Jurnal Manajemen Informatika (JAMIKA) [Internet]. 2022;10;2;133-146. https://doi.org/10.34010/jamika.v10i2.2683

15. Riani AP, Voutama A, Ridwan T. Penerapan K-Means Clustering Dalam Pengelompokan Hasil Belajar Peserta Didik Dengan Metode Elbow. Jurnal Teknologi Sistem Informasi dan Sistem Komputer TGD [Internet]. 2023;6(1);164-172. https://doi.org/10.53513/jsk.v6i1.7351

16. Nellie V, Mawardi VC, Perdana NJ. IMPLEMENTASI METODE AGGLOMERATIVE HIERARCHICAL CLUSTERING UNTUK SISTEM REKOMENDASI FILM. Jurnal Ilmu Komputer dan Sistem Informasi [Internet].

17. Matdoan, M. Y., & Noya Van Delsen, M. S. Penerapan Analisis Cluster Dengan Metode Hierarki Untuk Klasifikasi Kabupaten/Kota Di Provinsi Maluku Berdasarkan Indikator Indeks Pembangunan Manusia. Statmat : Jurnal Statistika Dan Matematika [Internet] 2020;2(2);123–130. https://doi.org/10.32493/sm.v2i2.4740

18. Drl, I. R., Chrisnanto, Y. H., & Umbara, F. R. Analisis Cluster Pada Kelompok Masyarakat Yang Rentan Terhadap Paparan Covid-19 Menggunakan Metode K-Means Clustering Dan Visualisasi Dengan Sig. Informatics and Digital Expert (INDEX) [Internet] 2024;4(2);61–69. https://doi.org/10.36423/index.v4i2.885

19. Nurhaliza S & Mukhti TO. Clustering Regions in West Sumatera Based on the Special Protection Index for Children Using K-Means Clustering with Silhouette Coefficient . UNP Journal of Statistics and Data Science [Internet] 2025;3(1);123–129. https://doi.org/10.24036/ujsds/vol3-iss1/356

20. Fauziah, & Basir, C. (2024). Analisis Klaster dengan Metode K-Means Berdasarkan Usia Warga yang Divaksin Covid-19 di Kelurahan Grogol Selatan. Jurnal Bayesian: Jurnal Ilmiah Statistika dan Ekonometrika, 4(1), 53-62. https://bayesian.lppmbinabangsa.id/index.php/home/article/view/76

21. Permata Sari, Y., & Basir, C. (2025). Analisis Klaster dengan Metode K-Means pada Persebaran Kasus Covid-19 Berdasarkan Desa di Kecamatan Kemang-Bogor. Pelita : Jurnal Penelitian Dan Karya Ilmiah, 24(2), 33–45. https://doi.org/10.33592/pelita.v24i2.5504

Downloads

Published

2025-12-31

How to Cite

Ni Luh Ayu Nariswari Dewi, Azizah Zalfa Assyadida, Steffany Marcellia Witanto, Muhammad Nasrudin, & Kartika Maulida Hindrayani. (2025). Komparasi Hasil Segmentasi Metode K-Means dan Agglomerative Hierarchical Terhadap Provinsi di indonesia Berdasarkan Profil Perjalanan Wisata Tahun 2024. STATMAT: Jurnal Statistika Dan Matematika, 7(3), 482 – 502. https://doi.org/10.32493/sm.v7i3.49999

Issue

Section

Articles