Pemodelan Topik Pada Dakwaan Tindak Pidana Pencurian Di Pengadilan Negeri Serang Menggunakan Latent Dirichlet Allocation

Authors

  • Aldho Meidy Tri Putra Program Studi Teknik Informatika S-2, Universitas Pamulang
  • Sajarwo Anggai Program Studi Teknik Informatika S-2, Universitas Pamulang
  • Taswanda Taryo Program Studi Teknik Informatika S-2, Universitas Pamulang

Keywords:

Pemodelan Topik, Tindak Pidana Pencurian, LDA, N-Gram, TF-IDF, Word2Vec

Abstract

Penelitian oleh [1] yang melakukan pemodelan topik terkait tindak pidana umum menghasilkan nilai koheren terbaik sebesar 0.65895 pada topik ke -4 dengan dataset berupa amar putusan hakim. Berbeda dengan penelitian tersebut, penelitian ini melakukan pemodelan topik terkait tindak pidana pencurian dengan dataset berupa teks dakwaan yang terkandung didalam dokumen putusan hakim. Metode pemodelan topik yang digunakan adalah LDA dengan pembobotan kata TF-IDF. Pada penelitian ini dilakukan ekstraksi fitur menggunakan algoritma N-Grams untuk minimal kata muncul sebanyak 3 dan 5 kata berjenis bigrams dan trigrams, dan dilakukan evaluasi dengan mencari nilai koheren dan perplexity optimal pada rentang 2 hingga 10 topik. Interpretasi topik dilakukan dengan menggunakan bantuan algoritma Word2Vec untuk mencari kata-kata yang mirip dengan kata penyusun suatu topik. Dari percobaan yang telah dilakukan, didapatkan hasil terbaik pada pemodelan tanpa ekstraksi fitur N-Grams dengan nilai koheren sebesar 0.619 untuk 8 topik. Nilai koheren yang didapatkan cukup baik, dan kata-kata yang dihasilkan dapat dengan mudah diinterpretasikan menjadi suatu topik tertentu. Nilai perplexity yang dihasilkan cenderung menunjukan nilai yang terus menurun dari 2 hingga 10 topik yang menandakan bahwa model cukup baik dalam memprediksi suatu data baru. Diharapkan dari penelitian ini dapat dilakukan pengembangan pada kategori tindak pidana yang lebih luas lagi.

References

[1] F. D. Nisrina, “Implementasi Deteksi Topik Putusan Hakim Dengan Latent Dirichlet Allocation (LDA),” pp. 1–64, 2020, [Online]. Available: https://dspace.uii.ac.id/handle/123456789/23847

[2] R. Indonesia, “Kitab Undang-Undang Hukum Acara Pidana (KUHAP) No. 8 Tahun 1981,” Kuhap, p. 871, 1981.

[3] A. H. Dani, E. Y. Puspaningrum, and R. Mumpuni, “Studi Performa TF-IDF dan Word2Vec Pada Analisis Sentimen Cyberbullying,” Router J. Tek. Inform. dan Terap., vol. 2, no. 2, pp. 94–106, 2024, [Online]. Available: https://doi.org/10.62951/router.v2i2.76

[4] G. H. A. R. Noer, “Implementasi Algoritma Naïve Bayes dan TF-IDF Dalam Analisis Sentimen Data Ulasan (Studi Kasus: Ulasan Review Aplikasi E-commerce Shopee di Situs Google …,” UIN Syarif Hidayatullah Jakarta, 2023. [Online]. Available: https://repository.uinjkt.ac.id/dspace/handle/123456789/68747%0Ahttps://repository.uinjkt.ac.id/dspace/bitstream/12345 6789/68747/1/GERALD HALIM AL RASYID NOER-FST.pdf

[5] R. P. F. Afidh and Syahrial, “Pemodelan Topik Menggunakan n-Gram dan Non-negative Matrix Factorization,” J. Inf. dan Teknol., vol. 5, no. 1, pp. 265–275, 2023, doi: 10.60083/jidt.v5i1.385.

[6] R. Nurhidayat and K. E. Dewi, “Penerapan Algoritma K-Nearest Neighbor Dan Fitur Ekstraksi N-Gram Dalam Analisis Sentimen Berbasis Aspek,” Komputa J. Ilm. Komput. dan Inform., vol. 12, no. 1, pp. 91–100, 2023, doi: 10.34010/komputa.v12i1.9458.

[7] D. M. Blei, A. Y. Ng, and M. I. Jordan, “Latent Dirichlet Allocation,” J. Mach. Learn. Res., vol. 3, pp. 993–1022, 2003, doi: 10.1016/B978-0-12-411519-4.00006-9.

[8] Alfrida Rahmawati, Najla Lailin Nikmah, Reynaldi Drajat Ageng Perwira, and Nur Aini Rakhmawati, “Analisis topik konten channel YouTube K-pop Indonesia menggunakan Latent Dirichlet Allocation,” Teknologi, vol. 11, no. 1, pp. 16– 25, 2021, doi: 10.26594/teknologi.v11i1.2155.

[9] R. Ma and Y. J. Kim, “Tracing the evolution of green logistics: A latent dirichlet allocation based topic modeling technology and roadmapping,” PLoS One, vol. 18, no. 8 August, pp. 1–20, 2023, doi: 10.1371/journal.pone.0290074.

[10] F. Gunawan, I. Cholissodin, and P. P. Adikara, “Pemerolehan Informasi Artikel terkait Covid-19 dengan menggunakan Metode Vector Space Model dan Word2Vec untuk Query Expansion,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 3, pp. 960–968, 2021, [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/8690

Downloads

Published

2025-07-28

How to Cite

Aldho Meidy Tri Putra, Sajarwo Anggai, & Taswanda Taryo. (2025). Pemodelan Topik Pada Dakwaan Tindak Pidana Pencurian Di Pengadilan Negeri Serang Menggunakan Latent Dirichlet Allocation. Prosiding Seminar Kecerdasan Artifisial, Sains Data, Dan Pendidikan Masa Depan, 3(2), 67–79. Retrieved from https://openjournal.unpam.ac.id/index.php/PROKASDADIK/article/view/52230