Penerapan Naive Bayes, Chi-Square dan SMOTE pada Opini Masyarakat Terhadap Fufufafa di YouTube
DOI:
https://doi.org/10.32493/jicomisc.v3i2.50304Keywords:
Opini, Chi-Square, Naive Bayes, SMOTEAbstract
Penelitian ini bertujuan untuk menganalisis opini masyarakat terhadap komentar terkait akun kaskus fufufafa pada platform YouTube dengan menggunakan metode Naive Bayes, Chi-square, dan SMOTE. Dalam penelitian ini meliputi beberapa metode tahapan utama: mining dataset, pelabelan dataset, preprocessing, dan penerapan metode SMOTE untuk mengatasi ketidakseimbangan pada kelas. Penambangan data dilakukan dengan cara mengumpulkan data komentar pengguna dari video YouTube terkait pembahasan akun kaskus fufufafa. Kemudian dilakukan langkah pelabelan untuk mengklasifikasikan komentar menjadi sentimen positif, negatif, atau netral. Tahap preprocessing meliputi pembersihan data dari unsur-unsur yang tidak diperlukan seperti tanda baca, angka, dan karakter khusus. Untuk mengatasi masalah ketidakseimbangan pada kelas, Kami kemudian menerapkan Synthetic Minority Oversampling Technique (SMOTE) dimana jumlah komentar dengan sentimen tertentu lebih sedikit dibandingkan jumlah komentar yang lain. Hasil penelitian ini menunjukkan bahwa akurasi model Naive Bayes mencapai 60,5%, sedangkan penggunaan seleksi fitur chi-square dengan SMOTE meningkatkan akurasi menjadi 68,3%. Dalam hal ini menunjukkan bahwa penggunaan chi-square dengan SMOTE dapat meningkatkan akurasi prediksi sentimen sebesar 7,8%. Kesimpulan dari penelitian ini adalah model Naive Bayes dengan pemilihan fitur chi-square dengan SMOTE lebih efektif dalam memprediksi opini masyarakat dibandingkan model Naive Bayes tanpa pemilihan fitur tersebut.
References
Kurnia, I. Purnamasari, and D. D. Saputra, “Analisis Sentimen Dengan Metode Naïve Bayes, SMOTE Dan Adaboost Pada Twitter Bank BTN,” J. JTIK (Jurnal Teknol. Inf. dan Komunikasi), vol. 7, no. 2, pp. 235–242, 2023, doi: 10.35870/jtik.v7i3.707.
R. Md, R. D. Restiyan, and H. Irsyad, “Analisis Sentimen Masyarakat terhadap Perilaku Lawan Arah yang diunggah pada Media Sosial Youtube Menggunakan Naïve Bayes,” BANDWIDTH J. Informatics Comput. Eng., vol. 02, no. 02, pp. 75–83, 2024.
L. O. Sihombing, H. Hannie, and B. A. Dermawan, “Sentimen Analisis Customer Review Produk Shopee Indonesia Menggunakan Algortima Naïve Bayes Classifier,” Edumatic J. Pendidik. Inform., vol. 5, no. 2, pp. 233–242, 2021, doi: 10.29408/edumatic.v5i2.4089.
H. Hidayatullah, P. Purwantoro, and Y. Umaidah, “Penerapan Naïve Bayes Dengan Optimasi Information Gain Dan Smote Untuk Analisis Sentimen Pengguna Aplikasi Chatgpt,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 3, pp. 1546–1553, 2023, doi: 10.36040/jati.v7i3.6887.
Rosdiana, V. Novalia, I. Saputra, M. Ula, and M. Danil, “Application of Artificial Intelligence Chi-Square Model and Classification Of KNN in Heart Disease Detection,” vol. 6, no. July, pp. 180–188, 2022, doi: 10.31289/jite.v6i1.7343.
R. P. I. Putra, M. Akbar, and R. Amalia, “Analisis Sentimen Masyarakat Terhadap Kinerja Persatuan Sepakbola Seluruh Indonesia Menggunakan Metode Backpropagation,” J. Inf. Technol. Ampera, vol. 1, no. 2, pp. 106–118, 2020, doi: 10.51519/journalita.volume1.isssue2.year2020.page106-118.
E. L. W. Ninggrum and P. A. Widodo, “Implementasi Metode Multinomial Naive Bayes Classifier untuk Analisis Sentimen,” Sustain., vol. 11, no. 1, pp. 1–14, 2019, [Online].
R. Hanifah and I. S. Nurhasanah, “Implementasi Web Crawling untuk Mengumpulkan Informasi Wisata Kuliner di Bandar Lampung,” J. Teknol. Inf. dan Ilmu Komput., vol. 5, no. 5, p. 531, 2018, doi: 10.25126/jtiik.201855842.
T. Ernayanti, M. Mustafid, A. Rusgiyono, and A. R. Hakim, “Penggunaan Seleksi Fitur Chi-Square Dan Algoritma Multinomial Naïve Bayes Untuk Analisis Sentimen Pelangggan Tokopedia,” J. Gaussian, vol. 11, no. 4, pp. 562–571, 2023, doi: 10.14710/j.gauss.11.4.562-571.
A. Alamsyah and F. N. Zuhri, “Measuring Public Sentiment Towards Services Level in Online Forum using Naive Bayes Classifier and Word Cloud,” CRS-ForMIND Int. Conf. Work. 2017, no. October, 2017.
M. Y. Aldean, P. Paradise, and N. A. Setya Nugraha, “Analisis Sentimen Masyarakat Terhadap Vaksinasi Covid-19 di Twitter Menggunakan Metode Random Forest Classifier (Studi Kasus: Vaksin Sinovac),” J. Informatics, Inf. Syst. Softw. Eng. Appl., vol. 4, no. 2, pp. 64–72, 2022, doi: 10.20895/inista.v4i2.575.
L. Amatullah, Y. Widiastiwi, and N. Chamidah, “Penerapan Klasifikasi Random Forest Terhadap Data Gangguan Spektrum Autisme (ASD) Pada Anak-Anak Menggunakan Seleksi Fitur Principal Component Analysis,” Semin. Nas. Mhs. Ilmu Komput. dan Apl., vol. 3, no. 2, pp. 356–364, 2022.
I. Kurniawan, A. Lia Hananto, S. Shofia Hilabi, A. Hananto, B. Priyatna, and A. Yuniar Rahman, “Perbandingan Algoritma Naive Bayes Dan SVM Dalam Sentimen Analisis Marketplace Pada Twitter,” J. Tek. Inform. dan Sist. Inf., vol. 10, no. 1, pp. 731–740, 2023, [Online]. Available: http://jurnal.mdp.ac.id.
B. Paula, M. Fawzan, and H. Irsyad, “Analisis Sentiment Masyarakat Terhadap penyebaran Starlink di Indonesia Menggunakan Algoritma Naive Bayes,” vol. 02, no. 2, pp. 141–148, 2024.
N. Asmiati and Fatmawati, “Penerapan Algoritma Naive Bayes Untuk Mengklasifikasi Pengaruh Negatif Game Online Bagi Remaja Milenial,” JTIM J. Teknol. Inf. dan Multimed., vol. 2, no. 3, pp. 141–149, 2020, doi: 10.35746/jtim.v2i3.102.
M. I. Fikri, T. S. Sabrila, and Y. Azhar, “Comparison of Naïve Bayes and Support Vector Machine Methods in Twitter Sentiment Analysis,” Smatika J., vol. 10, no. 02, pp. 71–76, 2020.
A. I. Tanggraeni and M. N. N. Sitokdana, “Analisis Sentimen Aplikasi E-Government pada Google Play Menggunakan Algoritma Naïve Bayes,” JATISI (Jurnal Tek. Inform. dan Sist. Informasi), vol. 9, no. 2, pp. 785–795, 2022, doi: 10.35957/jatisi.v9i2.1835.