Analisis Sentimen Reddit WallStreetBets Menggunakan Multinomial Naive Bayes pada Dinamika Pasar Saham
Keywords:
Analisis Sentimen, Investasi Saham, Multinomial Naive Bayes, Reddit, WallStreetBetsAbstract
Penelitian ini menyajikan investigasi komputasional mendalam mengenai pengembangan model analisis sentimen untuk mengklasifikasikan opini investor ritel pada platform Reddit, khususnya subreddit WallStreetBets. Fenomena social trading telah merombak lanskap pasar modal modern, di mana sentimen kolektif memiliki kapasitas untuk memicu volatilitas harga saham secara signifikan. Penelitian ini mengadopsi algoritma Multinomial Naive Bayes yang diperkuat dengan tahapan pra-pemrosesan data ekstensif, mencakup penanganan slang finansial, konversi emoji, serta normalisasi teks. Data dikumpulkan melalui Python Reddit API Wrapper (PRAW) dan diekstraksi menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). Evaluasi empiris menunjukkan bahwa model mencapai akurasi keseluruhan sebesar 72%. Analisis granular menunjukkan presisi tinggi pada kelas positif (79%) dan negatif (86%), namun mengungkapkan kelemahan kritis pada recall kelas negatif yang hanya mencapai 46%. Hal ini dikarenakan keterbatasan asumsi independensi fitur dalam mendeteksi nuansa sarkasme dan ekspresi negatif implisit yang menjadi ciri khas kultur komunikasi komunitas tersebut. Temuan ini memberikan kontribusi pada pemahaman efektivitas metode bag-of-words dalam analisis teks finansial informal.
References
Alaramma, S., Habu, A., Ya'u, B., & Madaki, A. 2023. Sentiment analysis of sarcasm detection in social media. Gadau Journal of Pure and Allied Sciences, 2(1).
Alammary, A. 2021. Arabic Questions Classification Using Modified TF-IDF. IEEE Access, 9.
Bongini, P., Rossolini, M., Maurino, A., & Osborne, F. 2025. The Information Power of Social Media for Investment Decisions: An AI-Driven Analysis of Reddit Posts. Journal of Financial Management, Markets and Institutions. World Scientific Publishing.
Desiderio, A., Aiello, L. M., Cimini, G., & Alessandretti, L. 2024. The dynamics of the Reddit collective action leading to the GameStop short squeeze. arXiv preprint arXiv:2401.14999.
Dhanta, R., Sharma, H., Kumar, V., & Singh, H. 2023. Twitter sentimental analysis using machine learning. International Journal of Communication and Information Technology, 4(1).
Doan, M., Dam, M., Doan, T., Nguyen, H., & Nguyen, B. 2024. Sentiment Classification in Mobile Gaming Reviews: Customized Transformer Models with Emojis Retained. Customized Transformer Models.
Fauzi, F., Ismatullah, I., & Nur, I. 2023. Unbalanced multiclass classification with adaptive synthetic multinomial naive bayes approach. Informatyka Automatyka Pomiary W Gospodarce I Ochronie Środowiska, 13(3).
Judijanto, L., Maulinda, R., Zulaika, S., & Tjahyadi, I. 2023. Pengaruh Sumber Informasi dan Interaksi Sosial di Media Sosial terhadap Pembentukan Opini Politik Masyarakat di Indonesia. Sanskara Ilmu Sosial dan Humaniora, 1(01).
Kavanagh, J., Greenhow, K., & Jordanous, A. 2023. Assessing the Effects of Lemmatisation and Spell Checking on Sentiment Analysis of Online Reviews. IEEE International Conference on Semantic Computing.
Kulmanov, S., Fazylzhanova, A., Bissengali, A., & Omarova, A. 2025. Slang Terms in the Field of Information Technology and Their Standardization. Forum for Linguistic Studies, 7(6).
Lizetha, V., & Prawadika, A. 2021. Konvergensi Setengah Hati: Invasi Konten Media Sosial dalam Program Berita Televisi di TVOne. Jurnal Media Dan Komunikasi, 2(1).
Permatasari, P. A., Linawati, L., & Jasa, L. 2021. Survei Tentang Analisis Sentimen Pada Media Sosial. Majalah Ilmiah Teknologi Elektro, 20(2).
Peruka, B. 2025. Sentemonet: A Comprehensive Framework for Multimodal Sentiment Analysis from Text and Emotions. Journal of Information Systems Engineering & Management.
Sakthivel, S., et al. 2025. NLP-Based Extended Lexicon Model For Sarcasm Detection With Tweets And Emojis. GJEIIR, 5(2).
Setiadi, D., et al. 2025. Aspect-Based Sentiment Analysis on E-commerce Reviews using BiGRU and Bi-Directional Attention Flow. J. Comput. Theor. Appl., 2(4).
Sudaryati, D. 2021. Relevansi Nilai Informasi Akuntansi Terhadap Harga Saham. AKUNTANSI DEWANTARA, 4(2).
Supriani, I., Fianto, B., Fauziah, N., & Maulayati, R. 2021. Revisiting the Contribution of Islamic Banks' Financing to Economic Growth: The Indonesian Experience. Shirkah Journal of Economics and Business, 6(1).
Veruswati, M., et al. 2022. Does It Still Show a Deficit? Arguing Post-COVID-19 Health Financing System in Bogor, Indonesia. Kesmas National Public Health Journal, 17(sp1).
Wang, Z., Hao, S., Zwetsloot, I. M., & Trimborn, S. 2024. Social Network Datasets on Reddit Financial Discussion. arXiv preprint arXiv:2410.05002.
Yang, Z., Xia, Y., & Xu, H. 2023. TGCN-Bert Emoji Prediction in Information Systems Using TCN and GCN Fusing Features Based on BERT. International Journal on Semantic Web and Information Systems, 19(1).


