PREDIKSI KASUS COVID-19 MELALUI ANALISIS DATA GOOGLE TREND DI INDONESIA: PENDEKATAN METODE LONG SHORT TERM MEMORY (LSTM)

Authors

  • Lisa Widyarsi Politeknik Statistika STIS
  • Ivana Yoselin Purba Siboro Politeknik Statistika STIS
  • Peterson Hamonangan Immanuel Sihotang Politeknik Statistika STIS
  • Satria Dirgantara Politeknik Statistika STIS
  • Yakobus Natanael Tarigan Politeknik Statistika STIS
  • Yuniar Putri Awaliyah Risky Politeknik Statistika STIS
  • Rani Nooraeni Politeknik Statistika STIS

DOI:

https://doi.org/10.32493/jsmu.v3i2.7786

Keywords:

COVID-19, LSTM, Google Trend, PCA, Regresi

Abstract

Salah satu faktor yang diperlukan untuk menekan angka kasus COVID-19 adalah tingginya perhatian atau atensi masyarakat. Hal tersebut terlihat dari intensitas pencarian informasi publik mengenai COVID-19 di platform online bernama Google Trend. Makalah ini bertujuan untuk mendeskripsikan kondisi wabah COVID-19 di masyarakat dengan menggunakan data Google Trend dan memprediksi kasus COVID-19 baik dengan metode nowcasting maupun forecasting dengan menggabungkan data atensi publik dari Google Trend dengan data resmi pertumbuhan COVID-19 di Indonesia. Data yang digunakan berupa data time series harian dari tanggal 1 April hingga 30 September 2020. Metode Regresi Linear Berganda juga digunakan untuk membandingkan hasil prediksi dengan LSTM. Hasil regresi time series menghasilkan RMSE 1060,80. Selain metode analisis time series, prediksi penambahan kasus COVID-19 juga dilakukan menggunakan metode LSTM dengan empat skenario, di mana skenario pertama menghasilkan RMSE 526,59, skenario kedua menghasilkan RMSE 528,81, skenario ketiga menghasilkan RMSE 528,81. RMSE 483,25 dan skenario terakhir menghasilkan RMSE 482,21. Prediksi menggunakan metode LSTM dengan scnario keempat menghasilkan RMSE, sehingga metode LSTM merupakan metode keempat dengan prediksi yang cukup baik.

References

Covid19.go.id. Data Covid-19. Diakses pada 11 Oktober 2020, dari https://covid19.go.id/peta-sebaran.

IndoML.com. (2018, 13 April). Pengenalan Long Short Term Memory (LSTM) dan Gated Recurrent Unit (GRU)-RNN Bagian 2. Diakses pada 11 Oktober 2020, dari https://indoml.com/2018/04/13/pengenalan-long-short-term-memory-lstm-dangated- recurrent-unit-gru-rnn bagian-2/.

McGough, S.F., et al.,. (2017). Forecasting Zika incidence in the 2016 Latin America outbreak combining traditional disease surveillance with search, social media, and news report data. PLoS neglected tropical diseases, 2017. 11(1): p. e0005295. Diakses pada 11 Oktober 2020, dari https://doi.org/10.1371/journal.pntd.0005295

Medium.com. (2016, 2 Juli). What is Google Trends Data-and what does it mean?. Diakses pada 11 Oktober 2020, dari https://medium.com/google-news-lab/whatis-google-trends-data-and-what-does-it-mean-b48f07342ee8.

Santillana, M., et al.,. (2015). Combining search, social media, and traditional data sources to improve influenza surveillance. PLoS computational biology, 2015. 11(10). Diakses pada 11 Oktober 2020, dari https://doi.org/10.1371/journal.pcbi.1004513

Sharma, Manik & Samriti Sharma. (2020). The Rising Number of COVID-19 Cases Reflecting Growing Search Trend and Concern of People: A Google Trend Analysis of Eight Major Countries. Journal of Medical Systems (2020) 44: 117. DOI: https://doi.org/10.1007/s10916-020-01588-5

WHO.int/indonesia. Pertanyaan dan Jawaban terkait Coronavirus di Indonesia. Diakses pada 11 Oktober 2020, dari https://www.who.int/indonesia/news/novelcoronavirus/qa-for-public.

Published

2021-01-31

Issue

Section

Articles