Mining social media data to inform public health policies: a sentiment analysis case study

Rev Panam Salud Publica. 2024 Dec 16:48:e79. doi: 10.26633/RPSP.2024.79. eCollection 2024.

Abstract

In the face of growing health challenges, nontraditional sources of data, such as open data, have the potential to transform how decisions are made and used to inform public health policies. Focusing on the COVID-19 pandemic, this article presents a case study employing sentiment analysis on unstructured social media data from Twitter (now X) to gauge public sentiment regarding pandemic-related restrictions. Our study aims to uncover and analyze Jamaican citizens' emotions and opinions surrounding COVID-19 restrictions following an outbreak at a call center in April 2020. Machine learning sentiment analysis was used to analyze tweets from Twitter related to the lockdown. A total of 1 609 tweets were retrieved and analyzed, 76% of which expressed negative sentiments, suggesting that the majority of citizens were not in favor of the restrictions. The low compliance with the government-mandated policy may be related to the high percentage of negative sentiments expressed. Insights from citizens' sentiments derived from open data sources such as Twitter can serve as valuable indicators for public health policymakers, providing critical input that will aid in tailoring interventions that align with public sentiments, thereby enhancing the effectiveness of and compliance with public health policies. This type of analysis can be useful to the health community and more generally to governments, as it allows for a more scientific assessment of public response to public health intervention techniques in real time. This study contributes to the emerging discourse on the integration of nontraditional data into public health policy-making, highlighting the growing potential for the use of these novel analytic techniques in addressing complex public health challenges.

Dados los crecientes desafíos en materia de salud, las fuentes de datos no tradicionales, como los datos de libre acceso (o datos abiertos), brindan la posibilidad de transformar la forma en la que se toman las decisiones y el modo como se usan para fundamentar las políticas de salud pública. En este artículo, centrado en la pandemia de COVID-19, se presenta un estudio de caso que emplea el análisis de sentimientos en los datos no estructurados de redes sociales procedentes de Twitter (ahora X) para evaluar los sentimientos del público ante las restricciones derivadas de la pandemia. Su objetivo es revelar y analizar las emociones y opiniones de los ciudadanos jamaicanos con respecto a las restricciones debidas a esta enfermedad tras un brote en un centro de llamadas en abril del 2020.Se utilizó un aprendizaje automático para el análisis de sentimientos, a fin de analizar los tuits de Twitter relacionados con el confinamiento. Se recuperaron y analizaron un total de 1609 tuits, de los que el 76% manifestaba sentimientos negativos, lo que sugiere que la mayoría de los ciudadanos no era partidaria de las restricciones. Es posible que el bajo cumplimiento de la política impuesta por el gobierno esté relacionado con el porcentaje elevado de sentimientos negativos expresados.Las perspectivas obtenidas respecto a los sentimientos de los ciudadanos a partir de fuentes de datos de libre acceso como Twitter pueden servir como indicadores útiles para los responsables de las políticas de salud pública, ya que proporcionan una información crucial para poder formular intervenciones adaptadas, acordes con los sentimientos de los ciudadanos, con la consiguiente mejora de la eficacia y el cumplimiento de las políticas de salud pública. Este tipo de análisis puede ser útil para la comunidad de atención de salud y, en términos más generales, para los gobiernos, ya que permite una evaluación más científica de la respuesta pública a las técnicas de intervención en materia de salud pública en tiempo real. Asimismo, este estudio constituye una aportación al discurso emergente sobre la integración de datos no tradicionales en la elaboración de políticas de salud pública al resaltar las posibilidades, cada vez mayores, que ofrece el uso de estas técnicas analíticas novedosas a la hora de abordar desafíos complejos en el ámbito de la salud pública.

Diante dos desafios crescentes em saúde, fontes não tradicionais de dados (como dados abertos) têm o potencial de transformar a maneira como as decisões são tomadas e de serem aplicadas para subsidiar políticas de saúde pública. Trata-se de um estudo de caso que utiliza análise de sentimentos de dados não estruturados de redes sociais extraídos do Twitter (agora X), com enfoque na pandemia de COVID-19, com a finalidade de avaliar o sentimento do público em relação às restrições da pandemia. O objetivo foi expor e analisar as opiniões e as emoções da população jamaicana quanto às restrições impostas pela pandemia após um surto de COVID-19 em uma central de atendimento em abril de 2020.Foi empregada uma análise de sentimentos usando aprendizado de máquinas para analisar textos postados no Twitter (tuítes) relacionados ao confinamento. Ao todo, foram identificados e analisados 1.609 tuítes. Desses, 76% expressavam sentimentos negativos, o que indica que a maioria não era favorável às restrições. A baixa adesão ao confinamento imposto pelas autoridades públicas pode estar relacionada ao elevado percentual de sentimentos negativos expressos pela população.O entendimento adquirido a partir dos sentimentos da população com base em fontes de dados abertos, como o Twitter, pode ser uma contribuição útil para formuladores de políticas de saúde pública, fornecendo feedback essencial para adequar as intervenções aos sentimentos das pessoas, melhorando assim a efetividade e o cumprimento das políticas de saúde pública. Esse tipo de análise é vantajoso para a comunidade de saúde e, de modo geral, para os governos, porque permite analisar de maneira mais científica e em tempo real a resposta do público às estratégias de intervenção de saúde pública. Este estudo contribui para o discurso emergente de integrar dados não tradicionais à formulação de políticas de saúde pública, destacando o potencial cada vez maior de usar técnicas analíticas inovadoras para enfrentar os complexos desafios de saúde pública.

Keywords: COVID-19; Jamaica; data mining; health policy; quarantine; sentiment analysis; social media.

Grants and funding

This work was carried out with the aid of a grant from the International Development Research Centre (IDRC), Ottawa, Canada. The views expressed herein do not necessarily represent those of IDRC or its Board of Governors. The sponsors were not involved in any way in the design of the study, the collection and analysis of the data, the decision to publish this work, or the preparation of the manuscript.