Sentiment and topics analysis about the cuban vaccines Soberana 02 and Abdala on Twitter

Authors

Keywords:

sentiment analysis, topics, natural language processing, Twitter, vaccines.

Abstract

Sentiment analysis or opinion mining is a branch of computing that allows analyzing opinions, feelings and emotions in certain areas of social interest such as products, services, organizations, companies, events and topics of current interest. In this sense, the objective of this paper was to identify the feelings and topics present in the tweets mentioning the Cuban vaccines Soberana 02 and Abdala on Twitter social network. The programming languages Python and R with their specific libraries for data science were chosen. The first part of the study, which ranged from web scraping to the quantification of the most used words, was carried out with Python and the libraries tweepy, pandas, re, nltk and matplotlib. While the second, which was the sentiment analysis and topic detection, was implemented with R and used tokenizers, tm, syuzhet, topic modeling, tidyverse, barplot, and wordcloud. It was obtained that among the terms with which there is more dialogue on Twitter are doses, vaccines, efficacy, Cubans, candidates, millions, country, people, received and population. In the tweets, the predominant emotions were fear and confidence, slightly above it; in the polarity, the positive one predominated, as an expression of the lived context in which the vaccination campaign was developed. A consensus can be perceived around the vaccines Soberana 02 and Abdala, from the identified topics and the terms that were related to the predominant emotions, as well as the polarity.

References

Mejía GK. Enriquecimiento del modelo basado en reglas Vader a través de lexicones (Tesis de Diploma). México: Universidad Autónoma del Estado de México; 2018 [acceso 21/06/2022]. Disponible en: http://ri.uaemex.mx/bitstream/handle/20.500.11799/99592/2018-Kevin+Mejia+Gonzalez-Tesis.pdf?sequence=1

Ashish Kumar MBBS, Safi U Khan MD, Ankur Kalra MD FACP FACC FSCAI. COVID-19 pandemic: a sentiment analysis: A short review of the emotional effects produced by social media posts during this global crisis. European Heart Journal. 2021;41(39):3782-3. DOI: https://doi.org/10.1093/eurheartj/ehaa597

Valdez D, ten Thij M, Bathina K, Rutter LA, Bollen J. Social Media Insights into US Mental Health During the COVID-19 Pandemic: Longitudinal Analysis of Twitter Data. J Med Internet Res. 2020;22(12):e21418. DOI: https://doi.org/doi:10.2196/21418

Arango Pastrana CA, Osorio Andrade CF. Aislamiento social obligatorio: un análisis de sentimientos mediante machine learning. Suma de Negocios. 2021;12(26):1-13. DOI: https://doi.org/10.14349/sumneg/2021.v12.n26.a1

Saleh SN, Lehmann CU, McDonald SA, Basit MA, Medford RJ. Understanding public perception of coronavirus disease 2019 (COVID-19) social distancing on Twitter. Infection Control & Hospital Epidemiology. 2021;42(2):131-8. DOI: https://doi.org/10.1017/ice.2020.406

Salaberry N. Análisis de contenido en Twitter y el aislamiento social obligatorio. Revista de Investigación en Modelos Matemáticos Aplicados a la Gestión y la Economía. 2020 [acceso 23/06/2022];7(1):1-15. Disponible: http://www.economicas.uba.ar/wp-content/uploads/2016/04/Salaberry-Natalia.pdf

Vela Delfa C, Cantamutto L, Núñez-Cansado M. Análisis del hashtag #MeQuedoEnCasa: la conversación digital por twitter® ante la emergencia producida por la COVID-19. Íkala, Revista de Lenguaje y Cultura. 2021;26(2):365-84. DOI: https://doi.org/10.17533/udea.ikala.v26n2a08

Ferreyra SG, Nieto AA, Juares WI. Mar del Plata en Twitter: comunidades y tópicos durante la cuarentena. Revista Enlace Universitario. 2020;35(7):1-15. Disponible en: https://www.mdp.edu.ar/attachments/article/82/Enlace35.pdf

Sued Palmeiro GE, Cebral Loureda M. Voces autorizadas en Twitter durante la pandemia de COVID-19: actores, léxico y sentimientos como marco interpretativo para usuarios ordinarios. Revista de Comunicación y Salud. 2020 [acceso 23/06/2022];10 (2):549-68. DOI: https://doi.org/10.35669/rcys.2020.10(2).549-568

Chandrasekaran R, Mehta V, Valkunde T, Moustakas E. Topics, Trends, and Sentiments of Tweets About the COVID-19 Pandemic: Temporal Infoveillance Study. J Med Internet Res. 2020;22(10):e22624. DOI: https://doi.org/10.2196/22624

Xue J, Chen J, Hu R, Chen C, Zheng C, Su Y, et al. Twitter Discussions and Emotions about the COVID-19 Pandemic: Machine Learning Approach. J Med Internet Res. 2020;22(11):e20550. DOI: https://doi.org/10.2196/20550

Cebral-Loureda M, Sued-Palmeiro GE. Análisis computacional de la conversación pública en lengua española. Cuadernos Info. 2021(49):1-25. DOI: https://doi.org/10.7764/cdi.49.27467

Torres JA. Análisis de opinión sobre tuits del COVID-19 generados por usuarios ecuatorianos. CEDAMAZ. 2021 [acceso 24/06/2022];11(1):70-7. Disponible en: https://revistas.unl.edu.ec/index.php/cedamaz/article/download/1039/791

Alles Torrent S, del Rio Riande G, De León R, Fila M, Hernández N, Jerry Bonnell, Song D. Narrativas digitales de la COVID-19 en Twitter: de los datos a la interpretación. publicaahd [Internet]. 2020 [acceso 24/06/2022];1:e002. Disponible en: https://revistas.unlp.edu.ar/publicaahd/article/view/13771

Condor Tinoco EE, Rojas Cusi JA, Zevallos Rodríguez A, Castro Buleje CY. Minería de datos: análisis de sentimiento en Twitter basado en lexicones sobre el uso de dióxido de cloro para el tratamiento del COVID-19. Actas del III Congreso Internacional de Ingeniería de Sistemas. 2021 [acceso 25/06/2022]. Disponible en: https://repositorio.ulima.edu.pe/bitstream/handle/20.500.12724/13898/Condor_Rojas_Zevallos_Castro_Miner%C3%ADa-de-datos-an%C3%A1lisis-de-sentimiento-en-Twitter.pdf?sequence=1&isAllowed=y

Sharma C, Whittle S, Haghighi PD, Burstein F, Keen H. Sentiment analysis of social media posts on pharmacotherapy: A scoping review. Pharmacol Res Perspect. 2020;8:e00640. DOI: https://doi.org/10.1002/prp2.640

Méndez-Hernández GM, Fonseca Valido R, Alonso Pérez M. Conversaciones sobre brigadas médicas cubanas en contexto de COVID-19 desde el ambiente info-comunicativo de Twitter. Rev haban cienc méd. 2021 [acceso 25/06/2022];20(5):e4173. Disponible en: http://www.revhabanera.sld.cu/index.php/rhab/article/view/4173

MINSAP. Ministro de Salud: “Hacer juntos es la mejor manera de consolidar el éxito en el enfrentamiento a la epidemia”. 2021 [acceso 25/06/2022]. Disponible en: https://salud.msp.gob.cu/ministro-de-salud-hacer-juntos-es-la-mejor-manera-de-consolidar-el-exito-en-el-enfrentamiento-a-la-epidemia/?doing_wp_cron=1622123296.0725009441375732421875

Statcounter GlobalStats. [acceso 25/06/2022] Disponible en: https://gs.statcounter.com/social-media-stats/all/cuba

Twitter. https://developer.twitter.com

Tweepy Documentation. Disponible en: https://docs.tweepy.org

Pandas Documentation. PyData.org. Disponible en: https://pandas.pydata.org/pandas-docs/stable

Re. Operaciones con expresiones regules. Disponible en: https://docs.python.org/es/3/library/re.html

NLTK: Natural Language Toolkit. Disponible en: https://www.nltk.org

Hunter JD. Matplotlib: A 2D graphics environment. En Matplotlib. Disponible en: https://matplotlib.org/2.0.2/Matplotlib.pdf

Mullen L. Introduction to the tokenizers Package. [acceso 27/06/2022] Disponible en: https://cran.r-project.org/web/packages/tokenizers/vignettes/introduction-to-tokenizers.html

Mateo J. Introduction to the Syuzhet Package. 2020 [acceso 27/06/2022]. Disponible en: https://cran.r-project.org/web/packages/syuzhet/vignettes/syuzhet-vignette.html

Naldi M. A review of sentiment computation methods with R packages. arXivLabs. 2019. DOI: https://doi.org/10.48550/arXiv.1901.08319

barplot: Bar Plots. [acceso 27/06/2022] Disponible en: https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/barplot

Fellows I. Package ‘wordcloud’. 2018 [acceso 27/06/2022]. Disponible en: https://cran.r-project.org/web/packages/wordcloud/wordcloud.pdf

Feinerer I. Introduction to the tm Package Text Mining in R. 2020 [acceso 28/06/2022]. Disponible en: https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf

Silvestre Gómez M. Implementación de asignación jerárquica latente de Dirichlet para modelado de temas (Tesis de maestría). Sevilla: Universidad de Sevilla; 2018 [acceso 28/06/2022]. Disponible en: https://idus.us.es/bitstream/handle/11441/74394/MAR%c3%8dA%20SILVESTRE%20G%c3%93MEZ.pdf?sequence=1&isAllowed=y

Kozlowski D, Shokida N. Notas de clase del curso de introducción a Data Science. 2019 [acceso 29/06/2022]. Disponible en: https://diegokoz.github.io/intro_ds_bookdown/explicacion-9.html#topic-modelling

Melton CA, Olusanya OA, Ammar N, Shaban-Nejad A. Public sentiment analysis and topic modeling regarding COVID-19 vaccines on the Reddit social media platform: A call to action for strengthening vaccine confidence. J Infect Public Health. 2021;14(10):1505-12. DOI: https://doi.org/10.1016/j.jiph.2021.08.010

Corcoran D. Manipulación de datos e investigación reproducible en R. 2018 [acceso 29/06/2022]. Disponible en: https://bookdown.org/content/3515/tidydata.html

ggpolt2. Disponible en: https://r-graph-gallery.com/ggplot2-package.html

Rodríguez Sánchez A, Rivero González LM, Soca Losano S. Análisis de sentimientos y tópicos sobre las vacunas cubanas Soberana 02 y Abdala en Twitter [preprint]. 2022 [acceso 29/06/2022]. Disponible en: https://github.com/luisdev98/sentimentAnalysis

Datareportal. Digital 2022: Cuba. 2022 [acceso 30/06/2022]. Disponible: https://datareportal.com/reports/digital-2022-cuba

Rodríguez-Orejuela A, Montes-Mora CL, Osorio-Andrade CF. Sentimientos hacia la vacunación contra la COVID-19: panorama colombiano en Twitter. Palabra Clave. 2022;25(1),e2514. DOI: https://doi.org/10.5294/pacla.2022.25.1.4

Arias García HL, Doria Pérez LC. Análisis de sentimientos sobre la percepción ciudadana de la vacunación del COVID-19 en Colombia. 2021 [acceso 30/06/2022]. Disponible en: http://repositorio.uan.edu.co/bitstream/123456789/5160/1/2021H%C3%A9ctorLeonardoAriasGarc%C3%ADa.pdf

Vallejo Cabrera PX. Análisis de sentimientos sobre la vacuna para COVID-19 en la red social “twitter” en el contexto ecuatoriano (tesis de Licenciatura). Ecuador: Universidad del Azuay; 2022 [acceso 30/06/2022]. Disponible en: https://dspace.uazuay.edu.ec/bitstream/datos/11709/1/17238.pdf

Rodríguez K, Haber Guerra Y, Fonseca Valido RA. Análisis discursivo de las vacunas anticovid-19 en Twitter. Question/Cuestión. 2021;70(3). DOI: https://doi.org/10.24215/16696581e624

Liu S, Liu J. Public attitudes toward COVID-19 vaccines on English-language Twitter: A sentiment analysis. Vaccine. 2021;39(39):5499-505. DOI: https://doi.org/10.1016/j.vaccine.2021.08.058

Povedano Álvarez D, Portela García-Miguel J, Armas Vega EA. Estudio de la percepción pública de la vacuna contra la COVID-19 mediante técnicas de PLN y de aprendizaje automático [Tesis de Maestría]. España: Facultad de Estadística, Universidad Complutense de Madrid; 2021 [acceso 01/07/2022]. Disponible: https://eprints.ucm.es/id/eprint/67617/1/daniel-povedano-estudio.pdf

Carrasco-Polaino R, Martin-Cárdaba MÁ, Villar-Cirujano E. Participación ciudadana en Twitter: Polémicas anti-vacunas en tiempos de COVID-19. Comunicar: Revista científica Iberoamericana de comunicación y educación. 2021;(69):21-31. DOI: https://doi.org/10.3916/C69-2021-02

Roe C, Lowe M, Williams B, Miller C. Public Perception of SARS-CoV-2 Vaccinations on Social Media: Questionnaire and Sentiment Analysis. Int J Environ Res Public Health. 2021 [acceso 01/07/2022];18(24):13028. DOI: https://doi.org/10.3390/ijerph182413028

Published

2023-05-23

How to Cite

1.
Rodríguez Sánchez A, Rivero González LM, Soca Lozano S. Sentiment and topics analysis about the cuban vaccines Soberana 02 and Abdala on Twitter. Rev. cuba. inf. cienc. salud [Internet]. 2023 May 23 [cited 2025 Feb. 5];34. Available from: https://acimed.sld.cu/index.php/acimed/article/view/2261

Issue

Section

Artículos Originales