Análisis de sentimientos y tópicos sobre las vacunas cubanas Soberana 02 y Abdala en Twitter
Palabras clave:
análisis de sentimientos, tópicos, procesamiento de lenguaje natural, Twitter, vacunas.Resumen
El análisis de sentimientos o minería de opiniones es una rama de la computación que permite analizar opiniones, sentimientos y emociones en ciertas áreas de interés social como productos, servicios, organizaciones, compañías, eventos y temas de interés actual. En tal sentido se propuso identificar los sentimientos y tópicos presentes en los tweets que hicieron mención a las vacunas cubanas Soberana 02 y Abdala en la red social Twitter. Se optó por los lenguajes de programación Python y R con sus librerías específicas para la ciencia de datos. La primera parte del estudio, que abarcó desde el web scraping hasta la cuantificación de las palabras más usadas, se realizó con Python y las siguientes librerías: tweepy, pandas, re, nltk y matplotlib. Mientras que la segunda, que fue la del análisis de sentimientos y detección de tópicos, se implementó con R y se utilizó: tokenizers, tm, syuzhet, topic modeling, tidyverse, barplot y wordcloud. Se obtuvo que entre los términos con que más se dialoga en Twitter están dosis, vacunas, eficacia, cubanos, candidatos, millones, país, personas, recibido y población. En los tweets las emociones predominantes fueron el miedo y, ligeramente por encima, la confianza; en la polaridad predominó la positiva, como expresión del contexto vivido en el cual se desarrolló la campaña de vacunación. A partir de los tópicos identificados y los términos que se relacionaron con las emociones predominantes, así como por la polaridad, se aprecia consenso en torno a las vacunas Soberana 02 y Abdala.
Citas
Mejía GK. Enriquecimiento del modelo basado en reglas Vader a través de lexicones (Tesis de Diploma). México: Universidad Autónoma del Estado de México; 2018 [acceso 21/06/2022]. Disponible en: http://ri.uaemex.mx/bitstream/handle/20.500.11799/99592/2018-Kevin+Mejia+Gonzalez-Tesis.pdf?sequence=1
Ashish Kumar MBBS, Safi U Khan MD, Ankur Kalra MD FACP FACC FSCAI. COVID-19 pandemic: a sentiment analysis: A short review of the emotional effects produced by social media posts during this global crisis. European Heart Journal. 2021;41(39):3782-3. DOI: https://doi.org/10.1093/eurheartj/ehaa597
Valdez D, ten Thij M, Bathina K, Rutter LA, Bollen J. Social Media Insights into US Mental Health During the COVID-19 Pandemic: Longitudinal Analysis of Twitter Data. J Med Internet Res. 2020;22(12):e21418. DOI: https://doi.org/doi:10.2196/21418
Arango Pastrana CA, Osorio Andrade CF. Aislamiento social obligatorio: un análisis de sentimientos mediante machine learning. Suma de Negocios. 2021;12(26):1-13. DOI: https://doi.org/10.14349/sumneg/2021.v12.n26.a1
Saleh SN, Lehmann CU, McDonald SA, Basit MA, Medford RJ. Understanding public perception of coronavirus disease 2019 (COVID-19) social distancing on Twitter. Infection Control & Hospital Epidemiology. 2021;42(2):131-8. DOI: https://doi.org/10.1017/ice.2020.406
Salaberry N. Análisis de contenido en Twitter y el aislamiento social obligatorio. Revista de Investigación en Modelos Matemáticos Aplicados a la Gestión y la Economía. 2020 [acceso 23/06/2022];7(1):1-15. Disponible: http://www.economicas.uba.ar/wp-content/uploads/2016/04/Salaberry-Natalia.pdf
Vela Delfa C, Cantamutto L, Núñez-Cansado M. Análisis del hashtag #MeQuedoEnCasa: la conversación digital por twitter® ante la emergencia producida por la COVID-19. Íkala, Revista de Lenguaje y Cultura. 2021;26(2):365-84. DOI: https://doi.org/10.17533/udea.ikala.v26n2a08
Ferreyra SG, Nieto AA, Juares WI. Mar del Plata en Twitter: comunidades y tópicos durante la cuarentena. Revista Enlace Universitario. 2020;35(7):1-15. Disponible en: https://www.mdp.edu.ar/attachments/article/82/Enlace35.pdf
Sued Palmeiro GE, Cebral Loureda M. Voces autorizadas en Twitter durante la pandemia de COVID-19: actores, léxico y sentimientos como marco interpretativo para usuarios ordinarios. Revista de Comunicación y Salud. 2020 [acceso 23/06/2022];10 (2):549-68. DOI: https://doi.org/10.35669/rcys.2020.10(2).549-568
Chandrasekaran R, Mehta V, Valkunde T, Moustakas E. Topics, Trends, and Sentiments of Tweets About the COVID-19 Pandemic: Temporal Infoveillance Study. J Med Internet Res. 2020;22(10):e22624. DOI: https://doi.org/10.2196/22624
Xue J, Chen J, Hu R, Chen C, Zheng C, Su Y, et al. Twitter Discussions and Emotions about the COVID-19 Pandemic: Machine Learning Approach. J Med Internet Res. 2020;22(11):e20550. DOI: https://doi.org/10.2196/20550
Cebral-Loureda M, Sued-Palmeiro GE. Análisis computacional de la conversación pública en lengua española. Cuadernos Info. 2021(49):1-25. DOI: https://doi.org/10.7764/cdi.49.27467
Torres JA. Análisis de opinión sobre tuits del COVID-19 generados por usuarios ecuatorianos. CEDAMAZ. 2021 [acceso 24/06/2022];11(1):70-7. Disponible en: https://revistas.unl.edu.ec/index.php/cedamaz/article/download/1039/791
Alles Torrent S, del Rio Riande G, De León R, Fila M, Hernández N, Jerry Bonnell, Song D. Narrativas digitales de la COVID-19 en Twitter: de los datos a la interpretación. publicaahd [Internet]. 2020 [acceso 24/06/2022];1:e002. Disponible en: https://revistas.unlp.edu.ar/publicaahd/article/view/13771
Condor Tinoco EE, Rojas Cusi JA, Zevallos Rodríguez A, Castro Buleje CY. Minería de datos: análisis de sentimiento en Twitter basado en lexicones sobre el uso de dióxido de cloro para el tratamiento del COVID-19. Actas del III Congreso Internacional de Ingeniería de Sistemas. 2021 [acceso 25/06/2022]. Disponible en: https://repositorio.ulima.edu.pe/bitstream/handle/20.500.12724/13898/Condor_Rojas_Zevallos_Castro_Miner%C3%ADa-de-datos-an%C3%A1lisis-de-sentimiento-en-Twitter.pdf?sequence=1&isAllowed=y
Sharma C, Whittle S, Haghighi PD, Burstein F, Keen H. Sentiment analysis of social media posts on pharmacotherapy: A scoping review. Pharmacol Res Perspect. 2020;8:e00640. DOI: https://doi.org/10.1002/prp2.640
Méndez-Hernández GM, Fonseca Valido R, Alonso Pérez M. Conversaciones sobre brigadas médicas cubanas en contexto de COVID-19 desde el ambiente info-comunicativo de Twitter. Rev haban cienc méd. 2021 [acceso 25/06/2022];20(5):e4173. Disponible en: http://www.revhabanera.sld.cu/index.php/rhab/article/view/4173
MINSAP. Ministro de Salud: “Hacer juntos es la mejor manera de consolidar el éxito en el enfrentamiento a la epidemia”. 2021 [acceso 25/06/2022]. Disponible en: https://salud.msp.gob.cu/ministro-de-salud-hacer-juntos-es-la-mejor-manera-de-consolidar-el-exito-en-el-enfrentamiento-a-la-epidemia/?doing_wp_cron=1622123296.0725009441375732421875
Statcounter GlobalStats. [acceso 25/06/2022] Disponible en: https://gs.statcounter.com/social-media-stats/all/cuba
Twitter. https://developer.twitter.com
Tweepy Documentation. Disponible en: https://docs.tweepy.org
Pandas Documentation. PyData.org. Disponible en: https://pandas.pydata.org/pandas-docs/stable
Re. Operaciones con expresiones regules. Disponible en: https://docs.python.org/es/3/library/re.html
NLTK: Natural Language Toolkit. Disponible en: https://www.nltk.org
Hunter JD. Matplotlib: A 2D graphics environment. En Matplotlib. Disponible en: https://matplotlib.org/2.0.2/Matplotlib.pdf
Mullen L. Introduction to the tokenizers Package. [acceso 27/06/2022] Disponible en: https://cran.r-project.org/web/packages/tokenizers/vignettes/introduction-to-tokenizers.html
Mateo J. Introduction to the Syuzhet Package. 2020 [acceso 27/06/2022]. Disponible en: https://cran.r-project.org/web/packages/syuzhet/vignettes/syuzhet-vignette.html
Naldi M. A review of sentiment computation methods with R packages. arXivLabs. 2019. DOI: https://doi.org/10.48550/arXiv.1901.08319
barplot: Bar Plots. [acceso 27/06/2022] Disponible en: https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/barplot
Fellows I. Package ‘wordcloud’. 2018 [acceso 27/06/2022]. Disponible en: https://cran.r-project.org/web/packages/wordcloud/wordcloud.pdf
Feinerer I. Introduction to the tm Package Text Mining in R. 2020 [acceso 28/06/2022]. Disponible en: https://cran.r-project.org/web/packages/tm/vignettes/tm.pdf
Silvestre Gómez M. Implementación de asignación jerárquica latente de Dirichlet para modelado de temas (Tesis de maestría). Sevilla: Universidad de Sevilla; 2018 [acceso 28/06/2022]. Disponible en: https://idus.us.es/bitstream/handle/11441/74394/MAR%c3%8dA%20SILVESTRE%20G%c3%93MEZ.pdf?sequence=1&isAllowed=y
Kozlowski D, Shokida N. Notas de clase del curso de introducción a Data Science. 2019 [acceso 29/06/2022]. Disponible en: https://diegokoz.github.io/intro_ds_bookdown/explicacion-9.html#topic-modelling
Melton CA, Olusanya OA, Ammar N, Shaban-Nejad A. Public sentiment analysis and topic modeling regarding COVID-19 vaccines on the Reddit social media platform: A call to action for strengthening vaccine confidence. J Infect Public Health. 2021;14(10):1505-12. DOI: https://doi.org/10.1016/j.jiph.2021.08.010
Corcoran D. Manipulación de datos e investigación reproducible en R. 2018 [acceso 29/06/2022]. Disponible en: https://bookdown.org/content/3515/tidydata.html
ggpolt2. Disponible en: https://r-graph-gallery.com/ggplot2-package.html
Rodríguez Sánchez A, Rivero González LM, Soca Losano S. Análisis de sentimientos y tópicos sobre las vacunas cubanas Soberana 02 y Abdala en Twitter [preprint]. 2022 [acceso 29/06/2022]. Disponible en: https://github.com/luisdev98/sentimentAnalysis
Datareportal. Digital 2022: Cuba. 2022 [acceso 30/06/2022]. Disponible: https://datareportal.com/reports/digital-2022-cuba
Rodríguez-Orejuela A, Montes-Mora CL, Osorio-Andrade CF. Sentimientos hacia la vacunación contra la COVID-19: panorama colombiano en Twitter. Palabra Clave. 2022;25(1),e2514. DOI: https://doi.org/10.5294/pacla.2022.25.1.4
Arias García HL, Doria Pérez LC. Análisis de sentimientos sobre la percepción ciudadana de la vacunación del COVID-19 en Colombia. 2021 [acceso 30/06/2022]. Disponible en: http://repositorio.uan.edu.co/bitstream/123456789/5160/1/2021H%C3%A9ctorLeonardoAriasGarc%C3%ADa.pdf
Vallejo Cabrera PX. Análisis de sentimientos sobre la vacuna para COVID-19 en la red social “twitter” en el contexto ecuatoriano (tesis de Licenciatura). Ecuador: Universidad del Azuay; 2022 [acceso 30/06/2022]. Disponible en: https://dspace.uazuay.edu.ec/bitstream/datos/11709/1/17238.pdf
Rodríguez K, Haber Guerra Y, Fonseca Valido RA. Análisis discursivo de las vacunas anticovid-19 en Twitter. Question/Cuestión. 2021;70(3). DOI: https://doi.org/10.24215/16696581e624
Liu S, Liu J. Public attitudes toward COVID-19 vaccines on English-language Twitter: A sentiment analysis. Vaccine. 2021;39(39):5499-505. DOI: https://doi.org/10.1016/j.vaccine.2021.08.058
Povedano Álvarez D, Portela García-Miguel J, Armas Vega EA. Estudio de la percepción pública de la vacuna contra la COVID-19 mediante técnicas de PLN y de aprendizaje automático [Tesis de Maestría]. España: Facultad de Estadística, Universidad Complutense de Madrid; 2021 [acceso 01/07/2022]. Disponible: https://eprints.ucm.es/id/eprint/67617/1/daniel-povedano-estudio.pdf
Carrasco-Polaino R, Martin-Cárdaba MÁ, Villar-Cirujano E. Participación ciudadana en Twitter: Polémicas anti-vacunas en tiempos de COVID-19. Comunicar: Revista científica Iberoamericana de comunicación y educación. 2021;(69):21-31. DOI: https://doi.org/10.3916/C69-2021-02
Roe C, Lowe M, Williams B, Miller C. Public Perception of SARS-CoV-2 Vaccinations on Social Media: Questionnaire and Sentiment Analysis. Int J Environ Res Public Health. 2021 [acceso 01/07/2022];18(24):13028. DOI: https://doi.org/10.3390/ijerph182413028
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Aquellos autores que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cuál estará simultáneamente sujeto a la Licencia Atribución-NoComercial 4.0 Internacional (CC BY-NC 4.0) que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación esta revista.
- Los autores podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un repositorio institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores difundir su obra a través de Internet (p. ej.: en repositorios institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada. (Véase El efecto del acceso abierto). En ese caso, solicitamos que en la cabecera del manuscrito se indique:"Esta es una versión preprint enviada a la Revista Cubana de Información en Ciencias de la Salud http://rcics.sld.cu/"
ENGLISH VERSION
AUTHORS WITH PUBLICATIONS IN THIS JOURNAL ACCEPT THE FOLLOWING TERMS:
- Authors will retain their copyright and will grant the Journal the right of first publication of their work, which will also be subject to a Creative Commons License Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) allowing third parties to share the work as long as the author's name and data about initial publication in this Journal are stated.
- Authors may adopt other license agreements for non-exclusive distribution of the version of the work published (e.g. deposit it in an institutional repository or publish it in a monographic volume), as long as initial publication in this Journal is indicated.
- It is permitted and recommended for authors to disseminate their work on the Internet (e.g. in institutional repositories or their web page) before and during the submission process, which may result in interesting exchanges and increase the number of citations of the published work) (see The effect of open access).