Análisis automático de sentimiento en tuits de política de Honduras

Nicole Rodríguez Alcántara; Angella Falck Durán; Sergio Antonio Suazo Barahona

Vol. 11 Núm. 3 (2022), Artículos originales

Vol. 11 Núm. 3 (2022)

Análisis automático de sentimiento en tuits de política de Honduras

Artículos originales

Publicado 2022-12-08

Nicole Rodríguez Alcántara⁺⁻
Angella Falck Durán⁺⁻
Sergio Antonio Suazo Barahona⁺⁻

Nicole Rodríguez Alcántara

Facultad de Ingeniería, Universidad Tecnológica Centroamericana, UNITEC, San Pedro Sula, Honduras

Angella Falck Durán

Facultad de Ingeniería, Universidad Tecnológica Centroamericana, UNITEC, San Pedro Sula, Honduras

Sergio Antonio Suazo Barahona

Facultad de Ingeniería, Universidad Tecnológica Centroamericana, UNITEC, Tegucigalpa, Honduras

HTML

PDF

Palabras clave

Análisis de sentimiento
Aprendizaje de maquina supervisado
Política de Honduras
Procesamiento de lenguaje natural
Twitter

Cómo citar

Rodríguez Alcántara, N., Falck Durán, A., & Suazo Barahona, S. A. (2022). Análisis automático de sentimiento en tuits de política de Honduras. Innovare Revista De Ciencia Y tecnología, 11(3), 158–165. Recuperado a partir de https://revistas.unitec.edu/innovare/article/view/243

Resumen

Introducción. Twitter se ha convertido en un medio de expresión política ciudadana, transmitiendo sentimientos y opiniones de los usuarios mediante tuits. Analizar estos datos permite conocer tendencias y puntos de inflexión en los criterios políticos. El objetivo del estudio fue desarrollar un proceso de análisis automático de sentimiento en tuits de política de Honduras, mediante técnicas de aprendizaje de máquina supervisado. Métodos. Se efectuó una recolección de 1,800 tuits de política hondureña mediante filtros basados en usuarios y hashtags en un periodo de enero a septiembre de 2022, seguido de un etiquetado manual de tuits. Se aplicaron las técnicas de procesamiento de lenguaje natural: Bolsa de Palabras (BOW, siglas en inglés) y frecuencia de término-frecuencia inversa de documento (TF-IDF, siglas en inglés). Los métodos considerados fueron SVM lineal, regresión logística y Naive Bayes multinomial (MNB). Las métricas de rendimiento para la comparación de clasificadores fueron el valor-F (F1), la exactitud y los tiempos de entrenamiento y de validación. Resultados. El modelo seleccionado fue el MNB por su mayor frecuencia de término (F1) (62.48%) y menor tiempo de entrenamiento. Mientras que SVM lineal obtuvo 61.80% y regresión logística 61.34%. El rendimiento final del MNB con tuits nuevos fue de 63.37% de F1. Conclusión. Para el conjunto de datos presentado, se obtuvo que el mejor clasificador fue MNB. Sin embargo, la brecha de rendimiento entre clasificadores es reducida, lo que implica que optimizaciones de preprocesamiento y debe considerarse una colección de datos a mayor escala.

HTML

PDF

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.

Descargas

Los datos de descargas todavía no están disponibles.

Análisis automático de sentimiento en tuits de política de Honduras

Palabras clave

Cómo citar

Descargar cita

Resumen

Descargas