Electoral prediction using a hybrid model based on sentimental analysis: presidential elections in Colombia
Date
Asesores
Journal Title
Journal ISSN
Volume Title
Publisher
Politécnico Colombiano Jaime Isaza Cadavid
Date
2019-12-18
Abstract
Description
In Colombia, social networks have become a powerful tool to disseminate political opinions, especially during the campaign period in the national presidential elections. This paper proposes a hybrid model to predict the outcome of the first round of presidential elections in Colombia in 2018, which aims to minimize absolute error and improve the quality of the final prediction. User activities on Twitter and Facebook were recorded and analyzed with artificial intelligence algorithms, resulting in an accurate prediction consistent with reality. As a core result is highlighted that the RMSE of the hybrid model is around 2.47%, surpassing on average the RMSE of the country's most prominent traditional polling firms. Additionally, the value of electoral abstentionism was also predicted with a differential error of 1.72% in relation to the real value, demonstrating the reliability of the proposed methodology.En Colombia, las redes sociales se han convertido en una poderosa herramienta para expresar opiniones políticas, especialmente durante el período de campaña en las elecciones presidenciales. Este trabajo propone un modelo híbrido para predecir el desenlace de la primera vuelta en las elecciones presidenciales de Colombia en 2018 cuyo objetivo es minimizar el error absoluto y mejorar la calidad de la predicción final. Para ello, las actividades de los usuarios en Twitter y Facebook fueron registradas y analizadas mediante algoritmos de inteligencia artificial, obteniendo como resultado una predicción precisa y coherente con la realidad. Como resultados principales se destaca que el RMSE del modelo híbrido propuesto ronda el 2,47%, superando en promedio el RMSE de las firmas encuestadoras tradicionales más prominentes del país. Adicionalmente también se predijo el valor del abstencionismo electoral con un error diferencial de 1,72% con respecto al valor real, demostrando la confiabilidad de la metodología propuesta.
La disponibilidad de los medios digitales ha proporcionado una poderosa herramienta para expresar opiniones incluyendo aspectos sociales y políticos desarrollados en cada región. En Colombia, el uso de redes sociales ha dado lugar a la difusión masiva de opiniones políticas, especialmente durante el período de campaña en las elecciones presidenciales nacionales. Este trabajo propone un modelo híbrido para predecir el desenlace de la primera vuelta en las elecciones presidenciales de Colombia en 2018 (pre-hoc), cuyo objetivo es minimizar el error absoluto y mejorar la calidad de la predicción final. Las actividades de los usuarios en Twitter y Facebook fueron registradas y analizadas, obteniendo como resultado una predicción precisa y coherente con la realidad, donde el RMSE del modelo híbrido ronda el 2,47%, superando en promedio el RMSE de las firmas encuestadoras tradicionales más prominentes del país. Adicionalmente también se predijo el valor del abstencionismo electoral con un error diferencial de 1,72% con respecto al valor real, demostrando la confiabilidad de la metodología propuesta.In Colombia, social networks have become a powerful tool to disseminate political opinions, especially during the campaign period in the national presidential elections. This paper proposes a hybrid model to predict the outcome of the first round of presidential elections in Colombia in 2018, which aims to minimize absolute error and improve the quality of the final prediction. User activities on Twitter and Facebook were recorded and analyzed with artificial intelligence algorithms, resulting in an accurate prediction consistent with reality. As a core result is highlighted that the RMSE of the hybrid model is around 2.47%, surpassing on average the RMSE of the country's most prominent traditional polling firms. Additionally, the value of electoral abstentionism was also predicted with a differential error of 1.72% in relation to the real value, demonstrating the reliability of the proposed methodology.
La disponibilidad de los medios digitales ha proporcionado una poderosa herramienta para expresar opiniones incluyendo aspectos sociales y políticos desarrollados en cada región. En Colombia, el uso de redes sociales ha dado lugar a la difusión masiva de opiniones políticas, especialmente durante el período de campaña en las elecciones presidenciales nacionales. Este trabajo propone un modelo híbrido para predecir el desenlace de la primera vuelta en las elecciones presidenciales de Colombia en 2018 (pre-hoc), cuyo objetivo es minimizar el error absoluto y mejorar la calidad de la predicción final. Las actividades de los usuarios en Twitter y Facebook fueron registradas y analizadas, obteniendo como resultado una predicción precisa y coherente con la realidad, donde el RMSE del modelo híbrido ronda el 2,47%, superando en promedio el RMSE de las firmas encuestadoras tradicionales más prominentes del país. Adicionalmente también se predijo el valor del abstencionismo electoral con un error diferencial de 1,72% con respecto al valor real, demostrando la confiabilidad de la metodología propuesta.In Colombia, social networks have become a powerful tool to disseminate political opinions, especially during the campaign period in the national presidential elections. This paper proposes a hybrid model to predict the outcome of the first round of presidential elections in Colombia in 2018, which aims to minimize absolute error and improve the quality of the final prediction. User activities on Twitter and Facebook were recorded and analyzed with artificial intelligence algorithms, resulting in an accurate prediction consistent with reality. As a core result is highlighted that the RMSE of the hybrid model is around 2.47%, surpassing on average the RMSE of the country's most prominent traditional polling firms. Additionally, the value of electoral abstentionism was also predicted with a differential error of 1.72% in relation to the real value, demonstrating the reliability of the proposed methodology.
Titulo del recurso fuente
Keywords
PLN, análisis sentimental, resultados electorales, inteligencia artificial, predicción, PLN, análisis sentimental, resultados electorales, inteligencia artificial, predicción