Educational data mining: analysis of the engineering students performance in saber-pro test
Date
Asesores
Journal Title
Journal ISSN
Volume Title
Publisher
Politécnico Colombiano Jaime Isaza Cadavid
Date
2019-07-31
Abstract
Description
In Colombia, the Saber-Pro test has been created to support the evaluation and improvement of higher education in the country. This article, applies the CRISP-DM data mining methodology to perform a study of the results obtained in the Saber-Pro tests of engineering students in Antioquia (Colombia). Three analytical models are developed from 108 academic, economic and socio-demographic variables: 1) clustering about student types, 2) selection of the most influential factors in the results of the tests, and 3) prediction of performance in the tests from the selected factors. As a result, the most influential variables on the test result are: the number of dependents, teaching method, if the home is permanent, the academic character of the institution and economic facilities such as micro-gas oven and motorcycle.En Colombia, las pruebas de Estado Saber-Pro han sido diseñadas para apoyar la evaluación y el mejoramiento de la educación superior en el país. Aplicando la metodología de minería de datos CRISP-DM, se realiza un estudio de los resultados obtenidos en las pruebas Saber-Pro de estudiantes de ingeniería en Antioquia (Colombia). A partir de 108 variables académicas, económicas y socio demográficas se realizan 3 modelos analíticos: 1) agrupación de los tipos de estudiantes, 2) selección de los factores que más influyen en el desempeño de las pruebas, y 3) predicción del desempeño en las pruebas a partir de las variables seleccionadas. Como resultado se encuentra que algunas de las variables más influyentes sobre el resultado de las pruebas son: el número de personas a cargo, método de enseñanza, si el hogar es permanente, el carácter académico de la institución y facilidades económicas como tener horno micro gas y motocicleta.
En Colombia, las pruebas de Estado Saber-Pro han sido diseñadas para apoyar la evaluación y el mejoramiento de la educación superior en el país. Aplicando la metodología de minería de datos CRISP-DM, se realiza un estudio de los resultados obtenidos en las pruebas Saber-Pro de estudiantes de ingeniería en Antioquia (Colombia). A partir de 108 variables académicas, económicas y socio demográficas se realizan 3 modelos analíticos: 1) agrupación de los tipos de estudiantes, 2) selección de los factores que más influyen en el desempeño de las pruebas, y 3) predicción del desempeño en las pruebas a partir de las variables seleccionadas. Como resultado se encuentra que algunas de las variables más influyentes sobre el resultado de las pruebas son: el número de personas a cargo, método de enseñanza, si el hogar es permanente, el carácter académico de la institución y facilidades económicas como tener horno micro gas y motocicleta.In Colombia, the Saber-Pro test has been created to support the evaluation and improvement of higher education in the country. This article, applies the CRISP-DM data mining methodology to perform a study of the results obtained in the Saber-Pro tests of engineering students in Antioquia (Colombia). Three analytical models are developed from 108 academic, economic and socio-demographic variables: 1) clustering about student types, 2) selection of the most influential factors in the results of the tests, and 3) prediction of performance in the tests from the selected factors. As a result, the most influential variables on the test result are: the number of dependents, teaching method, if the home is permanent, the academic character of the institution and economic facilities such as micro-gas oven and motorcycle.
En Colombia, las pruebas de Estado Saber-Pro han sido diseñadas para apoyar la evaluación y el mejoramiento de la educación superior en el país. Aplicando la metodología de minería de datos CRISP-DM, se realiza un estudio de los resultados obtenidos en las pruebas Saber-Pro de estudiantes de ingeniería en Antioquia (Colombia). A partir de 108 variables académicas, económicas y socio demográficas se realizan 3 modelos analíticos: 1) agrupación de los tipos de estudiantes, 2) selección de los factores que más influyen en el desempeño de las pruebas, y 3) predicción del desempeño en las pruebas a partir de las variables seleccionadas. Como resultado se encuentra que algunas de las variables más influyentes sobre el resultado de las pruebas son: el número de personas a cargo, método de enseñanza, si el hogar es permanente, el carácter académico de la institución y facilidades económicas como tener horno micro gas y motocicleta.In Colombia, the Saber-Pro test has been created to support the evaluation and improvement of higher education in the country. This article, applies the CRISP-DM data mining methodology to perform a study of the results obtained in the Saber-Pro tests of engineering students in Antioquia (Colombia). Three analytical models are developed from 108 academic, economic and socio-demographic variables: 1) clustering about student types, 2) selection of the most influential factors in the results of the tests, and 3) prediction of performance in the tests from the selected factors. As a result, the most influential variables on the test result are: the number of dependents, teaching method, if the home is permanent, the academic character of the institution and economic facilities such as micro-gas oven and motorcycle.
Titulo del recurso fuente
Keywords
educational data mining, learning analytics, machine learning, Minería de datos educativos, analítica del aprendizaje, aprendizaje de máquinas