Investigadores de un par de Universidades de los EE.UU. señalan que los algoritmos de aprendizaje automático podrían ayudar a predecir el desempeño de los estudiantes en clases introductorias de física.

Algunos investigadores afiliados a la Universidad West Virginia y la Universidad Politécnica del Estado de California han desarrollado un nuevo proyecto que lleva como función el investigar el uso de algoritmos de aprendizaje automático para  la localización de riesgos en los estudiantes durante las clases introductorias de física.

Aprendizaje automático como método de predicción

Según un estudio el 40% de los estudiantes que quiere iniciar una carrera universitaria para las especialidades de ciencia, tecnología, ingeniería y matemáticas (STEM – por sus siglas en inglés) los cursos de física y otras ciencias básicas forman obstáculos al principio de sus carreras universitarias, causando que estos cambien de carrera o no obtengan el título.

En este sentido, los investigadores utilizaron un bosque aleatorio, una denominación que en el aprendizaje automático se le acuña a un método de conjunto que construye una multitud de árboles de decisión y genera una predicción media de los árboles individuales, para predecir el desempeño de los estudiantes.

De acuerdo con la fuente, los investigadores utilizando como base trabajos anteriores valiéndose de puntajes de ACT, GPA universitario y datos recopilados dentro de una clase de física –como calificaciones de tareas y puntajes de exámenes– para predecir si un estudiante recibiría una calificación de A o B en el primer y segundo semestre.

Variedad en las universidades y períodos de tiempo 

Para ello, se valieron de muestras que provienen de clases introductorias de física basadas en el cálculo en dos grandes instituciones académicas orientales, escogiendo varias muestras, donde para la primera y segunda se recopiló información de los períodos (2000-2018) y (2016-2019) –incluyendo cambios curriculares durante los años académicos 2011 y 2015– donde se incluyeron principalmente estudiantes caucásicos (80%).

En el segundo, se reflejó el período del 2011 al 2015, mientras que el tercero abarcó solo el año 2017 y su población fue un 46% hispano y un 21% asiático, con estudiantes que tomaron una combinación de conferencias y clases de estilo de aprendizaje activo.

Para este análisis, se clasificaron los estudiantes en dos conjuntos, el primero de ellos, guarda relación con aquellos estudiantes que reciban una A, B o C, los cuales fueron denotados como estudiantes ABC, mientras que aquellos que reciban una calificación de D, F, o decidan retirarse (W), serán clasificados como estudiantes de DFW.

Algunas conclusiones

Durante el estudio, el algoritmo entrenado en la primera muestra predijo con un 16% de precisión a los estudiantes DFW, probablemente debido a la baja proporción de estudiantes DFW (12%) en el conjunto de entrenamiento, algo que los orientó a ajustar los modelos demográficamente.

Para la segunda muestra, los investigadores encontraron que el bosque aleatorio tuvo un rendimiento marginalmente mejor, ofreciendo un mejor comportamiento al limitar el alcance a un período de tres años, y al centrarse en una sola institución, en lugar de tomar una década como período y varias instituciones.

Una herramienta de apoyo 

Finalmente, los investigadores señalan que aunque de forma inevitable existe un sesgo histórico en las instituciones universitarias, este modelo ofrece un mejor desempeño, ya que con la primera muestra logró un 57% de precisión a nivel general.

Es por ello, que señalan que la clasificación de aprendizaje automático deberìa ser tomada como una herramienta de apoyo para los instructores de física, y no como un mètodo para excluir estudiantes de actividades educativas .