Tesista: Sol Anabella Calloni
Director: Mtr. Martı́n Pustilnik
Codirector: Dr. Guillermo Durán
Resumen.
En promedio, 19.96 % de los inscriptos al Ciclo Básico Común (CBC) en la Facultad de Ciencias Exactas y Naturales (FCEN) de la Universidad de Buenos Aires (UBA) egresan, mientras que en el Sistema Universitario Argentino egresa el 23.06 %. Entendemos que el abandono estudiantil es, tal vez, el factor individual más importante que explica estos porcentajes de egreso. Con el fin de enfocarse en la emisión de alertas tempranas en lugar de identificar un “abandono definitivo”, se definió un umbral de nivel de actividad de los estudiantes por semestre a partir del cual se los considera en “riesgo de abandono”. Entre las acciones para prevenir el abandono estudiantil, la FCEN realiza encuestas a ingresantes desde 2002, inicialmente en papel y, a partir de 2023, en formato digital con identificación nominal, lo que permite vincular las respuestas con datos del CBC y de las carreras. Estas encuestas sustentan un sistema de tutorías dentro del programa +Acompañamiento 1 . Asimismo, desde 2009, la FCEN cuenta con el “Programa Ingresantes CBC Exactas”, que ofrece una Charla de Bienvenida, un Curso Previo de Matemática (CPM) y tutorı́as docentes para estudiantes del CBC de las carreras de la facultad. En este trabajo implementamos modelos de Aprendizaje Automático basados en los datos del Sistema de Información Universitaria Guaranı́ (SIU-Guaraní) del Ciclo Básico Común (CBC) y del SIU-Guaraní del FCEN, con la perspectiva teórica de autores de referencia y la de otros actores de la misma universidad. Una vez entrenados, son capaces de detectar estudiantes con alto riesgo de abandono, a la vez que permiten indagar en algunos de los motivos subyacentes. Se realizó una investigación bibliográfica de los modelos empleados hasta la fecha, haciendo foco en aquellos que utilizaran Aprendizaje Automático. Luego, se desarrollaron modelos que proporcionan alertas tempranas de abandono en el contexto del FCEN, para poder intervenir y asistir a las personas antes de que abandonen. Se encontraron variables cuyo abandono condicional era significativamente distinto al abandono poblacional, por lo que se las podría utilizar para mejorar futuros modelos. Se utilizaron métricas como Exactitud, área bajo la curva ROC (AUC ROC) y Exactitud Balanceada para medir el rendimiento de los modelos, alcanzando 0.845 de Exactitud Balanceada para el mejor de ellos.
Palabras clave: “Aprendizaje Automático”, “Random Forest”, “Riesgo de abandono”, “Alerta temprana de riesgo de abandono”
Buenos Aires, 2025