Cartelera de Tesis de Licenciatura

01/07/2024

Modelos de lenguaje como estimadores de los movimientos oculares durante la lectura

Juan Esteban Kamienkowski

Filiación: ICC, UBA-CONICET; DC, FCEyN, UBA (FCEN)

Palabras clave: Modelos de Lenguaje, Lectura, Movimientos Oculares, Modelos Lineales Mixtos

Resumen

Existe una vasta literatura que respalda la hipótesis de que los movimientos oculares durante la lectura reflejan procesos cognitivos. Por ejemplo, las palabras fuera de contexto, poco frecuentes o nuevas, requieren más tiempo de lectura. En paralelo, los modelos de lenguaje actuales pueden predecir la próxima palabra en un texto, y se ha investigado su capacidad para predecir atributos de los movimientos oculares, como la duración de la fijación.
El objetivo de esta investigación es analizar cómo distintas variables textuales predicen atributos de los movimientos oculares, utilizando modelos computacionales como N-gram, Word2Vec, FastText, y GPT-2. También se estudiarán efectos simples como la repetición de palabras y su posición en el texto. Los análisis se realizarán con modelos lineales mixtos y modelos aditivos generales.
Los datos provienen de un experimento de lectura de cuentos cortos con 76 estudiantes, resultando en 1018 ensayos con aproximadamente 800 palabras cada uno. Los datos están curados y el código para calcular medidas clásicas ya está disponible.

Descripción de la propuesta

—

Conocimientos deseables

Si lx estudiante cursó materias optativas como Procesamiento de Lenguaje Natural, Aprendizaje Automático, entre otras mejor, si no lo veremos durante la tesis. No se requieren conocimientos específicos.

Qué aprenderá el o la estudiante

Lx estudiante aprenderá a trabajar con datos de comportamiento humano (movimientos oculares) reales, modelos de lenguaje y embeddings de palabras, y modelos lineales mixtos. Además, se acercará a contenidos relacionados a aspectos cognitivos de la lectura.

Descargar propuesta (PDF)