25/09/2023
Abordando el espacio combinatorio en recomendaciones de ranking mediante la descomposición de acciones en reinforcement learning
Francisco Garcia
Resumen
El uso del aprendizaje por refuerzo, también conocido como Reinforcement Learning (RL), cuenta con la capacidad de optimizar métricas a largo plazo, a diferencia de técnicas tradicionales de Machine Learning. Sin embargo, en el caso de recomendaciones de contenido (e.g., recomendaciones de películas de Netflix), donde el espacio de posibles acciones es muy grande, se suelen hacer restricciones en qué se recomienda para reducir el tamaño de dicho espacio.
Este estudio propone investigar una nueva representación de los agentes de RL donde, en lugar de limitar el espacio de acciones, se limita el espacio de distribución que puede ser representada sobre todas las acciones.
Descripción de la propuesta
—
Conocimientos deseables
Estadística, Reinforcement Learning, Machine Learning, Python, PyTorch
Qué aprenderá el o la estudiante
El estudiante aprenderá técnicas de recomendaciones usadas actualmente en la industria y sus limitaciones. Habrá un énfasis en las técnicas basadas en reinforcement learning.