Resumen. El uso del aprendizaje por refuerzo, también conocido como Reinforcement Learning (RL), cuenta con la capacidad de optimizar métricas a largo plazo, a diferencia de técnicas tradicionales de Machine Learning. Sin embargo, en el caso de recomendaciones de contenido (e.g., recomendaciones de películas de Netflix), donde el espacio de posibles acciones es muy grande, se suelen hacer restricciones en qué se recomienda para reducir el tamaño de dicho espacio. Este estudio propone investigar una nueva representación de los agentes de RL donde, en lugar de limitar el espacio de acciones, se limita el espacio de distribución que puede ser representada sobre todas las acciones.
Palabras clave. Machine Learning, Reinforcement Learning, Recommender Systems, Learning to Rank
Conocimientos deseables. Estadística, Reinforcement Learning, Machine Learning, Python, PyTorch
¿Qué podría aprender quien realice esta tesis? – El estudiante aprenderá técnicas de recomendaciones usadas actualmente en la industria y sus limitaciones. Habrá un énfasis en las técnicas basadas en reinforcement learning.
Dirección de la tesis
Garcia, Francisco
Roku | Search and Recommendations
Contacto: fmaxgarcia@gmail.com