← Volver a las propuestas

25/09/2023

Abordando el espacio combinatorio en recomendaciones de ranking mediante la descomposición de acciones en reinforcement learning

Francisco Garcia

Filiación: Roku | Search and Recommendations
Palabras clave: Machine Learning, Reinforcement Learning, Recommender Systems, Learning to Rank

Resumen

El uso del aprendizaje por refuerzo, también conocido como Reinforcement Learning (RL), cuenta con la capacidad de optimizar métricas a largo plazo, a diferencia de técnicas tradicionales de Machine Learning. Sin embargo, en el caso de recomendaciones de contenido (e.g., recomendaciones de películas de Netflix), donde el espacio de posibles acciones es muy grande, se suelen hacer restricciones en qué se recomienda para reducir el tamaño de dicho espacio.
Este estudio propone investigar una nueva representación de los agentes de RL donde, en lugar de limitar el espacio de acciones, se limita el espacio de distribución que puede ser representada sobre todas las acciones.

Descripción de la propuesta

Conocimientos deseables

Estadística, Reinforcement Learning, Machine Learning, Python, PyTorch

Qué aprenderá el o la estudiante

El estudiante aprenderá técnicas de recomendaciones usadas actualmente en la industria y sus limitaciones. Habrá un énfasis en las técnicas basadas en reinforcement learning.

Descargar propuesta (PDF)