Introducción al aprendizaje por refuerzo
Estados, acciones, políticas, recompensas y valor.
Hub temático
Ruta para conectar ciencia de datos, aprendizaje por refuerzo, entornos de simulación y prácticas de análisis con ejemplos reproducibles.
Empieza por la introducción al aprendizaje por refuerzo para entender estados, acciones y recompensas.
Después avanza hacia soluciones tabulares, aproximadas y entornos como Google Research Football o MuZero.
Estados, acciones, políticas, recompensas y valor.
Windy Gridworld y métodos tabulares.
Lunar Lander y aproximación con redes.
Entorno de fútbol para agentes de refuerzo.
Aprendizaje por refuerzo y planificación.