Machine learning y aprendizaje por refuerzo | 1938

Introducción al aprendizaje por refuerzo

Estados, acciones, políticas, recompensas y valor.

Soluciones tabulares

Windy Gridworld y métodos tabulares.

Deep reinforcement learning

Lunar Lander y aproximación con redes.

Google Research Football

Entorno de fútbol para agentes de refuerzo.

MuZero

Aprendizaje por refuerzo y planificación.