Riproduzione automatica
Completamento automatico
Lezione precedente
Completa e continua
Reinforcement Learning e metodi Model-free (parte 2)
Reinforcement Learning
Model-free Prediction (65:19)
Monte Carlo Prediction: Blackjack Example (40:15)
Temporal-Difference Prediction (75:36)
Example: Random Walk (60:00)
n-step TD Prediction (42:40)
Esercitazione: Reinforcement Learning Prediction (19:54)
Model-Free Control
On-Policy MC Control (76:57)
On-policy TD Control (72:25)
Off-policy Prediction & Control (96:20)
Esercitazione: Addestramento di un agente (16:38)
Teach online with
n-step TD Prediction
Contenuto della lezione bloccato
Se sei giĆ iscritto,
devi effettuare il login
.
Iscriviti a Corso per sbloccarlo