Riproduzione automatica
Completamento automatico
HTML5
Flash
Player
velocitÃ
Lezione precedente
Completa e continua
Reinforcement Learning e metodi Model-free (parte 2)
Reinforcement Learning
Model-free Prediction (65:19)
Monte Carlo Prediction: Blackjack Exemple (40:15)
Temporal-Difference Prediction (75:36)
Example: Random Walk (60:00)
n-step TD Prediction (42:40)
Model-Free Control
On-Policy MC Control (76:57)
On-policy TD Control (72:25)
Off-policy Prediction & Control (96:20)
Final Project
Final Project (13:18)
Monte Carlo Prediction: Blackjack Exemple
Contenuto della lezione bloccato
Se sei già iscritto,
devi effettuare il login
.
Iscriviti a Corso per sbloccarlo