Semaine : 20 March - 26 March | Theory and Methods for Reinforcement Learning | Moodle

Accueil Calendrier

Résumé de section

- Sélectionner l’activité Lecture 5
  
  Lecture 5 Fichier
  
  Policy gradient methods II: NPG, Sample Based NPG, TRPO, exploration in policy gradients
- Sélectionner l’activité Dynamic Programming Notebook
  
  Dynamic Programming Notebook Fichier
  
  Exercises on Value Iteration, Policy Iteration, Modified Policy Iteration and Q Learning

Contact
EPFL CH-1015 Lausanne
+41 21 693 11 11

Suivre les pulsations de l'EPFL sur les réseaux sociaux

© 2023 EPFL, tous droits réservés