Name: Institut d'intelligence artificielle de l'Alberta (Amii)
Address: 2nd Floor, 10065 Jasper Ave, Edmonton, Alberta, T5J 3B1, Canada

Recherche en 1 minute : Gautham Vasan, Deep Policy Gradient Methods without Batch Updates, Target Networks, or Replay Buffers (Méthodes de gradient de politique profonde sans mises à jour par lots, réseaux cibles ou tampons de relecture)

Publié

29 novembre 2024