Poste de recherche
Les algorithmes emphatiques sont des algorithmes d'apprentissage par différence temporelle qui modifient leur distribution d'état effective en accentuant et en désaccentuant sélectivement leurs mises à jour à différents pas de temps. Les travaux récents de Sutton, Mahmood et White (2015), et de Yu (2015) montrent qu'en faisant varier l'emphase d'une manière particulière, ces algorithmes deviennent stables et convergents dans le cadre d'un apprentissage hors politique avec approximation de fonction linéaire. Cet article sert de résumé unifié des résultats disponibles de ces deux travaux. En outre, nous démontrons les avantages empiriques de la flexibilité des algorithmes emphatiques, y compris l'actualisation dépendante de l'état, le bootstrapping dépendant de l'état, et l'allocation des ressources d'approximation de fonction spécifiée par l'utilisateur.
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
31 janvier 2023
Poste de recherche
20 janvier 2023
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.