Poste de recherche
La complexité des échantillons des techniques d'apprentissage par renforcement (RL) représente toujours un défi pour l'extension du RL à des domaines non résolus. Une façon de pallier ce problème est de tirer parti d'échantillons de la politique d'un démonstrateur pour apprendre plus rapidement. Cependant, les conseils sont normalement limités, donc les conseils devraient idéalement être dirigés vers les états où l'agent est incertain sur la meilleure action à appliquer. Dans ce travail, nous proposons le Requesting Confidence-Moderated Policy advice (RCMP), un cadre de conseil d'action où l'agent demande des conseils lorsque son incertitude est élevée. Nous décrivons une technique pour estimer l'incertitude de l'agent avec des modifications mineures dans les méthodes RL standard basées sur la valeur. Nous montrons que RCMP est plus performant que plusieurs modèles de base dans le domaine Atari Pong.
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
31 janvier 2023
Poste de recherche
20 janvier 2023
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.