Poste de recherche
L'apprentissage par renforcement basé sur un modèle (MBRL) peut améliorer de manière significative l'efficacité de l'échantillonnage, notamment en choisissant soigneusement les états à partir desquels échantillonner les transitions hypothétiques. Il a été démontré empiriquement qu'une telle hiérarchisation est utile à la fois pour le rejeu d'expérience (ER) et la planification de type Dyna. Cependant, il y a encore peu de compréhension théorique en RL sur ces stratégies de priorisation, et pourquoi elles sont utiles. Dans ce travail, nous revisitons l'ER priorisé et, dans un cadre idéal, nous montrons une équivalence avec la minimisation de la perte cubique, ce qui donne un aperçu théorique de la raison pour laquelle cette stratégie est meilleure que l'échantillonnage uniforme. Ce cadre idéal ne peut toutefois pas être réalisé en pratique, en raison d'une couverture insuffisante de l'espace d'échantillonnage et de priorités obsolètes des échantillons d'entraînement. C'est ce qui motive notre approche basée sur un modèle, qui ne souffre pas de ces limitations. Notre idée principale est de rechercher activement les états de haute priorité en utilisant l'ascension du gradient. Sous certaines conditions, nous prouvons que la distribution des expériences hypothétiques générées à partir de ces états fournit un ensemble diversifié d'états, échantillonnés proportionnellement aux priorités approximativement vraies. Nos expériences dans des domaines de référence et d'application montrent que notre approche obtient des performances supérieures à la fois à la méthode ER priorisée sans modèle et à plusieurs autres méthodes de base basées sur des modèles.
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
31 janvier 2023
Poste de recherche
20 janvier 2023
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.