Poste de recherche
Il a été démontré que les tâches auxiliaires prédictives améliorent les performances dans de nombreux travaux sur l'apprentissage par renforcement, mais cet effet n'est pas encore bien compris. L'objectif principal du travail présenté ici est d'étudier l'impact de l'échelle de temps de prédiction d'une tâche auxiliaire sur la performance de la politique de l'agent. Nous considérons des tâches auxiliaires qui apprennent à faire des prédictions sur la politique en utilisant l'apprentissage par différence temporelle. Nous testons l'impact de l'échelle de temps de prédiction en utilisant une forme spécifique de tâche auxiliaire dans laquelle l'image d'entrée est utilisée comme cible de prédiction, que nous appelons autoencodeurs par différence temporelle (TD-AE). Nous évaluons empiriquement l'effet de TD-AE sur l'algorithme A2C dans l'environnement VizDoom en utilisant différentes échelles de temps de prédiction. Bien que nous n'observions pas de relation claire entre l'échelle de temps de prédiction et la performance, nous faisons les observations suivantes : 1) l'utilisation de tâches auxiliaires nous permet de réduire la longueur de la trajectoire de l'algorithme A2C, 2) dans certains cas, le TD-AE étendu temporellement donne de meilleurs résultats qu'un autoencodeur direct, 3) les performances avec les tâches auxiliaires sont sensibles au poids placé sur la perte auxiliaire, 4) malgré cette sensibilité, les tâches auxiliaires améliorent les performances sans réglage hyperparamétrique important. Nos conclusions générales sont que TD-AE augmente la robustesse de l'algorithme A2C à la longueur de la trajectoire et bien que prometteur, une étude plus approfondie est nécessaire pour comprendre pleinement la relation entre l'échelle de temps de prédiction des tâches auxiliaires et la performance de l'agent.
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
31 janvier 2023
Poste de recherche
20 janvier 2023
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.