Poste de recherche
De nombreux problèmes de prise de décision séquentielle peuvent être naturellement formulés comme des tâches continues dans lesquelles l'interaction agent-environnement se poursuit indéfiniment sans limite. Dans cet article, nous présentons l'état de la recherche dans le cadre de la continuité. Nous retraçons les principaux résultats des deux manières alternatives de formuler un problème continu - les formulations à prix réduit et à récompense moyenne. Contrairement au cas épisodique, les méthodes d'apprentissage par renforcement (RL) pour le cadre continu ne sont pas bien comprises, théoriquement ou empiriquement. Nous constatons que la recherche sur l'apprentissage par renforcement manque d'une collection de domaines continus faciles à utiliser qui pourraient nous aider à mieux comprendre le problème et ses méthodes de résolution. Afin de stimuler la recherche sur les méthodes de résolution de problèmes pour le cadre continu, nous avons finalement esquissé un ensemble préliminaire de domaines continus que nous appelons C-suite.
Cet article est présenté à la conférence Never-Ending Reinforcement Learning (NERL) dans le cadre de la 2021e Conférence internationale sur les représentations d'apprentissage (ICLR).
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
31 janvier 2023
Poste de recherche
20 janvier 2023
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.