Poste de recherche

Vers l'apprentissage par renforcement dans le cadre de la formation continue

Résumé :

De nombreux problèmes de prise de décision séquentielle peuvent être naturellement formulés comme des tâches continues dans lesquelles l'interaction agent-environnement se poursuit indéfiniment sans limite. Dans cet article, nous présentons l'état de la recherche dans le cadre de la continuité. Nous retraçons les principaux résultats des deux manières alternatives de formuler un problème continu - les formulations à prix réduit et à récompense moyenne. Contrairement au cas épisodique, les méthodes d'apprentissage par renforcement (RL) pour le cadre continu ne sont pas bien comprises, théoriquement ou empiriquement. Nous constatons que la recherche sur l'apprentissage par renforcement manque d'une collection de domaines continus faciles à utiliser qui pourraient nous aider à mieux comprendre le problème et ses méthodes de résolution. Afin de stimuler la recherche sur les méthodes de résolution de problèmes pour le cadre continu, nous avons finalement esquissé un ensemble préliminaire de domaines continus que nous appelons C-suite.

Cet article est présenté à la conférence Never-Ending Reinforcement Learning (NERL) dans le cadre de la 2021e Conférence internationale sur les représentations d'apprentissage (ICLR).

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !