Poste de recherche
Les algorithmes d'apprentissage par renforcement (RL) traitent généralement de la maximisation du rendement cumulatif attendu (actualisé ou non actualisé, à horizon fini ou infini). Cependant, plusieurs applications cruciales dans le monde réel, comme la découverte de médicaments, ne s'inscrivent pas dans ce cadre, car un agent d'apprentissage par renforcement doit seulement identifier les états (molécules) qui obtiennent la récompense la plus élevée dans une trajectoire et n'a pas besoin d'optimiser le rendement cumulatif attendu. Dans ce travail, nous formulons une fonction objectif pour maximiser la récompense maximale attendue le long d'une trajectoire, nous dérivons une nouvelle forme fonctionnelle de l'équation de Bellman, nous introduisons les opérateurs de Bellman correspondants et nous fournissons une preuve de convergence. En utilisant cette formulation, nous obtenons des résultats de pointe sur la tâche de génération de molécules qui imite un pipeline de découverte de médicaments du monde réel.
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
31 janvier 2023
Poste de recherche
20 janvier 2023
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.