Poste de recherche

TAC : Towered Actor Critic pour le traitement des types d'action multiples dans l'apprentissage par renforcement pour la découverte de médicaments

Résumé

L'apprentissage par renforcement (RL) a fait des progrès considérables dans les domaines abstraits et réels, mais la majorité des algorithmes de pointe ne traitent que des actions monotones. Cependant, certaines applications exigent que les agents raisonnent sur différents types d'actions. Notre application simule la génération de molécules par réaction, utilisée dans le cadre du processus de découverte de médicaments, et comprend des réactions unimoléculaires et bimoléculaires. Cet article présente un nouveau cadre, \emph{towered actor critic}. (TAC), pour gérer de multiples types d'actions. Le cadre TAC est général dans le sens où il est conçu pour être combiné avec n'importe quel algorithme RL existant pour un espace d'action continu. Nous le combinons avec TD3 pour obtenir empiriquement de bien meilleurs résultats que les méthodes existantes dans le cadre de la découverte de médicaments. TAC est également appliqué à des benchmarks RL dans OpenAI Gym et les résultats montrent que notre cadre peut améliorer, ou du moins ne pas nuire, aux performances par rapport à TD3 standard.

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !