Rupam Mahmood développe des algorithmes d'apprentissage par renforcement et des systèmes d'apprentissage en temps réel pour le contrôle des robots physiques.

Améliorer continuellement l'esprit des robots

Rupam Mahmood développe des algorithmes d'apprentissage par renforcement et des systèmes d'apprentissage en temps réel pour le contrôle des robots physiques. Ses recherches se concentrent sur le développement de mécanismes généraux et constructifs pour améliorer continuellement l'esprit des robots. Actuellement, il travaille sur deux programmes à long terme composés de plusieurs projets à court terme : un système d'apprentissage par renforcement simple et général pour le contrôle des robots, et des mécanismes constructifs fondamentaux pour des agents en apprentissage continu. Dans le cadre du premier programme, Rupam et son équipe travaillent au développement d'un système d'apprentissage par renforcement qui peut être facilement déployé dans de nombreux robots différents pour résoudre diverses tâches. Dans le cadre du second programme, ses équipes de recherche développent et analysent des algorithmes d'apprentissage de politiques et de représentations dans une configuration d'apprentissage continu, dans laquelle l'agent est censé subir une série de changements dans l'environnement et les tâches. Grâce à ces deux programmes, Rupam cherche à développer un système permettant la compréhension scientifique ainsi que l'adoption industrielle à grande échelle de la robotique en analysant et en corrigeant les lacunes des méthodes actuelles d'apprentissage des politiques et des représentations.

Rupam est boursier et titulaire de la chaire d'IA du Canada CIFAR à l'Amii et professeur au département d'informatique de l'Université de l'Alberta. En 2017, il a obtenu son doctorat en apprentissage statistique des machines à l'Université de l'Alberta sous la supervision de Richard S. Sutton (Amii Fellow, conseiller scientifique en chef et pionnier de l'apprentissage par renforcement), sa thèse portant sur les algorithmes incrémentaux d'apprentissage par renforcement hors politique. Auparavant, Rupam a été chercheur, puis responsable de la recherche en IA chez Kindred Inc. où il est aujourd'hui conseiller scientifique. Il est rédacteur en chef adjoint de la conférence internationale IEEE/RJS sur les robots et systèmes intelligents (IROS) et membre du comité de programme principal de la conférence internationale conjointe sur l'intelligence artificielle (IJCAI). Rupam a produit un logiciel qui fournit un cadre de calcul et une suite de tâches de référence pour le développement et l'évaluation de méthodes d'apprentissage par renforcement avec des robots physiques.

Rupam a produit un logiciel qui fournit un cadre de calcul et une suite de tâches de référence pour développer et évaluer les méthodes d'apprentissage par renforcement avec des robots physiques.

Rupam Mahmood

Affiliations académiques

Affiliations à l'industrie et à la recherche

Focus

Rupam Mahmood développe des algorithmes d'apprentissage par renforcement et des systèmes d'apprentissage en temps réel pour le contrôle des robots physiques.

Améliorer continuellement l'esprit des robots

Rupam a produit un logiciel qui fournit un cadre de calcul et une suite de tâches de référence pour développer et évaluer les méthodes d'apprentissage par renforcement avec des robots physiques.

Site web personnel

Google Scholar

Laboratoire RLAI

Laboratoire de vision par ordinateur et de robotique

Dernières nouvelles

Restez informé

Solutions pour les entreprises

Cours et alphabétisation

Recherche et talents

À propos d'Amii

S'impliquer

Rupam Mahmood

Affiliations académiques

Affiliations à l'industrie et à la recherche

Focus

Rupam Mahmood développe des algorithmes d'apprentissage par renforcement et des systèmes d'apprentissage en temps réel pour le contrôle des robots physiques.

Améliorer continuellement l'esprit des robots

Rupam a produit un logiciel qui fournit un cadre de calcul et une suite de tâches de référence pour développer et évaluer les méthodes d'apprentissage par renforcement avec des robots physiques.

Liens connexes

Site web personnel

Google Scholar

Laboratoire RLAI

Laboratoire de vision par ordinateur et de robotique

Dernières nouvelles

Restez informé

Restez informé