Institut de l'intelligence artificielle de l'Alberta

Fellow et président de l'AI de l'ICAR au Canada

Marlos C. Machado

Affiliations académiques

Professeur adjoint - Université de l'Alberta (Informatique)

Focus

Intelligence artificielle ; apprentissage automatique ; apprentissage par renforcement ; apprentissage par représentation ; optimisation ; généralisation ; exploration ; applications dans le monde réel.

Marlos conçoit des algorithmes qui apprennent des abstractions pour améliorer l'attribution de crédits, la généralisation et l'exploration dans l'apprentissage par renforcement.

Représentation et apprentissage par renforcement

Dans le cadre de ses recherches, Marlos cherche à développer des méthodes d'apprentissage par renforcement qui peuvent être utilisées de manière significative dans des contextes réels. Il se concentre sur la conception d'algorithmes capables d'apprendre des abstractions qui permettent aux agents d'intelligence artificielle de s'attaquer aux trois problèmes fondamentaux de l'apprentissage par renforcement : la généralisation, l'exploration et l'attribution de crédits. Actuellement, il se concentre sur la conception d'algorithmes fondés sur la théorie qui abordent ces trois problèmes simultanément. Ses recherches comprennent un certain nombre de pistes différentes, notamment la conception de méthodes d'apprentissage par représentation adaptées aux problèmes d'apprentissage par renforcement, le développement d'agents d'IA capables de découvrir des comportements étendus dans le temps (appelés options) et la création de systèmes capables d'apprentissage continu. Marlos est également passionné par la reproductibilité et l'expérimentation appropriée dans l'apprentissage automatique, ayant dirigé plusieurs efforts sur ce sujet dans le passé.

Marlos est titulaire d'une chaire d'IA CIFAR au sein de l'Alberta Machine Intelligence Institute (Amii) et professeur adjoint à l'Université de l'Alberta. Les intérêts de recherche de Marlos se situent largement dans l'apprentissage automatique, en particulier dans l'apprentissage par renforcement (profond), l'apprentissage par représentation, l'apprentissage continu et les applications réelles de tout ce qui précède. Il a obtenu son baccalauréat et sa maîtrise à l'UFMG, au Brésil, et son doctorat à l'Université de l'Alberta. Au cours de son doctorat, il a notamment popularisé l'idée d'une exploration étendue dans le temps par le biais d'options, en introduisant l'idée d'options propres. Il a été chercheur chez DeepMind et Google Brain pendant quatre ans, au cours desquels il a apporté plusieurs contributions à l'apprentissage par renforcement, notamment l'application de l'apprentissage par renforcement profond pour contrôler les ballons stratosphériques Loon.

Les travaux de Marlos ont été publiés dans les principales conférences et revues sur l'IA, notamment Nature, JMLR, JAIR, NeurIPS, ICML, ICLR et AAAI. Ses recherches ont également été présentées dans des médias populaires tels que la BBC, Bloomberg TV, The Verge et Wired.

Les travaux de Marlos ont été publiés dans les principales conférences et revues d'apprentissage automatique, notamment Nature, JMLR, JAIR, NeurIPS, ICML et ICLR.

Dernières nouvelles