Les recherches de Marlos portent sur l'apprentissage automatique, avec un accent particulier sur l'apprentissage par renforcement profond, l'apprentissage par représentation et l'apprentissage continu, ainsi que sur leurs applications dans le monde réel.
Représentation et apprentissage par renforcement
Dans le cadre de ses recherches, Marlos cherche à développer des méthodes d'apprentissage par renforcement qui peuvent être utilisées de manière significative dans le monde réel. Ses recherches portent sur plusieurs domaines, notamment la conception de méthodes d'apprentissage par représentation adaptées aux problèmes d'apprentissage par renforcement, le développement d'agents d'intelligence artificielle capables de découvrir des comportements étendus dans le temps (connus sous le nom d'options) et la création de systèmes capables d'apprentissage continu. Marlos est également passionné par la reproductibilité et l'expérimentation appropriée dans l'apprentissage automatique, ayant dirigé plusieurs efforts sur ce sujet dans le passé.
Marlos a obtenu sa licence et sa maîtrise à l'UFMG, au Brésil, et son doctorat à l'université d'Alberta. Au cours de mon doctorat, il a notamment introduit la stochasticité et les modes de jeu dans l'environnement d'apprentissage populaire Arcade, et a popularisé l'idée d'une exploration étendue dans le temps par le biais d'options, en introduisant l'idée d'options propres. Avant de devenir professeur, il a été chercheur chez DeepMind et Google Brain pendant quatre ans ; au cours de cette période, il a apporté plusieurs contributions à l'apprentissage par renforcement, notamment l'application de l'apprentissage par renforcement profond pour contrôler les ballons stratosphériques Loon.
Ses travaux ont été publiés dans les principales conférences et revues sur l'apprentissage automatique, notamment Nature, JMLR, JAIR, NeurIPS, ICML et ICLR. Ses recherches ont également été présentées dans des médias populaires tels que la BBC, Bloomberg TV, The Verge et Wired.