Tirer les leçons de l'expérience
Richard S. Sutton, FRS, FRSC, est l'un des pionniers de l'apprentissage par renforcement, une approche de l'intelligence artificielle et naturelle qui met l'accent sur l'apprentissage et la planification à partir d'un échantillon d'expérience. Il cherche avant tout à comprendre ce que signifie être intelligent, prédire et influencer le monde, apprendre, percevoir, agir et penser. Au cours de sa carrière, il a apporté de nombreuses contributions significatives au domaine, notamment la théorie de l'apprentissage par différence temporelle, la classe d'algorithmes "acteur-critique" (gradient de politique), l'architecture Dyna (intégrant l'apprentissage, la planification et la réaction), l'architecture Horde, et les algorithmes de différence temporelle par gradient et emphatique - entre autres avancées. Richard cherche actuellement à étendre les idées d'apprentissage par renforcement à une approche empirique de la représentation des connaissances basée sur la prédiction.
Richard est conseiller scientifique en chef, membre et titulaire de la chaire d'IA du CIFAR au Canada à Amii, professeur d'informatique à l'université d'Alberta et chercheur à Keen Technologies.
Il est le fondateur du Reinforcement Learning & Artificial Intelligence (RLAI) Lab de l'Université de l'Alberta, et il est co-auteur de Reinforcement Learning : An Introductionle manuel de référence sur l'apprentissage par renforcement, qui en est à sa deuxième édition.
En 2023, Richard s'est associé à John Carmack, ingénieur logiciel visionnaire et fondateur de Keen Technologies, pour se concentrer sur la science de l'intelligence artificielle générale et la faire progresser. Grâce à ce travail, documenté en partie dans Le plan AlbertaRichard cherche à comprendre et à créer des agents informatiques de longue durée de vie qui interagissent avec un monde beaucoup plus complexe et qui parviennent à prédire et à contrôler leurs signaux d'entrée sensoriels.
Richard a été nommé membre de la Royal Society, de la Société royale du Canada, de l'Association pour l'avancement de l'intelligence artificielle (AAAI) et de l'Association canadienne de l'intelligence artificielle (CAIAC), où il a également reçu un prix pour l'ensemble de ses réalisations en 2018. Richard a supervisé près de 60 chercheurs en début de carrière et ses publications ont été citées plus de 93 000 fois. Richard a été présenté dans des publications populaires telles que Science, The Economist, le New York Times, le Wall Street Journal et Hello World de Bloomberg.
Domaines d'expertise
AI
Apprentissage par renforcement
Apprentissage sans modèle
Apprentissage hors politique
Apprentissage par différence temporelle
Représentation des connaissances
Sciences cognitives
Points forts
Membre de la Société royale
Nommé en 2021 pour sa contribution exceptionnelle à la science
Membre de la Société royale du Canada
Nommé en 2016
Prix de l'excellence dans la recherche
Université du Massachusetts Amherst
2013 Recipient
Le Prix du Président
Société internationale des réseaux neuronaux
Récipiendaire 2003