Apprentissage par renforcement
Apprendre par l'expérience
Les chercheurs d'Amii sont des pionniers et des leaders dans le domaine de l'apprentissage par renforcement (RL), une branche de l'apprentissage automatique qui permet aux systèmes d'IA d'apprendre par l'expérience. Les systèmes d'apprentissage par renforcement interagissent avec leur environnement, souvent par essais et erreurs, et obtiennent des récompenses positives ou négatives en fonction de leurs actions. Les humains définissent la tâche globale et les récompenses pertinentes que le système utilise pour découvrir la meilleure action à entreprendre dans une situation donnée.
Au lieu de recevoir des instructions sur les actions à entreprendre pour atteindre un objectif, le système doit apprendre quelles actions sont les plus gratifiantes en les essayant. Au fil du temps, le système développe une politique (ou une façon d'agir) qui lui permet de sélectionner l'action qui permettra le mieux d'atteindre l'objectif, ce qui peut nous aider à découvrir les actions optimales à entreprendre dans un scénario donné.
L'apprentissage par renforcement peut être utilisé pour l'optimisation et l'amélioration des processus, dans le cadre d'un système de recommandation ou de tutorat intelligent, ainsi que pour le contrôle adaptatif et la prise de décision dans les systèmes autonomes.