Le monde a obtenu des succès significatifs en appliquant des algorithmes d'apprentissage supervisé à des problèmes commerciaux. Ces systèmes nécessitant souvent de gros investissements pour intégrer les connaissances humaines, les chercheurs et les praticiens se tournent de plus en plus vers les algorithmes d'auto-apprentissage.
Richard S. Sutton, conseiller scientifique en chef chez Amii, a récemment eu l'occasion de s'entretenir avec Craig S. Smith du New York Times dans le cadre de leur rapport spécial sur l'intelligence artificielle. rapport spécial sur l'intelligence artificielle. Dans cet entretien, M. Sutton souligne l'importance de l'apprentissage par renforcement pour la création de systèmes d'intelligence artificielle capables d'apprendre et d'agir de manière autonome. Extrait de l'article :
"L'apprentissage par renforcement en informatique, dont Richard Sutton, aujourd'hui à l'université d'Alberta au Canada, a été l'un des pionniers, s'inspire de l'apprentissage par la récompense dans le cerveau : Imaginez un rat qui apprend à pousser un levier pour recevoir une boulette de nourriture. Cette stratégie a été développée pour apprendre aux systèmes informatiques à entreprendre des actions.
Fixez un objectif et un système d'apprentissage par renforcement s'efforcera d'atteindre cet objectif par essais et erreurs jusqu'à ce qu'il reçoive systématiquement une récompense. C'est ce que font les humains en permanence. 'Le renforcement est une idée évidente si l'on étudie la psychologieLe renforcement est une idée évidente si l'on étudie la psychologie", a déclaré le Dr Sutton.
Un terme plus global pour l'avenir de l'I.A., a-t-il dit, est l'"apprentissage prédictif", c'est-à-dire des systèmes qui non seulement reconnaissent des modèles, mais aussi prédisent des résultats et choisissent un plan d'action. 'Tout le monde est d'accord pour dire que nous avons besoin d'un apprentissage prédictif, mais nous ne sommes pas d'accord sur la manière d'y parvenir", a déclaré M. Sutton.a déclaré M. Sutton. 'Certains pensent que nous y parviendrons en étendant les idées d'apprentissage supervisé ; d'autres pensent que nous y parviendrons en étendant les idées d'apprentissage par renforcement"..'"
Cam Linke, PDG d'Amii et chercheur en IA, partage l'avis de M. Sutton sur l'importance croissante de l'apprentissage par renforcement.
"L'apprentissage par renforcement est la nouvelle vague de l'IA", affirme M. Linke, dont les recherches sur l'apprentissage par renforcement portent sur l'adaptation des comportements de l'IA afin d'améliorer l'auto-apprentissage. "De plus en plus d'entreprises explorent les applications de l'apprentissage par renforcement pour le contrôle des processus et la prise de décision autonome. Nous ne faisons qu'effleurer la surface de la valeur qui peut être créée, et les chefs d'entreprise commencent à s'en rendre compte."