Nouvelles

Série de séminaires sur l'IA 2022 : Matthew Schlegel

Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.

Le 25 novembre, Matthew Schlegel, étudiant en doctorat à l'Université de l'Alberta, a présenté "Investigating Action Encodings in Recurrent Neural Networks in Reinforcement Learning" lors du séminaire sur l'intelligence artificielle.


Résumé :

La construction et le maintien de l'état pour apprendre des politiques et des fonctions de valeur sont essentiels pour le déploiement d'agents d'apprentissage par renforcement (RL) dans le monde réel. Les réseaux neuronaux récurrents (RNN) sont devenus un point d'intérêt clé pour le problème de construction d'état, et plusieurs agents d'apprentissage par renforcement à grande échelle incorporent des réseaux récurrents. Alors que les RNN sont devenus un pilier de nombreuses applications RL, de nombreux choix sont souvent sous-rapportés et contiennent des détails de mise en œuvre critiques pour améliorer les performances. Dans son exposé, nous discutons d'un axe sur lequel les architectures RNN peuvent être (et ont été) modifiées pour être utilisées dans RL. Plus précisément, M. Schlegel étudie la façon dont l'information sur les actions s'intègre dans la fonction de mise à jour de l'état d'une cellule récurrente.

Alors que l'action comme point central se présente comme un choix intuitif, plusieurs lignes de recherche en science cognitive soulignent l'importance de l'action dans la perception. Schlegel discute de plusieurs choix architecturaux centrés sur l'action et évalue empiriquement les architectures résultantes sur un ensemble de domaines illustratifs. Cette évaluation empirique comprend une analyse de l'état appris dans un problème de prédiction, des expériences comportementales et des performances lorsque les observations prennent la forme d'images et de lectures de capteurs centrés sur l'agent.

Enfin, il aborde les travaux futurs de développement et d'analyse des cellules récurrentes et les principaux défis à relever dans le cadre de l'observabilité partielle.

Regardez la présentation complète ci-dessous :


Tenez-vous au courant de la série de séminaires sur l'IA en vous inscrivant à la liste de diffusion.

Découvrez comment Amii fait progresser la recherche de pointe en matière d'intelligence artificielle et d'apprentissage automatique : visitez notre site Web. Recherche page.

Derniers articles d'actualité

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !