Série de séminaires sur l'IA 2022 : Matthew Schlegel

Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.

Le 25 novembre, Matthew Schlegel, étudiant en doctorat à l'Université de l'Alberta, a présenté "Investigating Action Encodings in Recurrent Neural Networks in Reinforcement Learning" lors du séminaire sur l'intelligence artificielle.

Résumé :

La construction et le maintien de l'état pour apprendre des politiques et des fonctions de valeur sont essentiels pour le déploiement d'agents d'apprentissage par renforcement (RL) dans le monde réel. Les réseaux neuronaux récurrents (RNN) sont devenus un point d'intérêt clé pour le problème de construction d'état, et plusieurs agents d'apprentissage par renforcement à grande échelle incorporent des réseaux récurrents. Alors que les RNN sont devenus un pilier de nombreuses applications RL, de nombreux choix sont souvent sous-rapportés et contiennent des détails de mise en œuvre critiques pour améliorer les performances. Dans son exposé, nous discutons d'un axe sur lequel les architectures RNN peuvent être (et ont été) modifiées pour être utilisées dans RL. Plus précisément, M. Schlegel étudie la façon dont l'information sur les actions s'intègre dans la fonction de mise à jour de l'état d'une cellule récurrente.

Alors que l'action comme point central se présente comme un choix intuitif, plusieurs lignes de recherche en science cognitive soulignent l'importance de l'action dans la perception. Schlegel discute de plusieurs choix architecturaux centrés sur l'action et évalue empiriquement les architectures résultantes sur un ensemble de domaines illustratifs. Cette évaluation empirique comprend une analyse de l'état appris dans un problème de prédiction, des expériences comportementales et des performances lorsque les observations prennent la forme d'images et de lectures de capteurs centrés sur l'agent.

Enfin, il aborde les travaux futurs de développement et d'analyse des cellules récurrentes et les principaux défis à relever dans le cadre de l'observabilité partielle.

Regardez la présentation complète ci-dessous :

Tenez-vous au courant de la série de séminaires sur l'IA en vous inscrivant à la liste de diffusion.

Découvrez comment Amii fait progresser la recherche de pointe en matière d'intelligence artificielle et d'apprentissage automatique : visitez notre site Web. Recherche page.

Série de séminaires sur l'IA 2022 : Matthew Schlegel

Derniers articles d'actualité

Déchiffrer le code de la conférence

Comment le Chat GPT a ruiné le Noël d'Alona | Approximately Correct Podcast

Google Canada annonce de nouvelles subventions de recherche pour renforcer l'écosystème de l'IA au Canada

Laissez-nous vous aider

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle