Nouvelles
Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.
Le 25 novembre, Matthew Schlegel, étudiant en doctorat à l'Université de l'Alberta, a présenté "Investigating Action Encodings in Recurrent Neural Networks in Reinforcement Learning" lors du séminaire sur l'intelligence artificielle.
Résumé :
La construction et le maintien de l'état pour apprendre des politiques et des fonctions de valeur sont essentiels pour le déploiement d'agents d'apprentissage par renforcement (RL) dans le monde réel. Les réseaux neuronaux récurrents (RNN) sont devenus un point d'intérêt clé pour le problème de construction d'état, et plusieurs agents d'apprentissage par renforcement à grande échelle incorporent des réseaux récurrents. Alors que les RNN sont devenus un pilier de nombreuses applications RL, de nombreux choix sont souvent sous-rapportés et contiennent des détails de mise en œuvre critiques pour améliorer les performances. Dans son exposé, nous discutons d'un axe sur lequel les architectures RNN peuvent être (et ont été) modifiées pour être utilisées dans RL. Plus précisément, M. Schlegel étudie la façon dont l'information sur les actions s'intègre dans la fonction de mise à jour de l'état d'une cellule récurrente.
Alors que l'action comme point central se présente comme un choix intuitif, plusieurs lignes de recherche en science cognitive soulignent l'importance de l'action dans la perception. Schlegel discute de plusieurs choix architecturaux centrés sur l'action et évalue empiriquement les architectures résultantes sur un ensemble de domaines illustratifs. Cette évaluation empirique comprend une analyse de l'état appris dans un problème de prédiction, des expériences comportementales et des performances lorsque les observations prennent la forme d'images et de lectures de capteurs centrés sur l'agent.
Enfin, il aborde les travaux futurs de développement et d'analyse des cellules récurrentes et les principaux défis à relever dans le cadre de l'observabilité partielle.
Regardez la présentation complète ci-dessous :
Tenez-vous au courant de la série de séminaires sur l'IA en vous inscrivant à la liste de diffusion.
Découvrez comment Amii fait progresser la recherche de pointe en matière d'intelligence artificielle et d'apprentissage automatique : visitez notre site Web. Recherche page.
27 septembre 2023
Nouvelles
Un nouveau rapport de Deloitte Canada sur l'écosystème national de l'IA révèle que le Canada est en tête des classements mondiaux en matière de concentration de talents, avec une croissance des brevets et des investissements en capital-risque par habitant parmi les plus élevés au monde.
25 septembre 2023
Nouvelles
Le conseiller scientifique en chef d'Amii annonce un partenariat avec John Carmack pour mieux cibler et accélérer la création d'une intelligence artificielle générale (AGI).
21 septembre 2023
Nouvelles
Le 18 août, Kristen Yu, candidate au doctorat à l'université d'Alberta, a présenté "Adventures of AI Directors Early in the Development of Nightingale" lors du séminaire sur l'IA.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.