Nouvelles
Le AI Seminar est une réunion hebdomadaire à l'Université de l'Alberta où les chercheurs intéressés par l'intelligence artificielle (AI) peuvent partager leurs recherches. Les présentateurs comprennent à la fois des conférenciers locaux de l'Université de l'Alberta et des visiteurs d'autres institutions. Les sujets peuvent être liés de quelque manière que ce soit à l'intelligence artificielle, qu'il s'agisse de travaux théoriques fondamentaux ou d'applications novatrices de techniques d'IA à de nouveaux domaines et problèmes.
Le 25 novembre, Matthew Schlegel, étudiant en doctorat à l'Université de l'Alberta, a présenté "Investigating Action Encodings in Recurrent Neural Networks in Reinforcement Learning" lors du séminaire sur l'intelligence artificielle.
Résumé :
La construction et le maintien de l'état pour apprendre des politiques et des fonctions de valeur sont essentiels pour le déploiement d'agents d'apprentissage par renforcement (RL) dans le monde réel. Les réseaux neuronaux récurrents (RNN) sont devenus un point d'intérêt clé pour le problème de construction d'état, et plusieurs agents d'apprentissage par renforcement à grande échelle incorporent des réseaux récurrents. Alors que les RNN sont devenus un pilier de nombreuses applications RL, de nombreux choix sont souvent sous-rapportés et contiennent des détails de mise en œuvre critiques pour améliorer les performances. Dans son exposé, nous discutons d'un axe sur lequel les architectures RNN peuvent être (et ont été) modifiées pour être utilisées dans RL. Plus précisément, M. Schlegel étudie la façon dont l'information sur les actions s'intègre dans la fonction de mise à jour de l'état d'une cellule récurrente.
Alors que l'action comme point central se présente comme un choix intuitif, plusieurs lignes de recherche en science cognitive soulignent l'importance de l'action dans la perception. Schlegel discute de plusieurs choix architecturaux centrés sur l'action et évalue empiriquement les architectures résultantes sur un ensemble de domaines illustratifs. Cette évaluation empirique comprend une analyse de l'état appris dans un problème de prédiction, des expériences comportementales et des performances lorsque les observations prennent la forme d'images et de lectures de capteurs centrés sur l'agent.
Enfin, il aborde les travaux futurs de développement et d'analyse des cellules récurrentes et les principaux défis à relever dans le cadre de l'observabilité partielle.
Regardez la présentation complète ci-dessous :
Tenez-vous au courant de la série de séminaires sur l'IA en vous inscrivant à la liste de diffusion.
Découvrez comment Amii fait progresser la recherche de pointe en matière d'intelligence artificielle et d'apprentissage automatique : visitez notre site Web. Recherche page.
8 avril 2024
Nouvelles
Les boursiers d'Amii partagent des conseils sur la manière de tirer le meilleur parti de votre expérience de la conférence.
26 mars 2024
Nouvelles
Dans l'épisode de ce mois-ci, Alona explique comment ChatGPT a changé la perception qu'a le public de ce que les modèles de langage d'IA peuvent faire, rendant instantanément obsolètes la plupart des références antérieures, et parle de l'excitation et de l'intensité du travail dans un domaine qui évolue rapidement comme l'IA.
18 mars 2024
Nouvelles
Google.org annonce de nouvelles subventions de recherche pour soutenir la recherche critique sur l'IA au Canada, axée sur des domaines tels que la durabilité et le développement responsable de l'IA. Les subventions accordées à Amii, à l'Institut canadien de recherches avancées (CIFAR) et au Centre international d'expertise de Montréal sur l'IA (CEIMIA) s'élèvent à un total de 2,7 millions de dollars.
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.