Nouvelles

Amii à ICML 2021 : Articles acceptés et ateliers

Les travaux des chercheurs d'Amii seront présentés lors de la 38e conférence internationale annuelle sur l'apprentissage automatique (ICML), qui se déroule cette année en ligne du 18 au 24 juillet.

La conférence ICML est le premier rassemblement de professionnels qui se consacrent à l'avancement de la branche de l'IA connue sous le nom d'apprentissage automatique (ML). Réputée dans le monde entier pour la présentation et la publication de travaux de recherche de pointe sur tous les aspects de l'apprentissage automatique et les domaines d'application, la conférence figure parmi les dix conférences sur l'apprentissage automatique et l'IA les mieux classées au monde sur la base de l'indice h et du score d'impact (voir : Google Scholar et Guide2Research).

Les boursiers Amii et les chaires d'IA du CIFAR du Canada - des professeurs de l'Université d'Alberta, de l'Université de Colombie-Britannique et de l'Université Carleton - ainsi que d'autres chercheurs Amii ont 23 articles inclus dans les actes :

Articles acceptés

* indique un chercheur ou un ancien élève d'Amii

Une analyse de l'apprentissage méta en fonction de la distribution

Mikhail Konobeev*, Ilja Kuzborskij, Csaba Szepesvári*

Évaluation de politique hors politique de récompense moyenne avec approximation de fonction

Shangtong Zhang, Yi Wan*, Richard Sutton*, Shimon Whiteson

Au-delà de la réduction de la variance : Comprendre le véritable impact des bases de référence sur l'optimisation des politiques

Wesley Chung, Valentin Thomas, Marlos C. Machado*, Nicolas Le Roux

Bootstrapping de l'évaluation Q ajustée pour l'inférence hors politique

Botao Hao, Xiang Ji, Yaqi Duan, Hao Lu, Csaba Szepesvári*, Mengdi Wang

Caractériser l'écart entre l'acteur-critique et le gradient politique

Junfeng Wen*, Saurabh Kumar, Ramki Gummadi, Dale Schuurmans*

Types de déviations efficaces et apprentissage de la rationalité rétrospective dans les jeux de forme extensive.

Dustin Morrill*, Ryan D'Orazio*, Marc Lanctot*, James Wright*, Michael Bowling*, Amy Greenwald

Algorithmes emphatiques pour l'apprentissage par renforcement profond

Ray Jiang, Tom Zahavy, Zhongwen Xu, Adam White*, Matteo Hessel, Charles Blundell, Hado van Hasselt

De la récurrence de Poincaré à la convergence dans les jeux à information imparfaite : Trouver l'équilibre par régularisation

Julien Perolat, Remi Munos, Jean-Baptiste Lespiau, Shayegan Omidshafiei, Mark Rowland, Pedro Ortega, Neil Burch*, Thomas Anthony, David Balduzzi, Bart De Vylder, Georgios Piliouras, Marc Lanctot*, Karl Tuyls

Amélioration de la limite de regret et de la répétition de l'expérience dans l'itération de politique régularisée

Nevena Lazic, Dong Yin, Yasin Abbasi-Yadkori, Csaba Szepesvári*

Apprentissage et planification dans les processus de décision de Markov à récompense moyenne

Yi Wan*, Abhishek Naik*, Richard Sutton*

LEGO : Raisonnement latent guidé par l'exécution pour la réponse à des questions à bonds multiples sur des graphes de connaissances.

Hongyu Ren, Hanjun Dai, Bo Dai, Xinyun Chen, Michihiro Yasunaga, Haitian Sun, Dale Schuurmans*, Jure Leskovec, Denny Zhou

Tirer parti de la non-uniformité dans l'optimisation non convexe du premier ordre

Jincheng Mei*, Yue Gao*, Bo Dai, Csaba Szepesvári*, Dale Schuurmans*

Échantillonnage Meta-Thompson

Branislav Kveton, Mikhail Konobeev*, Manzil Zaheer, Chih-wei Hsu, Martin Mladenov, Craig Boutilier, Csaba Szepesvári*

Sur l'optimalité des algorithmes d'optimisation des politiques par lots

Chenjun Xiao*, Yifan Wu*, Jincheng Mei*, Bo Dai, Tor Lattimore*, Lihong Li*, Csaba Szepesvári*, Dale Schuurmans*

Re-présentation transductive des caractéristiques sans paramètres pour l'apprentissage en quelques coups.

Wentao Cui, Yuhong Guo*

Capacité d'information sur les politiques : Mesure théorique de l'information pour la complexité des tâches dans l'apprentissage profond par renforcement.

Hiroki Furuta, Tatsuya Matsushima, Tadashi Kozuno*, Yutaka Matsuo, Sergey Levine, Ofir Nachum, Shixiang Gu

Exploration aléatoire dans l'apprentissage par renforcement avec approximation générale de la fonction de valeur

Haque Ishfaq, Qiwen Cui, Viet Nguyen, Alex Ayoub*, Zhuoran Yang, Zhaoran Wang, Doina Precup, Lin Yang

Révision du Q(λ) de Peng pour l'apprentissage par renforcement moderne

Tadashi Kozuno*, Yunhao Tang, Mark Rowland, Remi Munos, Steven Kapturowski, Will Dabney, Michal Valko et David Abel.

RNNRepair : Réparation automatique des RNN via une analyse basée sur un modèle

Xiaofei Xie, Wenbo Guo, Lei Ma*, Wei Le, Jian Wang, Lingjun Zhou, Yang Liu, Xinyu Xing

Apprentissage asymétrique robuste dans les POMDPs

Andrew Warrington, Jonathan Lavington*, Adam Ścibior, Mark Schmidt*, Frank Wood

La sélection de caractéristiques éparses rend l'apprentissage par renforcement par lots plus efficace en termes d'échantillons.

Botao Hao, Yaqi Duan, Tor Lattimore*, Csaba Szepesvári*, Mengdi Wang

Descente par gradient naturel structuré traçable utilisant des paramétrages locaux

Wu Lin*, Frank Nielsen, Khan Emtiyaz, Mark Schmidt*

Inférence causale valide avec (certains) instruments non valides

Jason Hartford*, Victor Veitch, Dhanya Sridhar, Kevin Leyton-Brown*

Ateliers

L'apprentissage par renforcement pour la vie réelle

Co-organisé par Yuxi Li, Minmin Chen, Omer Gottesman, Lihong Li, Zongqing Lu, Rupam Mahmood*, Niranjani Prasad, Zhiwei (Tony) Qin, Csaba Szepesvári*, Matthew Taylor*.

Atelier sur la théorie de l'apprentissage par renforcement

Co-organisé par Shipra Agrawal, Simon Du, Niao He, Csaba Szepesvári*, Lin Yang

Autres activités

Soirée Trivia organisée par Amii

Date : Vendredi 23 juillet (15 h - 16 h 30 MST)
Description : Rejoignez-nous pour une soirée trivia virtuelle et profitez-en pour en apprendre davantage sur le travail que nous accomplissons à Amii ! Des équipes seront constituées au cours de l'événement et l'équipe gagnante remportera une carte-cadeau de 25 dollars pour un repas de fête offert par UberEATS.

Programme de mentorat

Date : Du 19 au 23 juillet
Description : Les chercheurs du monde entier sont invités à participer à ces sessions spéciales avec des chercheurs de premier plan en IA et en ML. Les mentors partageront leurs recherches, leurs conseils de carrière et de vie, et répondront aux questions. Consultez la liste des mentors exceptionnels ici, y compris nos propres Marlos C. Machado, Nidhi Hegde, Matthew E. Taylor, Michael Bowling, Adam White et Robert Holte!

Service

Outre le fait que son travail a été présenté à la conférence de l'ICML, Adam White a également occupé la fonction de président social.

Découvrez comment Amii fait progresser la recherche de pointe en matière d'intelligence artificielle et d'apprentissage automatique : visitez notre page Recherche.

Amii à ICML 2021 : Articles acceptés et ateliers

Articles acceptés

Ateliers

Autres activités

Service

Derniers articles d'actualité

Déchiffrer le code de la conférence

Comment le Chat GPT a ruiné le Noël d'Alona | Approximately Correct Podcast

Google Canada annonce de nouvelles subventions de recherche pour renforcer l'écosystème de l'IA au Canada

Laissez-nous vous aider

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle