Institut de l'intelligence artificielle de l'Alberta

Puyuan Liu remporte le prix de thèse CAIAC | Amii

Publié

6 juin 2023

Puyuan Liu, récemment diplômé d'une maîtrise en sciences à l' Université de l'Alberta sous la direction de Lili Mou, boursière Amii et titulaire de la chaire CIFAR AI au Canada, a reçu le prix de la meilleure thèse de maîtrise 2023 décerné par l'Association canadienne de l'intelligence artificielle (CAIAC).

"J'ai été très surpris", confie Liu, qui a obtenu son diplôme de l'Université de l'Alberta en novembre. J'ai terminé et six mois plus tard, on m'a dit : "Vous avez gagné ce prix, bon travail". J'ai été très reconnaissante à mon superviseur pour ses conseils et son soutien.

Ce prix est décerné chaque année à "une thèse de maîtrise exceptionnelle réalisée dans une université canadienne dans le domaine de l'intelligence artificielle". Liu, qui étudie le traitement du langage naturel (NLP), a remporté le prix pour son articleintitulé "Non-Autoregressive Unsupervised Summarization with Length-Control Algorithms" (Résumés non supervisés non autorégressifs avec des algorithmes de contrôle de la longueur).

M. Liu explique que ses recherches portent sur de nombreux domaines, notamment la robotique et l'apprentissage par renforcement. Mais ses travaux actuels sur le NLP découlent de son intérêt pour l'intelligence artificielle générale.

"Si nous voulons construire une IA générale ou autre, nous devons communiquer d'une manière ou d'une autre avec l'IA, ce qui impliquera certainement la PNL. C'est donc l'une des choses qui m'intéressent".

L'article primé de M. Liu porte sur la génération de texte non autorégressive. Les programmes de génération de texte utilisent de petits groupes de lettres et d'autres caractères appelés "tokens". Les modèles combinent ces jetons pour former les mots et les phrases qu'ils produisent.

Les modèles traditionnels de génération de texte, tels que Chat-GPT, utilisent une approche autorégressive : ils créent des mots-clés un par un, et les mélangent pour créer un texte plus long. Les générateurs non autorégressifs ne créent pas de jetons un par un. Au contraire, ils génèrent tous les tokens simultanément. Selon M. Liu, cette approche signifie que les liens entre les mots peuvent être légèrement plus faibles, mais que le texte est créé beaucoup plus rapidement, parfois 50 fois plus vite que les méthodes traditionnelles.

"En fait, nous sacrifions un peu de qualité pour obtenir un gain d'efficacité important", explique M. Liu.

L'article propose une approche non autorégressive pour résumer des textes plus volumineux. Liu et ses coauteurs ont constaté qu'ils pouvaient produire des résumés d'une précision comparable beaucoup plus rapidement que les méthodes traditionnelles.

En plus du prix, Liu est invitée à faire un exposé lors de la conférence du CAIAC qui se tiendra du 5 au 9 juin.

Auteurs

Puyuan Liu

Scott Lilwall

Partager