Séminaire sur l'IA - Bingshan Hu
En ligne
En ligne
Présentateur : Bingshan Hu
Titre: Limite de regret (quasi)-optimale pour l'échantillonnage Thompson différentiellement privé
Résumé : Un problème de bandit à bras multiples est un problème classique de prise de décision séquentielle dans lequel le but est d'accumuler le plus de récompense possible. Dans ce modèle d'apprentissage, seule une quantité limitée d'informations est révélée à chaque tour. Le modèle de rétroaction imparfaite fait que l'algorithme d'apprentissage se trouve dans un dilemme entre l'exploration (obtention d'informations) et l'exploitation (accumulation de récompenses). L'échantillonnage de Thompson est l'un des algorithmes d'apprentissage classiques capables de trouver un bon équilibre entre l'exploration et l'exploitation, et ses performances empiriques sont toujours très compétitives.
Dans l'apprentissage standard non privé, l'algorithme d'apprentissage peut toujours avoir accès aux véritables informations révélées pour prendre des décisions futures. Cependant, si l'information révélée concerne des individus, pour préserver la confidentialité, les décisions prises par l'algorithme d'apprentissage ne doivent pas s'appuyer sur la véritable information révélée. Dans cet exposé, je présenterai un algorithme basé sur l'échantillonnage de Thompson, DP-TS, pour les bandits stochastiques privés. La limite supérieure de regret pour DP-TS correspond à la limite inférieure de regret découverte jusqu'à un facteur loglogT supplémentaire.
Bio : Bingshan Hu est une boursière postdoctorale Amii co-animée par le professeur Nidhi Hegde de l'Université d'Alberta et le professeur Mark Schmidt de l'Université de Colombie-Britannique. Elle a obtenu son doctorat à l'Université de Victoria sous la supervision du professeur Nishant Mehta en 2021. Ses recherches portent sur l'aspect théorique de l'apprentissage automatique et visent à concevoir des algorithmes d'apprentissage en ligne efficaces et privés. Elle fait partie des examinateurs pour des conférences telles que NeurlPS, ICML et AISTATS. Elle a été reconnue comme l'un des 10 % des évaluateurs les mieux notés à NeurIPS 2020.
Avant de poursuivre ses études de doctorat, elle a travaillé dans des laboratoires de recherche industriels en tant que spécialiste des technologies sans fil. Elle a inventé/co-inventé une vingtaine de brevets, dont plus de la moitié ont été délivrés par l'Office européen des brevets ou l'Office américain des brevets. Outre les fondements de l'apprentissage en ligne, elle s'intéresse également à l'utilisation de l'apprentissage en ligne dans de nouvelles applications dans les réseaux sans fil.
Le séminaire sur l'intelligence artificielle (IA) de l'Université de l'Alberta est une réunion hebdomadaire où les chercheurs (y compris les étudiants, les développeurs et les professeurs) intéressés par l'IA peuvent partager leurs recherches actuelles. Les présentateurs comprennent des conférenciers locaux de l'Université de l'Alberta et de l'industrie ainsi que d'autres institutions. Les séminaires abordent un large éventail de sujets liés de près ou de loin à l'intelligence artificielle, depuis les travaux théoriques fondamentaux jusqu'aux applications innovantes des techniques d'IA à de nouveaux domaines et problèmes. Pour en savoir plus, consultez le site Web du séminaire sur l'IA et inscrivez-vous à la liste de diffusion!
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.