Poste de recherche

Apprentissage Q préservant la confidentialité avec bruit fonctionnel dans les espaces continus

Nous considérons des algorithmes différentiellement privés pour l'apprentissage par renforcement dans des espaces continus, tels que les fonctions de récompense voisines sont indiscernables. Ceci protège l'information sur la récompense d'être exploitée par des méthodes telles que l'apprentissage par renforcement inverse. Les études existantes qui garantissent la confidentialité différentielle ne sont pas extensibles aux espaces d'état infinis, car le niveau de bruit pour garantir la confidentialité s'échelonne en conséquence à l'infini. Notre objectif est de protéger l'approximateur de la fonction de valeur, sans tenir compte du nombre d'états interrogés par la fonction. Nous y parvenons en ajoutant un bruit fonctionnel à la fonction de valeur de manière itérative lors de l'apprentissage. Nous montrons des garanties rigoureuses de confidentialité par une série d'analyses sur le noyau de l'espace de bruit, la limite probabiliste de ces échantillons de bruit et la composition sur les itérations. Nous comprenons mieux l'analyse de l'utilité en prouvant l'optimalité approximative de l'algorithme lorsque l'espace d'état est discret. Les expériences corroborent nos résultats théoriques et montrent une amélioration par rapport aux approches existantes.

Remerciements

Nous tenons à remercier Ruitong Huang, qui nous a fourni des informations utiles sur l'analyse de la composition et la conception de l'algorithme, et Kry Yik Chau Lui, qui nous a suggéré d'étendre notre approche aux espaces de Sobolev de haute dimension.

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !