Poste de recherche
Le bootstrapping fournit une approche flexible et efficace pour évaluer la qualité de l'apprentissage par renforcement par lots, mais ses propriétés théoriques sont mal comprises. Dans cet article, nous étudions l'utilisation du bootstrap dans l'évaluation hors politique (OPE), et en particulier, nous nous concentrons sur l'évaluation Q ajustée (FQE) qui est connue pour être minimax-optimale dans les cas des modèles tabulaires et linéaires. Nous proposons une méthode de bootstrapping FQE pour inférer la distribution de l'erreur d'évaluation de la politique et nous montrons que cette méthode est asymptotiquement efficace et distributivement cohérente pour l'inférence statistique hors politique. Pour surmonter la limite de calcul du bootstrapping, nous adaptons une procédure de sous-échantillonnage qui améliore le temps d'exécution d'un ordre de grandeur. Nous évaluons numériquement la méthode de bootstrapping dans des environnements RL classiques pour l'estimation de l'intervalle de confiance, l'estimation de la variance de l'évaluateur hors politique et l'estimation de la corrélation entre plusieurs évaluateurs hors politique.
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
31 janvier 2023
Poste de recherche
20 janvier 2023
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.