Poste de recherche

Recherche d'arbres de politique mono-agents avec garanties

Nous présentons deux nouveaux algorithmes de recherche d'arbres qui utilisent une politique pour guider la recherche. Le premier algorithme est une énumération best-first qui utilise une fonction de coût qui nous permet de prouver une limite supérieure sur le nombre de nœuds à développer avant d'atteindre un état cible. Nous montrons que cet algorithme best-first est particulièrement bien adapté aux problèmes de type "aiguille dans la botte de foin". Le second algorithme est basé sur l'échantillonnage et nous prouvons une limite supérieure sur le nombre attendu de nœuds qu'il développe avant d'atteindre un ensemble d'états cibles. Nous montrons que cet algorithme est mieux adapté aux problèmes où de nombreux chemins mènent à un objectif. Nous validons ces algorithmes de recherche arborescente sur 1 000 niveaux de Sokoban générés par ordinateur, où la politique utilisée pour guider la recherche provient d'un réseau neuronal entraîné à l'aide de A3C. Nos résultats montrent que les algorithmes de recherche arborescente de politique que nous introduisons sont compétitifs avec un planificateur indépendant du domaine à la pointe de la technologie qui utilise la recherche heuristique.

Remerciements

Les auteurs souhaitent remercier Peter Sunehag, Andras Gyorgy, Rémi Munos, Joel Veness, Arthur Guez, Marc Lanctot, André Grahl Pereira et Michael Bowling pour les discussions utiles relatives à cette recherche. Le soutien financier de cette recherche a été fourni en partie par le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG).

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !