Poste de recherche
Cet article étudie une solution hybride qui combine l'apprentissage par renforcement profond (RL) et la planification de trajectoire classique pour l'application de suivi en avant. Dans ce cas, un robot autonome a pour objectif de rester devant une personne qui se déplace librement. Suivre devant est un problème difficile car la trajectoire prévue par l'utilisateur est inconnue et doit être estimée, explicitement ou implicitement, par le robot. En outre, le robot doit trouver un moyen réalisable de naviguer en toute sécurité devant la trajectoire de l'utilisateur. Notre module RL profond estime implicitement la trajectoire humaine et produit des objectifs de navigation à court terme pour guider le robot. Ces objectifs sont utilisés par un planificateur de trajectoire pour diriger le robot en douceur vers les objectifs à court terme, et finalement devant l'utilisateur. Nous utilisons l'apprentissage par curriculum dans le module RL profond pour obtenir efficacement un rendement élevé. Notre système surpasse l'état de l'art en matière de suivi et est plus fiable que les alternatives de bout en bout, tant dans la simulation que dans les expériences réelles. Contrairement à une approche RL profonde pure, nous démontrons le transfert de la politique formée de la simulation au monde réel.
3 mars 2023
Poste de recherche
26 février 2023
Poste de recherche
15 septembre 2022
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.