Résumé : L'exposé propose des explications intuitives des conditions nécessaires et suffisantes pour les garanties théoriques, permettant aux chercheurs d'identifier la dureté du RL hors ligne et de discuter des techniques potentielles pour résoudre les tâches de RL hors ligne.