Pendant des années, une "barrière de flux" a rendu l'apprentissage par renforcement profond instable sans rejouer de grands lots de données. Dans cette session Upper Bound 2025, Rupam Mahmood, boursier Amii et titulaire de la chaire d'IA du CIFAR au Canada, révèle une percée récente qui résout ce problème de longue date.
Découvrez le Streaming Deep RL : un paradigme dans lequel un agent d'intelligence artificielle apprend de chaque expérience exactement une fois, au fur et à mesure qu'elle se produit. Cette approche reflète l'intelligence naturelle et est beaucoup plus efficace en termes de calcul. Découvrez comment de nouveaux optimiseurs et de nouvelles techniques de normalisation rendent cela possible, en débloquant la mise à l'échelle temporelle et en ouvrant la voie à une IA omniprésente, sur appareil, capable de s'adapter en permanence à notre monde sans clusters distants.
Upper Bound 2025 est la conférence annuelle de l'Amii sur l'intelligence artificielle, qui se tient à Edmonton, en Alberta, au Canada, et qui réunit des chercheurs, des industriels et des décideurs politiques. La conférence se concentre sur l'accélération de l'excellence et de l'innovation en matière d'IA pour le bien, en mettant l'accent sur l'IA pour les infrastructures critiques, la santé, les opérations industrielles, l'IA responsable et l'alphabétisation en matière d'IA.