Poste de recherche
Méthodes, systèmes et appareils, y compris des programmes informatiques codés sur un support de stockage informatique, pour former un réseau neuronal de politique utilisé pour sélectionner des actions à réaliser par un agent d'apprentissage par renforcement interagissant avec un environnement. Dans un aspect, un procédé comprend l'obtention de données de chemin définissant un chemin à travers l'environnement traversé par l'agent. Une erreur de cohérence est déterminée pour le chemin à partir d'une récompense combinée, des première et dernière valeurs d'état soft-max, et d'une vraisemblance de chemin. Une mise à jour de valeur pour les valeurs actuelles des paramètres du réseau neuronal de politique est déterminée à partir d'au moins l'erreur de cohérence. La mise à jour de la valeur est utilisée pour ajuster les valeurs actuelles des paramètres du réseau neuronal de stratégie.
15 février 2022
Poste de recherche
Lisez ce document de recherche, co-écrit par Osmar Zaiane, boursier Amii et président du CIFAR AI au Canada : UCTransNet : Repenser les connexions de saut dans U-Net d'une perspective de canal avec Transformer.
27 septembre 2021
Poste de recherche
17 septembre 2021
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.