Poste de recherche

Système et méthode d'apprentissage par renforcement profond

Résumé

Un système informatique et un procédé pour étendre l'apprentissage par renforcement asynchrone parallélisé pour l'entraînement d'un réseau neuronal sont décrits dans divers modes de réalisation, par un fonctionnement coordonné d'une pluralité de processeurs matériels ou de fils d'exécution de telle sorte que chacun fonctionne comme un agent travailleur qui est configuré pour interagir simultanément avec un environnement informatique cible pour un calcul de gradient local basé sur une détermination de perte et pour mettre à jour des paramètres de réseau globaux basés au moins sur un calcul de gradient local pour entraîner le réseau neuronal par des modifications d'interconnexions pondérées entre des unités informatiques interconnectées lorsque le calcul de gradient est effectué sur une pluralité d'itérations d'un environnement informatique cible, la détermination de perte comprenant au moins un terme de perte de politique (acteur), un terme de perte de valeur (critique) et une perte de contrôle auxiliaire. Des variantes sont décrites plus loin dans lesquelles le réseau neuronal est adapté pour inclure une prédiction d'état terminal et un guidage d'action.

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !