Poste de recherche
Les réseaux neuronaux profonds sont vulnérables aux attaques adverses. En raison de leur nature de boîte noire, il est plutôt difficile d'interpréter et de réparer correctement ces comportements incorrects. Cet article se concentre sur l'interprétation et la réparation des comportements incorrects des réseaux neuronaux récurrents (RNN). Nous proposons une approche légère basée sur un modèle (RNNRepair) pour aider à comprendre et à réparer les comportements incorrects d'un RNN. Plus précisément, nous construisons un modèle d'influence pour caractériser les comportements étatiques et statistiques d'un RNN sur toutes les données d'apprentissage et pour effectuer l'analyse d'influence des erreurs. Par rapport aux techniques existantes sur la fonction d'influence, notre méthode peut estimer efficacement l'influence des échantillons d'entraînement existants ou nouvellement ajoutés pour une prédiction donnée, tant au niveau de l'échantillon qu'au niveau de la segmentation. Notre évaluation empirique montre que le modèle d'influence proposé est capable d'extraire des caractéristiques précises et compréhensibles. Sur la base du modèle d'influence, notre technique proposée peut déduire efficacement les instances influentes non seulement d'une séquence de test entière mais aussi d'un segment de cette séquence. De plus, avec les relations d'influence au niveau de l'échantillon et du segment, RNNRepair peut remédier à deux types de prédictions incorrectes au niveau de l'échantillon et du segment.
15 février 2022
Poste de recherche
Lisez ce document de recherche, co-écrit par Adam White, boursier Amii et titulaire de la chaire d'IA de l'ICRA au Canada : Apprentissage des traces emphatiques attendues pour le RL profond
27 septembre 2021
Poste de recherche
13 juin 2021
Poste de recherche
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.