Poste de recherche
Résumé : Des études récentes sur le sous-titrage dense et la base visuelle en 3D ont obtenu des résultats impressionnants. Malgré les progrès réalisés dans ces deux domaines, la quantité limitée de données disponibles sur le langage de la vision en 3D pose des problèmes d'ajustement excessif pour les méthodes d'ancrage visuel et de sous-titrage dense en 3D. De plus, la manière de décrire de manière discriminante des objets dans des environnements 3D complexes n'est pas encore complètement étudiée. Pour relever ces défis, nous présentons D3Net, une architecture neuronale de haut-parleur-auditeur de bout en bout qui peut détecter, décrire et discriminer. Notre D3Net unifie le sous-titrage dense et la base visuelle en 3D d'une manière autocritique. Cette propriété auto-critique du D3Net introduit également une capacité de discrimination lors de la génération de légendes d'objets et permet un apprentissage semi-supervisé sur des données ScanNet avec des descriptions partiellement annotées. Notre méthode surpasse les méthodes SOTA dans les deux tâches sur le jeu de données ScanRefer, surpassant la méthode de sous-titrage dense 3D de SOTA par une marge significative.
3 mars 2023
Poste de recherche
9 février 2023
Poste de recherche
1er février 2023
Poste de recherche
Lisez ce document de recherche, co-écrit par Russ Greiner, boursier et titulaire de la chaire d'IA de l'ICRA au Canada : Vers un système de santé apprenant basé sur l'intelligence artificielle pour la prédiction de la mortalité au niveau de la population à l'aide d'électrocardiogrammes
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.