Poste de recherche
Des listes de mots sont désormais disponibles pour la plupart des langues du monde, mais seule une petite fraction de ces listes contient des informations sur les cognats. Nous présentons une approche d'apprentissage automatique qui regroupe automatiquement les mots des listes de mots multilingues en ensembles cognats. Notre méthode incorpore un certain nombre de mesures de similarité de mots et de caractéristiques qui encodent le degré d'affinité entre les paires de langues. La sortie de l'algorithme de classification est ensuite utilisée pour générer des groupes cognats. Les résultats des expériences sur des listes de mots représentant plusieurs familles de langues démontrent l'utilité de l'approche proposée.
Remerciements
Nous remercions Eric Holman, Søren Wichmann et les autres membres du projet ASJP d'avoir partagé leurs ensembles de données annotées par les cognates. Nous remercions également Shane Bergsma pour ses commentaires perspicaces. La conversion du format de la base de données comparative indo-européenne a été effectuée par Qing Dou. Cette recherche a été partiellement financée par le Conseil de recherches en sciences naturelles et en génie du Canada.
26 février 2023
Poste de recherche
23 janvier 2023
Poste de recherche
8 août 2022
Poste de recherche
Lisez ce document de recherche co-rédigé par Angel Chang, titulaire de la chaire d'IA de l'ICAR Canada : Apprentissage des traces emphatiques attendues pour le RL profond
Vous cherchez à renforcer les capacités en matière d'IA ? Vous avez besoin d'un conférencier pour votre événement ?
Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.