Poste de recherche

Regroupement de mots sémantiquement équivalents en ensembles cognitifs dans des listes multilingues

Des listes de mots sont désormais disponibles pour la plupart des langues du monde, mais seule une petite fraction de ces listes contient des informations sur les cognats. Nous présentons une approche d'apprentissage automatique qui regroupe automatiquement les mots des listes de mots multilingues en ensembles cognats. Notre méthode incorpore un certain nombre de mesures de similarité de mots et de caractéristiques qui encodent le degré d'affinité entre les paires de langues. La sortie de l'algorithme de classification est ensuite utilisée pour générer des groupes cognats. Les résultats des expériences sur des listes de mots représentant plusieurs familles de langues démontrent l'utilité de l'approche proposée.

Remerciements

Nous remercions Eric Holman, Søren Wichmann et les autres membres du projet ASJP d'avoir partagé leurs ensembles de données annotées par les cognates. Nous remercions également Shane Bergsma pour ses commentaires perspicaces. La conversion du format de la base de données comparative indo-européenne a été effectuée par Qing Dou. Cette recherche a été partiellement financée par le Conseil de recherches en sciences naturelles et en génie du Canada.

Derniers documents de recherche

Connectez-vous avec la communauté

Participez à l'écosystème croissant de l'IA en Alberta ! Les demandes de conférenciers, de parrainage et de lettres de soutien sont les bienvenues.

Explorer la formation et l'enseignement supérieur

Vous êtes curieux de connaître les possibilités d'études auprès de l'un de nos chercheurs ? Vous voulez plus d'informations sur les possibilités de formation ?

Exploiter le potentiel de l'intelligence artificielle

Faites-nous part de vos objectifs et de vos défis concernant l'adoption de l'IA dans votre entreprise. Notre équipe Investissements & Partenariats vous contactera sous peu !