WEXEA : Wikipedia EXhaustive Entity Annotation (Annotation exhaustive d'entités)

Résumé

Dans cet article, nous discutons d'une approche visant à créer un corpus textuel basé sur Wikipédia avec des annotations exhaustives des mentions d'entités. Les éditeurs de Wikipédia ne sont censés ajouter des hyperliens que dans le but d'aider le lecteur à comprendre le contenu, mais sont découragés d'ajouter des liens qui n'apportent aucun avantage pour la compréhension d'un article. Par conséquent, de nombreuses mentions d'entités populaires (comme des pays ou des événements populaires de l'histoire), des articles précédemment liés ainsi que l'entité de l'article elle-même, ne sont pas liés. Il en résulte un énorme potentiel d'annotations supplémentaires qui peuvent être utilisées pour des tâches NLP en aval, comme l'extraction de relations. Nous montrons que nos annotations sont utiles pour créer des ensembles de données supervisées à distance pour cette tâche. En outre, nous publions tout le code nécessaire pour dériver un corpus à partir d'un vidage brut de Wikipédia, afin qu'il puisse être reproduit par tous.

WEXEA : Wikipedia EXhaustive Entity Annotation (Annotation exhaustive d'entités)

Résumé

Derniers documents de recherche

Identification des émotions de base et des émotions spécifiques à la dépression dans les tweets : Expériences de classification multi-label

Questions faiblement supervisées pour l'extraction de relations de type "zéro".

Mise à jour des visualisations de données affichées en fonction des centres de conversation identifiés dans les commandes en langage naturel.

Laissez-nous vous aider

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle

Connectez-vous avec la communauté

Explorer la formation et l'enseignement supérieur

Exploiter le potentiel de l'intelligence artificielle