Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
mli07 Evaluation numérique d'un module de détection de chaînes de référence
Archives
27 janvier 2011

Definition entités nommées

Référence (à paraitre)  : Mesures d’évaluation pour entités nommées structurées Cyril Grouin Olivier Galibert Sophie Rosset Ludovic Quintard Pierre Zweigenbaum

On appelle « entités nommées » des éléments d’un texte qu’il est possible de classer sur le plan sémantique. Le repérage des entités nommées est une tâche issue de la recherche d’information. Aït Hamlat (2010) souligne que cette tâche consiste à « accéder à une partie du sens d’un texte en s’intéressant essentiellement aux unités les plus stables sémantiquement » dans un texte. Le repérage des entités nommées trouve son utilité dans de nombreux domaines d’accès au sens des textes : recherche d’information, systèmes de recherche de réponses précises à des questions, extraction de connaissances, etc. Il vise ainsi à accéder aux informations contenues dans des textes dans la perspective de répondre à des questions basiques : Qui ? Quoi ? Où ? Quand ? Comment ? Pourquoi ?

La tâche de repérage des entités nommées implique généralement deux approches :

– le repérage des blocs constituant des entités, essentiellement utile pour la recherche d’information ;
– le typage des blocs précédemment identifiés parmi des classes prédéfinies, qui trouve son utilité dans l’extraction de connaissances.

Trois classes d’entités nommées — issues des premières campagnes d’évaluation — sont généralement admises :
– les noms de personnes (nom, prénom, etc.) ;
– les noms de lieux (villes, pays, continents) ;
– et les noms d’organisations (entreprises et sociétés).

Sous l’impulsion de la campagne d’évaluation MUC6, de nouvelles classes ont été proposées pour traiter les entités numériques telles que les quantités, et les expressions temporelles telles que les dates et les durées.

Nous avons repris la définition des entités nommées donnée par Ehrmann (2008) et nous nous sommes appuyés sur la taxinomie de la thèse de Tran (2006) pour les noms propres. Nous nous sommes également inspirés des travaux de Nadeau et Sekine (2007) et Sekine (2004) pour établir une hiérarchie des entités nommées.

Publicité
Commentaires
mli07 Evaluation numérique d'un module de détection de chaînes de référence
  • Les unités textuelles qui partagent la même thématique sont identifiables par des marqueurs linguistiques référentiels. Ces chaînes de références contribuent à la cohérence et à la cohésion du texte.
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Publicité