Definition entités nommées
Référence
(à paraitre) : Mesures d’évaluation pour entités nommées structurées
Cyril Grouin Olivier Galibert Sophie Rosset Ludovic Quintard Pierre
Zweigenbaum
On
appelle « entités nommées » des éléments d’un texte qu’il est possible
de classer sur le plan sémantique. Le repérage des entités nommées est
une tâche issue de la recherche d’information. Aït Hamlat (2010)
souligne que cette tâche consiste à « accéder à une partie du sens d’un
texte en s’intéressant essentiellement aux unités les plus stables
sémantiquement » dans un texte. Le repérage des entités nommées trouve
son utilité dans de nombreux domaines d’accès au sens des textes :
recherche d’information, systèmes de recherche de réponses précises à
des questions, extraction de connaissances, etc. Il vise ainsi à accéder
aux informations contenues dans des textes dans la perspective de
répondre à des questions basiques : Qui ? Quoi ? Où ? Quand ? Comment ?
Pourquoi ?
La tâche de repérage des entités nommées implique généralement deux approches :
– le repérage des blocs constituant des entités, essentiellement utile pour la recherche d’information ;
–
le typage des blocs précédemment identifiés parmi des classes
prédéfinies, qui trouve son utilité dans l’extraction de connaissances.
Trois classes d’entités nommées — issues des premières campagnes d’évaluation — sont généralement admises :
– les noms de personnes (nom, prénom, etc.) ;
– les noms de lieux (villes, pays, continents) ;
– et les noms d’organisations (entreprises et sociétés).
Sous l’impulsion de la campagne d’évaluation MUC6, de nouvelles
classes ont été proposées pour traiter les entités numériques telles que
les quantités, et les expressions temporelles telles que les dates et
les durées.
Nous avons repris la définition des entités nommées donnée par Ehrmann (2008) et nous nous sommes appuyés sur la taxinomie de la thèse de Tran (2006) pour les noms propres. Nous nous sommes également inspirés des travaux de Nadeau et Sekine (2007) et Sekine (2004) pour établir une hiérarchie des entités nommées.