Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
mli07 Evaluation numérique d'un module de détection de chaînes de référence
Archives
10 février 2010

TROIS TRAVAUX

**travail 1 : test des outils d'annotation

- récupérer un extrait de corpus (je vous conseille de piocher dans les résumés de film) et essayer de l'annoter avec GLOZZ, MMAX et GATE
- comparer les sorties (avantages et difficultés de la prise en main / l'utilisation de chacun des outils) et faire un petit état de tout cela par écrit (rapidement).

** travail 2 : constitution du corpus de l'Est Républicain

- trouver une procédure automatique XSLT pour récupérer le texte.
- envoyer le corpus pour l'étiqueter sous TTL.

** travail 3 : annotation manuelle préliminaire

- éléments à annoter : noms propres et noms de fonction, pronoms, possessifs, descriptions définies, groupes nominaux avec une relative (le chat qui a la patte cassée)
               #lecture 1 = on annote toutes les expressions référentielles
               #lecture 2 = on rattache les expressions référentielles qui appartiennent à une chaîne de référence et on note la position de chaque maillon dans la chaine (maillon 1, 2, ...)
- éléments qu'on ne prendra pas en compte : les anaphores associatives, les anaphores plurielles, et les partitives
-- faire un état des problèmes rencontrés pour annoter (phrase + question/choix d'annotation) de manière précise pour que l'on en discute la prochaine fois.

Publicité
Commentaires
mli07 Evaluation numérique d'un module de détection de chaînes de référence
  • Les unités textuelles qui partagent la même thématique sont identifiables par des marqueurs linguistiques référentiels. Ces chaînes de références contribuent à la cohérence et à la cohésion du texte.
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Publicité