TROIS TRAVAUX
**travail 1 : test des outils d'annotation
-
récupérer
un extrait de corpus (je vous conseille de piocher dans les résumés de
film) et essayer de l'annoter avec GLOZZ, MMAX et GATE
- comparer les sorties
(avantages et difficultés de la prise en main / l'utilisation de chacun
des outils) et faire un petit état de tout cela par écrit (rapidement).
** travail 2 : constitution du corpus de l'Est Républicain
- trouver une procédure automatique XSLT
pour récupérer le texte.
-
envoyer le corpus pour l'étiqueter sous TTL.
** travail 3 : annotation manuelle préliminaire
- éléments à annoter :
noms propres et noms de fonction, pronoms, possessifs, descriptions
définies, groupes nominaux avec une relative (le chat qui a la patte
cassée)
#lecture 1
= on annote toutes les expressions référentielles
#lecture 2 =
on rattache les expressions référentielles qui appartiennent à une
chaîne de référence et on note la position de chaque maillon dans la
chaine (maillon 1, 2, ...)
- éléments
qu'on ne prendra pas en compte : les anaphores associatives, les
anaphores plurielles, et les partitives
-- faire un état des
problèmes
rencontrés pour annoter (phrase + question/choix d'annotation) de
manière précise pour que l'on en discute la prochaine fois.