Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
mli07 Evaluation numérique d'un module de détection de chaînes de référence
Archives
8 mars 2010

RENDEZ VOUS T2

RV dans 15 jours à 14 h00

  1. Annoter le fichier de l'acquis communautaire à envoyer lundi.
  2. Annoter dans un premier temps en identifiant tous les termes à annoter puis construire les relations et les schémas puis procéder au nettoyage
  3. Pour le corpus Est Républicain : schéma TEI,si trouve pas, venir avec du concret pour régler le pb de la procédure XSLT
  4. Comment faire un Fichier .aam ?
  5. Liste des balises:

- unités:

  • nom propre
  • nom de fonction (grade, métier...)
  • pronom
  • possessif
  • défini
  • demnstratif

- relations

  • il n'est pas à l'ordre du jour de dissocier fusion et division des chaines de reference
  • exemple

- schéma

  • le schéma doit comprendre une relation pour pouvoir être traité

- balise

  • question à quoi correspond la balise singlePosition ?

" il s'agit d'un élément indiquant une position dans le texte, par positionnement en termes de nombre de caractères depuis le début du document.

Par exemple :

<unit id="TXT_IMPORTER_
1265212542146">
<metadata>
<author>TXT_IMPORTER</author>
<creation-date>1265212542146</
creation-date>
</metadata>
<characterisation>
<type>paragraph</type>
<featureSet/>
</characterisation>
<positioning>
<start>
<singlePosition index="684"/>
</start>
<end>
<singlePosition index="1351"/>
</end>
</positioning>

Il s'agit ici de la description d'une unité de type "paragraph" qui est située entre le caractère 684 et 1351 du fichier .ac correspondant.


Il faut bien comprendre qu'il s'agit d'annotation "déportées", ou "stand-off", c'est-à-dire que les informations d'annotations sont placées dans un autre fichier que le texte lui même (à l'inverse d'un XML classique), si bien qu'il faut bien que les annotations indiquent à quelles positions elles font référence dans le texte.


Attention, cet index est purement positionnel, et n'est pas à confondre avec les identifiants des unités, relations ou schémas, qui sont eux des identifiants uniques permettant de faire référence de façon bi-univoque à n'importe quel élément (par exemple lors de la mise en relation de deux unités, la relation fera référence aux deux identifiants correspondants, et non à des positions dans le texte).
"

Publicité
Commentaires
mli07 Evaluation numérique d'un module de détection de chaînes de référence
  • Les unités textuelles qui partagent la même thématique sont identifiables par des marqueurs linguistiques référentiels. Ces chaînes de références contribuent à la cohérence et à la cohésion du texte.
  • Accueil du blog
  • Créer un blog avec CanalBlog
Publicité
Publicité