RENDEZ VOUS T2
RV dans 15 jours à 14 h00
- Annoter le fichier de l'acquis communautaire à envoyer lundi.
- Annoter dans un premier temps en identifiant tous les termes à annoter puis construire les relations et les schémas puis procéder au nettoyage
- Pour le corpus Est Républicain : schéma TEI,si trouve pas, venir avec du concret pour régler le pb de la procédure XSLT
- Comment faire un Fichier .aam ?
- Liste des balises:
- unités:
- nom propre
- nom de fonction (grade, métier...)
- pronom
- possessif
- défini
- demnstratif
- relations
- il n'est pas à l'ordre du jour de dissocier fusion et division des chaines de reference
- exemple
- schéma
- le schéma doit comprendre une relation pour pouvoir être traité
- balise
- question à quoi correspond la balise singlePosition ?
" il s'agit d'un
élément indiquant une
position dans le texte, par positionnement en termes de nombre de
caractères depuis le début du document.
Par exemple :
<unit id="TXT_IMPORTER_
1265212542146">
<metadata>
<author>TXT_IMPORTER</author>
<creation-date>1265212542146</
</metadata>
<characterisation>
<type>paragraph</type>
<featureSet/>
</characterisation>
<positioning>
<start>
<singlePosition index="684"/>
</start>
<end>
<singlePosition index="1351"/>
</end>
</positioning>
Il s'agit ici de la description d'une unité de type "paragraph" qui est
située entre le caractère 684 et 1351 du fichier .ac correspondant.
Il faut bien comprendre qu'il s'agit d'annotation "déportées", ou
"stand-off", c'est-à-dire que les informations d'annotations sont
placées dans un autre fichier que le texte lui même (à l'inverse d'un
XML classique), si bien qu'il faut bien que les annotations indiquent à
quelles positions elles font référence dans le texte.
Attention, cet index est purement positionnel, et n'est pas à confondre
avec les identifiants des unités, relations ou schémas, qui sont eux des
identifiants uniques permettant de faire référence de façon bi-univoque
à n'importe quel élément (par exemple lors de la mise en relation de
deux unités, la relation fera référence aux deux identifiants
correspondants, et non à des positions dans le texte).
"