Ressources

Pro-TEXT corpus: linguistically annotated data

A part of the Pro-TEXT corpus is annotated with linguistic information, such as part-of-speech tags, lemmas and syntactic dependencies. The current version of the annotated sample can be downloaded here, under the CC BY-NC-SA 4.0 license. The corpus files are accompanied by a documentation file, which explains the formats and the intended use of the corpus files.

For any questions, contact Aleksandra Miletic.

Download here:

Corpus de travail « Enfants Poitiers »

Corpus de textes narratifs (N) et expositifs (E) enregistrés avec Inputlog auprès d’enfants de CE1, CM1, CM2, 6ème. Le code de chaque texte comprend ces métadonnées (par exemple: P22= numéro d’identification, C6=6ème, N=narratif)

A partir des informations d’enregistrement, l’outil propose actuellement la restitution du texte final et l’enchaînement linéaire des séquences de production écrite, avec marquage des suppressions.

Accès : http://syled.univ-paris3.fr/protext/PLAY-TEXTE/CORPUS-ENFANTS-Poitiers/index-inputlog.html

Corpus de travail « Traductions Montréal »

Corpus de traductions de l’anglais vers le français, enregistré avec Inputlog auprès d’étudiants de l’Université de Montréal.

A partir des informations d’enregistrement, l’outil propose actuellement la restitution du texte final et l’enchaînement linéaire des séquences de production écrite, avec marquage des suppressions.

Accès: http://syled.univ-paris3.fr/protext/PLAY-TEXTE/corpus-Traductions/index-inputlog.html

Pour toute question sur ces corpus, contacter Serge Fleury.