ANR Pro-TEXT – Les processus de textualisation: modélisations linguistiques, psycholinguistiques et d’apprentissage automatique
Processes of Textualization: Linguistic, Psycholinguistic, and Machine Learning Modeling
N° ANR-18-CE23-0024-01
Thèmes de recherche
- Sciences du langage (textualisation, linguistique du texte et du discours, sémantique, grammaire de l’écrit et de l’oral, grammaire des constructions, textométrie, littératie, etc.)
- Psycholinguistique et psychologie cognitive
- TAL
- Intelligence artificielle
Le projet Pro-TEXT ambitionne d’élucider les dynamiques du processus de textualisation, grâce à la modélisation des relations entre les indices temporels des processus cognitifs et la nature des formes linguistiques produites lors de l’écriture enregistrée. Cette recherche interdisciplinaire innovante vise à rendre compte des régularités de production des jets textuels (séquences produites entre deux pauses: [p] le sens de [p]) en français, à travers une approche inductive articulant des données linguistiques et comportementales multi-paramétiques, et des méthodes d’apprentissage automatique.
Cette approche novatrice donnera lieu à une analyse linguistique complète des jets textuels en mettant en relation les régularités incrémentales du processus de textualisation et les contraintes cognitives et contextuelles de la performance langagière. Le projet Pro-TEXT va en outre développer des méthodes et des outils modélisant ces régularités et mettant en évidence des schémas de textualisation.