Site de l'université de Franche-Comté
ELLIADD

Développement de la plateforme TXM (Textométrie)

Logo TXM

Le projet Textométrie (TXM) regroupe des développements logiciels open-source réalisés dans le domaine de l’analyse de données textuelles et de la statistique lexicale en synergie avec les technologies de corpus actuelles (Unicode, XML, TEI, outils de TAL, CQP, R) qui caractérisent la nouvelle génération de recherche textométrique.

La plateforme TXM permet l'exploration de grands corpus textuels dans une démarche d'analyse quantitative et qualitative pratiquée dans plusieurs disciplines. Le logiciel propose en effet le traitement statistique aussi bien qu’hypertextuel des corpus par ses différentes fonctionnalités (lexiques, index fréquentiels à partir de requêtes avancées, concordances, occurrences, cooccurrences, statistiques multidimensionnelles, classifications, AFC, visualisations graphiques, etc.).

TXM a une vocation pluridisciplinaire et implique des champs d’étude variés tels que la linguistique, les sciences de l’information et de la communication, la sociologie, la littérature, la psychologie, l’histoire, la géographie, les sciences économiques ainsi que les sciences politiques. Au-delà de la dimension patrimoniale, les possibilités de diffusion et d'exploration de corpus de différentes langues ou encore multilingues, donnent au projet un rayonnement international. En effet, la large communauté d'utilisateurs de TXM est toujours grandissante. Le projet TXM est également partenaire du consortium CORLI de Huma-Num, la TGIR des humanités numériques.

Depuis 2007, avec le démarrage du projet ANR « Textométrie », des chercheur.es et ingénieur.es d'ELLIADD font partie intégrante de l'équipe de développement de la plateforme TXM pilotée par l'UMR IHRIM de l'ENS de Lyon.

Aujourd'hui, ce partenariat privilégié, ELLIADD-IHRIM, se traduit par une coopération solide et la participation active au développement du logiciel TXM Desktop/RCP (version bureau) et dans sa forme TXM Web GWT (version portail Web).

Dans ce partenariat, les ingénieur.es et les enseignant.es-chercheur.es de l'équipe TXM d'ELLIADD apporte son expertise scientifique, ses savoirs et ses compétences en ingénierie, notamment dans les domaines de l'indexation et l'étiquetage de corpus et dans celui des visualisations graphiques interactives.

Plus d'informations sur le site : http://textometrie.ens-lyon.fr

 

Présentation de l'interface de TXM

(cliquer sur les images pour les agrandir)

Concordance de « notre avenir » dans le corpus VOEUX (éd. Jean-Marc Leblanc, CEDITEC, UPEC)

Concordance de « notre avenir » dans le corpus VOEUX 
(éd. Jean-Marc Leblanc, CEDITEC, UPEC)

 

 

Graphique de progression des mots « France », « pays », « Europe », « monde » dans le corpus VOEUX (éd. Jean-Marc Leblanc, CEDITEC, UPEC)

Graphique de progression des mots « France », « pays », « Europe », « monde » dans le corpus VOEUX
(éd. Jean-Marc Leblanc, CEDITEC, UPEC)

 

 

Cooccurrents du mot « paix » dans le corpus VOEUX (éd. Jean-Marc Leblanc, CEDITEC, UPEC)

 Cooccurrents du mot « paix » dans le corpus VOEUX
(éd. Jean-Marc Leblanc, CEDITEC, UPEC)

 

 

Analyse factorielle des correspondances sur la partition « locuteurs » du corpus VOEUX (éd. Jean-Marc Leblanc, CEDITEC, UPEC)

Analyse factorielle des correspondances sur la partition « locuteurs » du corpus VOEUX
(éd. Jean-Marc Leblanc, CEDITEC, UPEC)

 

 

Retour au texte à partir d'une concordance avec affichage synoptique de l'édition de la Queste del saint Graal (éd. C. Marchello-Nizia et A. Lavrentiev, Lyon, BFM, 2019) : trois niveaux de transcription (normalisée, diplomatique et facsimilaire) et fac-similé du manuscrit

Retour au texte à partir d'une concordance avec affichage synoptique de l'édition de la Queste del saint Graal (éd. C. Marchello-Nizia et A. Lavrentiev, Lyon, BFM, 2019) : trois niveaux de transcription (normalisée, diplomatique et facsimilaire) et fac-similé du manuscrit