8e Journées INTEX/NooJ

Modules statistiques pour NooJ

Jean-Marie VIPREY (Univ. de Franche-Comté)
jean-marie.viprey@univ-fcomte.fr

Abstract

Les outputs textuels de NooJ sont passibles de divers calculs permettant de mettere en évidence leurs distributions internes. Il est notamment souhaitable, en première intention, de pouvoir visualiser :

· la distribution linéaire, dans un texte (par tranches équidistantes), des divers items : lexèmes, catégories morphologiques et/ou sémantiques, mannequins syntaxiques.

· la distribution partitive, dans un ensemble de textes traités de façon assez homogène dans NooJ, de ces mêmes classes d’items (déficits et excédents mesurés en termes probabilistes)

· la micro-distribution (co-occurrence) des lexèmes dans un ensemble textuel, étudiée au moyen de l’analyse factorielle des correspondances

Nous présenterons l’état de développement des modules utiles à ces fonctions (saisie, calcul, visualisation, retour au texte) et de leur intégration au système NooJ appliqué au français.

Nous présenterons également les prérequis (méthodes et ressources, anti-dictionnaires) de l’application à une langue particulière.