Modules statistiques pour NooJ
Jean-Marie VIPREY (Univ.
de Franche-Comté)
jean-marie.viprey@univ-fcomte.fr
Abstract
Les outputs textuels de NooJ sont passibles de divers calculs permettant de mettere en évidence leurs distributions internes. Il est notamment souhaitable, en première intention, de pouvoir visualiser :
· la distribution linéaire, dans un texte (par tranches équidistantes), des divers items : lexèmes, catégories morphologiques et/ou sémantiques, mannequins syntaxiques.
· la distribution partitive, dans un ensemble de textes traités de façon assez homogène dans NooJ, de ces mêmes classes d’items (déficits et excédents mesurés en termes probabilistes)
· la micro-distribution (co-occurrence) des lexèmes dans un ensemble textuel, étudiée au moyen de l’analyse factorielle des correspondances
Nous présenterons l’état de développement des modules utiles à ces fonctions (saisie, calcul, visualisation, retour au texte) et de leur intégration au système NooJ appliqué au français.
Nous présenterons également les prérequis (méthodes et ressources, anti-dictionnaires) de l’application à une langue particulière.