Prédicats verbaux et nominaux

reliant des noms d'entités biologiques

Mohamed Mahdi Malik

et Jean Royauté (LIF-CNRS, Marseille)

 
 
Abstract
 
Nous nous intéressons aux relations existant entre les différentes entités biologiques ou processus biologiques présents dans des textes scientifiques (protéines, gènes, maladies, etc.). Ces relations s’expriment dans des phrases au moyen de structures prédicatives qui mettent en relation un prédicat (verbal, nominal ou adjectival) et ces arguments (sujet et complément(s)). Notre corpus comprend 6256 références bibliographiques extraites de la base de données Medline dans le domaine de la génétique des cancers de la thyroïde. Dans ce type de textes les nominalisations abondent et il est fréquent de rencontrer le même prédicat apparaissant sous une forme nominale ou verbale. Si il est relativement aisé de capturer l’information relationnelle du prédicat sous sa forme verbale, en identifiant les actants sujet et complément(s), il n’en est pas de même pour les prédicats sous forme nominale ou les actants apparaissent sous forme de groupes prépositionnels. Nous montrons ici la méthodes nous permettant de marquer les actants de ces groupes nominaux prédicatifs avec des prépositions appropriées.
 
Notre première tâche a consisté à identifier avec des transducteurs morphologiques, les nominalisations présentes dans ces textes. Ces transducteurs nous ont permis de relier, à partir d’opérations morphologiques simples portant sur une dizaine de suffixes, les substantifs du corpus aux verbes du Delaf anglais. Cela nous a permis d’isoler un sous ensemble de prédicats apparaissant à la fois sous une forme nominale et verbale (1622 occurrences). Nous avons ensuite créer une base lexicale de prédicats à partir du Lexicon, lexique issus d’UMLS (projet création de base de connaissances à partir de thésaurus de médecine et biologie). Pour faciliter sa manipulation, les informations de cette base lexicale ont été mises dans une base de données relationnelles ORACLES. Ces informations lexicales nous permettent d’avoir une amorce de lexique-grammaire où pour chaque verbe nous connaissons ces différents emplois : intransitif, transitif avec ou sans préposition, ditansitif, verbe à particules, etc. Pour chacun de ces verbes nous connaissons les nominalisations associées et les prépositions pouvant apparaître dans la structure du groupe nominal prédicatif. Cependant aucun lien n’est fait entre ces prépositions et les actants qu’elles sont susceptibles de marquer. Par rapport à ces données, notre objectif est double : (i) à partir des information de chaque verbe, nous cherchons à renseigner le rôle de chaque préposition dans les nominalisations, (ii) en exploitant ces informations, nous montrons comment peut s’analyser ces GN prédicatifs en corpus.