Extraction de connaissances

pour la modélisation des épidémies

 

Michel Roux,  Hervé Chaudet, Manal El Zant,

Liliane Pellegrin (LIF – Université de la Méditerranée

Université de Provence)

 

 

Abstract

 

Notre travail s'insère dans le projet "Epidémia" dont l'objectif est de tenir à jour l'état des épidémies dans le monde et de mettre cette base de connaissance à la disposition des professionnels.

Il s'agit de modéliser les épidémies et leurs évolutions à l'aide de l'extraction des connaissances contenues dans les dépêches épidémiologiques élaborées par différents organismes internationaux.

 

L’objectif alors est de pouvoir interpréter naturellement, et désigner des évènements complexes faisant intervenir le temps ainsi que le lieu, dans un langage de programmation en logique du premier ordre.

Trois composantes du discours doivent donc être identifiées et représentées de façon coordonnée dans le langage de représentation : l’évènement (simple ou complexe), le temps et le lieu.

 

Pour cela nous disposons d'un corpus de plusieurs centaines de dépêches.

Nous avons complété le dictionnaire de base de NooJ avec les mots spécifiques de notre corpus. L'option +UNAMB nous permet de lever les nombreuses ambiguïtés générées par les très nombreux mots composés.

En l'état actuel nos efforts se sont portés vers la détection des localisations spatiales et temporelles. Pour ces dernières nous avons utilisé et compléter les graphes de M. Gross.

Pour le type d'évènements, nous étudions dans un premier temps les verbes d'action.

 

Nous sommes arrivé à une étape intermédiaire. La reconnaissance des éléments spatiaux et temporels est acquise. Celle des types d'évènements mérite une étude approfondie.

Par ailleurs l'apparition de NooJ est l'occasion de "mettre à plat" le travail déjà réalisé.

Le passage à NooJ nous donne plus de souplesse au niveau des dictionnaires, des variables et de la récursivité.

La diversité des informations : déclaration de cas, analyse des pathologies, commentaires parfois très personnels, conseils préventifs, curatifs, les différents moyens de transport,… reste un problème à résoudre.