Lexique arabe et analyse morphologique

 

Mesfar Slim (Univ. de Franche-Comté)

 

 

Abstract

 

Le travail de construction d’un dictionnaire de verbes comportant environ 9000 entrées se base sur les travaux déjà effectués par Ibtihal Farawi. Ces verbes suivent plus de 125 classes flexionnelles. Chaque classe décrit toutes les flexions possibles du verbe en tenant compte du mode (indicatif, subjonctif et apocopé), voix (active et passive), genre et nombre.

Etant donné que l’arabe est une langue fortement agglutinante, très peu de verbes existent sous une forme simple, c’est-à-dire sans la concaténation d’au moins un préfixe et/ou un suffixe. Les formes verbales apparaissent, donc, sous formes agglutinées. La reconnaissance de ces formes nécessite plus que des simples graphes morphologiques concaténant préfixes, verbes et suffixes, mais une information supplémentaire qui est la transitivité des verbes doit être prise en compte. En effet, nous avons observé que, d’une manière générale, les suffixes ne peuvent s'agglutiner aux verbes, que si ces derniers sont Transitifs Directs.

Cette agglutination qui consiste en une simple opération de concaténation après le respect de quelques contraintes lexicales, peut engendrer des erreurs d’incompatibilité morphologique. Nous ferons intervenir des règles de réécriture qui accompagneront cette concaténation et qui permettront de générer des formes morphologiquement correctes après agglutination.

 

D’autres types de règles, comme les règles d’harmonie vocalique, doivent être introduites lors du traitement des noms. Ces règles doivent interdire toutes les combinaisons incompatibles entre préfixes, noms et suffixes dans les graphes morphologiques. Nous rappelons que, par nom, nous voulons dire, tout mot entrée du dictionnaire qui n'est pas un verbe. Ce dictionnaire va être construit à partir d’une analyse lexicale d’un corpus arabe. Les formes les plus fréquentes auront la priorité lors de nos traitements. Nous commençons alors par mettre les classes de catégories grammaticales principales qui permettront de désigner la plus de ces noms.