Étude de l’Albanais en vue de construire des outils

pour son traitement automatique.

 

Odile Piton (Univ. Paris 1)

et Remzi Përnaska (INALCO)

 

 

Abstract

 

Plusieurs travaux récents ont conduit à la publication, chez l’Harmattan, d’ouvrages de présentation de la langue albanaise dite « langue littéraire » : ce sont d’une part  une grammaire de l’albanais « Parlons albanais » de Chr. Gut, A. Brunet-Gut et R. Përnaska, et  d’autre part un manuel de conjugaison des verbes albanais de F. Neziroski. En collaboration avec Remzi Përnaska j’ai commencé à constituer un embryon de dictionnaire : 1380 noms masculins, 1500 noms féminins,  plus de 1000 verbes, de 800 adjectifs, 280 adverbes en vue de la constitution d’outils adaptés au traitement automatique de cette langue, et tenant compte de sa spécificité. La langue albanaise, langue  indo-européenne, est une langue à  double déclinaison. La plupart des verbes possèdent  deux formes : la forme active et la forme non-active qui possèdent chacune leur conjugaison.

La langue littéraire, est le résultat d’une volonté politique d’unifier la langue. Juxtaposition de plusieurs dialectes principalement : le Guègue ou dialecte du Nord, et le Tosque ou dialecte du Sud, la langue albanaise fut soumise à la triple influence ottomane, grecque et latine, et objet d’une triple écriture. Le processus de normalisation, engagé au XIXème siècle, s’est concrétisé d’abord par  le choix de l’alphabet latin, au Congrès de Monastir en 1908, puis par la décision d’unification de la langue au Congrès de l’orthographe de 1972. Cette langue littéraire, davantage basée sur le Tosque que sur le Guègue, est la langue de l’enseignement et des médias. Cette langue a été adoptée par les Albanais d’Italie, et ceux du Kosovo.