traduction de l ’anglais vers l’arabe

33
Traduction de l’Anglais vers l’Arabe Rabih Mustapha Intelligence Artificielle Traitement statistique des langues naturelles

Upload: mckenzie-norton

Post on 30-Dec-2015

56 views

Category:

Documents


5 download

DESCRIPTION

Intelligence Artificielle Traitement statistique des langues naturelles. Traduction de l ’Anglais vers l’Arabe. Rabih Mustapha. Traduction de l ’Anglais vers l’Arabe.  Particularité de la langue arabe  Quelques travaux faits dans ce domaine. Particularité de la langue arabe. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Traduction de l ’Anglais vers l’Arabe

Traduction de l’Anglais vers l’Arabe

Rabih Mustapha

Intelligence ArtificielleTraitement statistique des langues naturelles

Page 2: Traduction de l ’Anglais vers l’Arabe

Particularité de la langue arabe

Quelques travaux faits dans ce domaine

Traduction de l’Anglais vers l’Arabe

Page 3: Traduction de l ’Anglais vers l’Arabe

L’alphabet de la langue arabe compte 29 lettres 25 consonnes 3 voyelles longues une lettre particulière constituée de deux lettres

(l’une consonne, l’autre voyelle longue)

L’arabe s’écrit de droite à gauchenécessité d’algorithmes supplémentaires

Changement de la forme des caractères Selon la position au début, au milieu ou à la fin du mot

Les lettres généralement se lient entre elles sauf 6 qui ne se joignent pas à gauche

Particularité de la langue arabe

Page 4: Traduction de l ’Anglais vers l’Arabe

Les unités significatives Un texte se découpe en éléments significatifs ‘‘ mot

’’

Un mot en arabe est compris entre deux séparateurs(blancs , virgule, … )

Le mot arabe s’écrit avec les consonnes, les voyelles longues et les signes auxiliaires

Particularité de la langue arabe

Page 5: Traduction de l ’Anglais vers l’Arabe

On a 5 signes auxiliaires (voyelles brèves) qui s’écrivent au dessus et au dessous des lettres

A= ـــــ , I = ــــ , O = ـــــ ـــــــ , ـــــــ , ــ

sont nécessaires à la lecture et à la compréhension correcte d’un texte

Sans ces 5 signes on risque d’avoir beaucoup d’ambiguïté

À l’intérieur du mot, ils permettent de différencier 2 mots ayant le même squelette consonantique

كتب est différent de كـتب À la fin d’un mot, ils permettent de reconnaître son mode.

Particularité de la langue arabe

Page 6: Traduction de l ’Anglais vers l’Arabe

Racines et schème Un trait essentiel de la structure de l’arabe est que mis à part quelques particules, toute forme linguistique dépourvue de ses éléments flexionnels peut s’analyser fondamentalement en une racine et un schème.

Les racines des mots arabes sont constituées généralement de consonnes et exprimant la notion de base.À partir de cette racine tous les autres concepts liés à cette notion sont dérivés selon les schèmes qui sont finis.

Particularité de la langue arabe

Page 7: Traduction de l ’Anglais vers l’Arabe

Racines et schème (suite) Voyons un exemple

Soit la racine de référence R1R2R3, et la racine qui exprime la notion

‘’écrire’’ كتب Quand on ajoute A-A-A dans l’ordre à la racine, on peut exprimer le verbe

au passé pour la troisième personne du singulier au masculin

R1R2R3 كتب R1A-R2A-R3A كتب

Quand on ajoute A – I, on exprime l’agent ou l’acteur du verbe

(ici écrivain)

R1R2R3 كتب R1A-R2I-R3 كاتب

Quand on ajoute MA-U, on exprime celui ou ce qui a subi l’action.

Particularité de la langue arabe

A-A-A

A-I

Page 8: Traduction de l ’Anglais vers l’Arabe

Racines et schème (suite) De cette façon on peut déduire presque tous les mots en arabe

D’une façon générale, les étapes à suivre sont :1- Choisir une racine2- Choisir une notion parmi celles permises (acteurs par

exemple)3- Choisir la forme correspondante (schème)4- Utiliser ce schème pour produire le mot voulu

Cette caractéristique a été très utilisée par les équipes qui ont développé beaucoup de logiciels dans les domaines (automatisation de la langue arabe, conception des analyseurs automatiques pour la langue arabe et lemmatisation) et j’estime qu’ils ont bien profité de cette caractéristique pour la traduction de et vers l’arabe aussi.

N.B. La majorité des verbes arabes ont une racine composée de 3 consonnes et rarement au delà de ce nombre.

Particularité de la langue arabe

Page 9: Traduction de l ’Anglais vers l’Arabe

Structure d’un mot graphique maximal

Le mot graphique maximal est le segment graphique délimité par deux séparateurs successifs, portant toutes les marques formelles (éléments flexionnels) qu’il est capable de porter selon sa catégorie.

N.B. Les éléments flexionnels sont des indices d’aspect, de mode, de voix, de personne, de nature, de genre, de nombre,… utilisés pour la conjugaison du verbe et pour la déclination du nom .

Les Antéfixes sont des prépositions ou des conjonctions.Les préfixes et suffixes expriment les traits grammaticaux et indiquent les fonctions : cas du nom, mode du verbe et les modalités (nombre, genre, personne,…)Les post fixes sont des pronoms personnels.

Particularité de la langue arabe

Antéfixe Préfixe Corps schématique Suffixe Post fixe

Page 10: Traduction de l ’Anglais vers l’Arabe

Structure d’un mot graphique maximal (suite)Exemple récapitulatif

Particularité de la langue arabe

وننا �رـ تتذك : Ce mot exprime la phrase en français أ‘’ Est-ce que vous vous souvenez de nous ? ’’

La segmentation de ce mot donne les constituants suivants :

Antéfixe : أ conjonction d’interrogation

Préfixe :ت préfixe verbal du temps de l’inaccompli.

Suffixe : ون suffixe verbal exprimant le pluriel

Post fixe : ناpronom suffixe complément du nom

Corps schématique : ‘’ تذك�ر ’’ dérivé de la racine : ذكر selon le

schème ‘’ تفعل’’

Page 11: Traduction de l ’Anglais vers l’Arabe

Catégories des mots L’arabe considère 3 catégories de mots

Le verbe : entité exprimant un sens dépendant du temps, c’est

un élément fondamental auquel se rattache directement ou indirectement les divers mots qui constituent l’ensemble

Le nom : l’élément désignant un être ou un objet qui exprime

un sens indépendant du temps

Les particules : entités qui expriment un sens dépendant de leur

compréhension

Particularité de la langue arabe

Page 12: Traduction de l ’Anglais vers l’Arabe

Catégorie des verbes

On distingue deux grandes catégories du verbe arabeLe verbe ‘’original’’ :

toutes ses lettres sont originales, c.a.d ses lettres sont des radicales fortes (ne subissent aucun changement lors de la déclination ou la formation des mots).Les verbes originaux se décomposent en deux grandes classes :

- Les originaux terneres: ce sont des verbes dont la racine est composée de 3 lettres(6 schèmes différents)

- Les originaux quadriliteres : ces verbes sont composés de 4 lettres et se présentent sous un seul schème.

Le verbe ‘’augmenté’’ :dont une ou plusieurs lettres ne sont pas originales.Ils sont décomposés également en 2 classes.

- Verbes augmentés à partir d’un verbe original ternere,- Verbes augmentés à partir d’un verbe original quadrilitere.

Particularité de la langue arabe

Page 13: Traduction de l ’Anglais vers l’Arabe

La conjugaison des verbes Les temps sont les formes que prend le verbe pour indiquer le moment de la durée ou se situe l’action.La langue arabe dispose de 3 temps de conjugaison.

- L’accompli, - L’inaccompli, - L’impératif.

La conjugaison des verbes dépend de plusieurs facteurs: - Le facteur temps (accompli, inaccompli, impératif).- Le nombre de sujet (singulier, duel, pluriel)- Le genre du sujet (masculin, féminin)- La personne(première, deuxième et troisième personne)- Le mode (actif, passif).

Ces facteurs influencent sur la forme syntaxique du verbe, le corps schématique reste constant tandis que les éléments flexionnels changent d’un temps à un autre et d’un genre à un autre…

Particularité de la langue arabe

Page 14: Traduction de l ’Anglais vers l’Arabe

Les noms

Sont de deux catégories :- Noms dérivés : dérivés de la racine verbale, - Noms primitifs : le cas de noms propres,

noms communs, et des noms qui sont empruntés des langues étrangères.

Les noms arabes peuvent être déterminés ou non déterminés. Ils sont déterminés s’ils sont dotés d’un préfixe de détermination ou suivis d’un complément du nom.

Particularité de la langue arabe

Page 15: Traduction de l ’Anglais vers l’Arabe

Les noms (Suite) La déclination des noms arabes suit certaines règles qui sont :

- le féminin est obtenu par l’ajout d’un suffixe ‘’ ة’’

- le duel est obtenu par ajout d’un suffixe de dualité ‘’ ين’’ان

- le pluriel des noms arabes est l’un des trois cas suivants:- pluriel du masculin sain, obtenu par l’ajout d’un suffixe ‘’

ين ون ’’

- pluriel du féminin sain, obtenu par l’ajout d’un suffixe ‘’

’’ات

- pluriel ‘’brisé’’, suit une diversité de règles complexes.

Particularité de la langue arabe

Page 16: Traduction de l ’Anglais vers l’Arabe

Classification des mots On distingue 3 grandes classes des mots :

1- mot dérivé d’une racine : ces mots peuvent être soit des verbes soit des noms

2- mot outil : (préposition, conjonction, déterminent,…)

3- mot dit exceptionnel (nom propre, étranger,…) ce sont des mots qui ne sont pas issus d’une racine verbale

Particularité de la langue arabe

Page 17: Traduction de l ’Anglais vers l’Arabe

Grammaire arabe

La langue arabe dispose de deux types de phrases- Les phrases verbales- Les phrases nominales

Ces deux types différent par leur syntaxe et leur sémantique.

La syntaxe : les phrases verbales renferment un verbe, les phrases nominales en sont dépourvues, en outre, les phrases verbales débutent effectivement par un verbe, ce qui les rend désormais aisément identifiables.

La sémantique : en général, les phrases verbales décrivent des actions ou des états variants tandis que les phrases nominales introduisent des actions et des états qui sont relativement continus sur une certaine période de temps

Particularité de la langue arabe

Page 18: Traduction de l ’Anglais vers l’Arabe

Vue générale sur le marché

Manque de ressources dans le domaine de traduction de et vers l’arabe :

- Manque de spécialistes qui s’intéressent à ce domaine de recherche.

- Manque de textes parallèles anglais/arabe

Travaux réalisés

Page 19: Traduction de l ’Anglais vers l’Arabe

Quelques produits

- Identificateur de la langue du texte : Rosette language identifier.- Dictionnaires : ‘’almisbar’’- Traducteurs : ‘’An-Nakel’’, ‘’ajeeb’’, ‘’almisbar’’

Travaux réalisés

Page 20: Traduction de l ’Anglais vers l’Arabe

-Identificateur de la langue du texte : Rosette language identifier

- Produit par BASIS Technology- peut identifier jusqu’à 35 langues dont la langue arabe- utilise l’analyse statistique, ne contient aucun dictionnaire.

Travaux réalisés

Page 21: Traduction de l ’Anglais vers l’Arabe

-Identificateur de la langue du texte : Rosette language identifierExemple :

Enter text: Result :

Travaux réalisés

العر للجيش مساعدات بتقديم سورية يتهم االمريكي الدفاع ووزير شخصا، 55 بحياة يودي ببغداد شعبية سوق قصف

Identify Text

Ranking Language Encoding

Most likely Arabic UTF-8

2nd most likely Persian UTF-8

3rd most likely English UTF-8

4th most likely Danish UTF-8

5th most likely Norwegian UTF-8

Input text (converted to Unicode UTF8 encoding):بحياة قصفسوق يودي ببغداد مساعدات 55شعبية بتقديم سورية يتهم االمريكي الدفاع ووزير للجيش شخصا،

العر

Page 22: Traduction de l ’Anglais vers l’Arabe

- Dictionnaires : ‘’almisbar’’

Travaux réalisés

Page 23: Traduction de l ’Anglais vers l’Arabe

- Dictionnaire : ‘’almisbar’’

Page 24: Traduction de l ’Anglais vers l’Arabe

- Dictionnaire : ‘’almisbar’’

Page 25: Traduction de l ’Anglais vers l’Arabe

- Dictionnaire : ‘’almisbar’’

Page 26: Traduction de l ’Anglais vers l’Arabe

- Produit par Translation.net aux états unis.

- C’est un système payant (~1000 $)

- capable de traduire 60.000 mots par heure selon la vitesse

du

processeur.

- Il peut traduire un fichier complet, ou juste un paragraphe

ou une

phrase, traite les noms propres, manipule des abréviations

et

prend en considération les significations multiples.

- Il a un dictionnaire de 150.000 entrées qui peuvent être

étendues

par l'utilisateur.

- L'approche d'An-Nakel est différente de la traduction mot à

mot.

- Utilise la phrase comme unité de base de traduction dans un

système de traitement basé sur le traitement des règles et

une

base de données de connaissances.

Traducteurs : ‘’An-Nakel’’

Page 27: Traduction de l ’Anglais vers l’Arabe

-Pendant la traduction chaque phrase est analysée

profondément,

avec An-Nakel pour déterminer les différents syntagmes et

des

catégories des mots.

- Les mots sont analysés dans le contexte et des liens

sémantiques

sont établis, ce qui donne une représentation interne de la

phrase.

- Le texte cible est produit en utilisant la méthode de

transfert

selon les règles de grammaire de la langue cible (arabe).

- le texte arabe produit peut être écrit avec ou sans des

voyelles.

Traducteurs : ‘’An-Nakel’’

Page 28: Traduction de l ’Anglais vers l’Arabe

-Pendant la traduction chaque phrase est analysée

profondément,

avec An-Nakel pour déterminer les différents syntagmes et

des

catégories des mots.

- Les mots sont analysés dans le contexte et des liens

sémantiques

sont établis, ce qui donne une représentation interne de la

phrase.

- Le texte cible est produit en utilisant la méthode de

transfert

selon les règles de grammaire de la langue cible (arabe).

- le texte arabe produit peut être écrit avec ou sans des

voyelles.

Traducteurs : ‘’An-Nakel’’

Page 29: Traduction de l ’Anglais vers l’Arabe

Traducteurs : ‘’An-Nakel’’

Page 30: Traduction de l ’Anglais vers l’Arabe

Traducteurs : ‘’almisbar’’

Page 31: Traduction de l ’Anglais vers l’Arabe

Traducteurs : ‘’almisbar’’

Traduction humaineTraduction almisbar

Page 32: Traduction de l ’Anglais vers l’Arabe

Conclusion

L’arabe peut être analysé automatiquement comme les langues européennes (règles bien précises).

Peu de textes parallèles arabe-anglais, ce qui limite les travaux

sur l’arabe surtout les méthodes statistiques. La langue arabe contrairement à la langue anglaise possède un système dérivationnel très riche, et c’est dans cette caractéristique que réside la difficulté car la plupart des systèmes utilisent les règles complexes de l’arabe.

La communauté scientifique s’intéresse actuellement à l’arabe.

Traduction de l’anglais vers l’arabe

Page 33: Traduction de l ’Anglais vers l’Arabe

Références

‘’Système d’analyse syntaxico-semantique du langage arabe non voyellé ‘’, Youcef KADRI ‘’Traitement automatique de la langue arabe ‘’, Chadia MOGHRABI.

‘’Traitement automatique de l’arabe voyellé ou non’’Fathi DEBILI. ‘’L'appariement : quels problèmes?’’ Fathi DEBILI ‘’Recent developments in Machine Translation, a review of the last five years’’ W.John Hutchins ‘’Contribution à l'étude et à la reconnaissance automatique de la parole en arabe standard.’’ M. DJOUDI ‘’Système d'analyse morphologique automatique de langue arabe’’. M. HASSOUN

http://www.translation. net/an-nakel.html http://www.almisbar.com/salam_trans.html http://demos.basistech.com

Traduction de l’anglais vers l’arabe