outils de terminotique et d aide a la traduction

8
Glossaire des outils de terminotique et d’aide à la traduction aligneur (angl. : aligner) Définition Outil qui relie formellement les composantes (normalement les phrases) dun texte source et dun texte cible pour quun utilisateur puisse les consulter simultanément. Le tout produit ce quil est convenu dappeler un bitexte. Exemples * Fonction de création de bitexte dans LogiTerm * Aligneur TextBase dans MultiTrans * Aligneur dans Fusion Translate * WinAlign dans SDL Trados * Certains concordanciers bilingues, comme ParaConc, contiennent des fonctions d’alignement * YouAlign (outil gratuit en ligne) youalign.com/Default.aspx analyseur de texte Définition Voir www.ling.uqam.ca/sato/glossaire/glos_a.htm#ana_ Exemples * WordSmith www.lexically.net/wordsmith/version5/index.html * FIPSColor (analyse syntaxique du français) cms.unige.ch/lettres/linguistique/nebhi/FipsColor * SATO (inscription gratuite) www.ling.uqam.ca/sato * Outils du Summer Institute of Linguistics www.sil.org/computing/catalog/show_software_catalog.asp?by=cat&name=Text+Analysis * Syntax Student Companion www-clips.imag.fr/geta/aurelien.max/SSC/frames.html base de données (angl. : database) Définitions base de connaissances Voir fr.wikipedia.org/wiki/Base_de_connaissance Voir aussi www.commentcamarche.net/faq/4855-organisation-creer-une-base-de-connaissances base de données bibliographiques Voir fr.wikipedia.org/wiki/Base_de_donn%C3%A9es_bibliographiques Voir aussi www.h-h.ca/navigation/page_banques.php?page=1 et www.uclouvain.be/67394.html base de données textuelles Voir www.thesaurus.gouv.qc.ca/tag/terme.do?id=1447 bitexte (angl. : bitext) Définitions Ensemble composé de textes source et de textes cibles dont les composantes formelles (les phrases ou les paragraphes) ont été alignées afin den faciliter la consultation. Voir aussi aligneur. Voir aussi alignalco.free.fr/alignalco/bi-texte.html et en.wikipedia.org/wiki/Parallel_text

Upload: eric-dufour

Post on 28-Dec-2015

88 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Outils de Terminotique Et d Aide a La Traduction

Glossaire des outils de terminotique et d’aide à la traduction

aligneur

(angl. : aligner)

Définition

Outil qui relie formellement les composantes (normalement les phrases) d’un texte source et d’un texte cible pour

qu’un utilisateur puisse les consulter simultanément. Le tout produit ce qu’il est convenu d’appeler un bitexte.

Exemples

* Fonction de création de bitexte dans LogiTerm

* Aligneur TextBase dans MultiTrans

* Aligneur dans Fusion Translate

* WinAlign dans SDL Trados

* Certains concordanciers bilingues, comme ParaConc, contiennent des fonctions d’alignement

* YouAlign (outil gratuit en ligne) youalign.com/Default.aspx

analyseur de texte

Définition

Voir www.ling.uqam.ca/sato/glossaire/glos_a.htm#ana_

Exemples

* WordSmith www.lexically.net/wordsmith/version5/index.html

* FIPSColor (analyse syntaxique du français) cms.unige.ch/lettres/linguistique/nebhi/FipsColor

* SATO (inscription gratuite) www.ling.uqam.ca/sato

* Outils du Summer Institute of Linguistics www.sil.org/computing/catalog/show_software_catalog.asp?by=cat&name=Text+Analysis

* Syntax Student Companion www-clips.imag.fr/geta/aurelien.max/SSC/frames.html

base de données

(angl. : database)

Définitions

base de connaissances

Voir fr.wikipedia.org/wiki/Base_de_connaissance

Voir aussi www.commentcamarche.net/faq/4855-organisation-creer-une-base-de-connaissances

base de données bibliographiques

Voir fr.wikipedia.org/wiki/Base_de_donn%C3%A9es_bibliographiques

Voir aussi www.h-h.ca/navigation/page_banques.php?page=1 et www.uclouvain.be/67394.html

base de données textuelles

Voir www.thesaurus.gouv.qc.ca/tag/terme.do?id=1447

bitexte

(angl. : bitext)

Définitions

Ensemble composé de textes source et de textes cibles dont les composantes formelles (les phrases ou les

paragraphes) ont été alignées afin d’en faciliter la consultation. Voir aussi aligneur.

Voir aussi alignalco.free.fr/alignalco/bi-texte.html et en.wikipedia.org/wiki/Parallel_text

Page 2: Outils de Terminotique Et d Aide a La Traduction

concordancier

(angl. : concordancer)

Définitions

Ensemble de programmes qui repèrent les occurrences d’une chaîne de caractères (un mot, une partie de mot ou

une suite de mots) dans un ou plusieurs textes électroniques.

Voir fr.wikipedia.org/wiki/Concordancier et www.univ-montp3.fr/sl/rachel/E42SLL1/concordancier.htm

Voir aussi ecolore.leeds.ac.uk/xml/materials/overview/tools/concordancer.xml?lang=fr

Exemples

* Fonctions de recherche plein texte et bitexte de LogiTerm

* Page de LinguisTech sur les concordanciers www.linguistech.ca/Outils+en+ligne+-+accueil#concordanciers

* Concordance www.concordancesoftware.co.uk

* WebCorp www.webcorp.org.uk/live

* ConcQuest w3.u-grenoble3.fr/kraif/ConcQuest/concquest.php

* HyperTextBooks Concordancer papyr.com/applets/concordancer

* GlossaNet glossa.fltr.ucl.ac.be

corpus

(angl. : corpus, pl. corpora)

Définition

Collections de textes en format électronique qui ont été construites afin d’assister les utilisateurs dans leur étude

de la langue et de son usage. Ils sont généralement conçus pour fournir un échantillon représentatif qui donne une

vue d’ensemble d’un certain type de langage (p. ex. dans un registre, une région, un champ ou un type de texte

particulier). Ces collections de textes peuvent aider les utilisateurs à déterminer comment les unités lexicales sont

couramment utilisées ou combinées.

Généralement, on fait une recherche dans un corpus en utilisant un concordancier unilingue ou bilingue.

Exemples

* Frantext www.frantext.fr

* British National Corpus www.natcorp.ox.ac.uk

* Brown Corpus en.wikipedia.org/wiki/Brown_Corpus

* Corpus du journal Le Monde www.lextutor.ca/concordancers/concord_f.html

* Corpus Reuters about.reuters.com/researchandstandards/corpus

* European Language Resources Association www.elra.info

* WebCorp www.webcorp.org.uk/live

dépouilleur terminologique

extracteur de termes

extracteur terminologique

(angl. : term-extraction software, term extractor, termer)

Définition

Outils informatiques qui analysent des textes dans un format électronique et qui identifient les candidats-termes

(i.e. unités lexicales qui semblent être des termes dans un domaine spécifique).

Exemples

* Les environnements de traduction comme SDL, MultiTrans, LogiTerm et Fusion Translate offrent des fonctions

d’extraction ou de dépouillement

* TermoStat (inscription gratuite) olst.ling.umontreal.ca/~drouinp/termostat_web

Page 3: Outils de Terminotique Et d Aide a La Traduction

édition électronique

éditique

(angl. : desktop publishing)

Définitions

éditique

Méthode d’édition permettant de créer et de publier au moyen d’un micro-ordinateur, de progiciels, de logiciels

spécialisés et d’une imprimante de qualité des documents comparables à ceux obtenus par photocomposition

PAO

Voir fr.wikipedia.org/wiki/Publication_assist%C3%A9e_par_ordinateur

PréAO

Voir www.clionautes.org/IMG/tutorielPPT.pdf

Voir formation.paris.iufm.fr/~pigeollot/cours_en_ligne/preao/preao.html

Exemples

* Scribus fr.wikipedia.org/wiki/Scribus

* OpenOffice www.openoffice.org/fr

* LibreOffice fr.libreoffice.org

* MS Office office.microsoft.com/fr-fr

* GIMP www.gimp.org

environnement de traduction

(angl. : translation environment, translation environment tool [TenT])

Définition

Système qui comprend plusieurs outils différents destinés aux traducteurs dans une seule et même interface

intégrée. Cet environnement de traduction est habituellement centré autour des systèmes gestion de mémoires de

traduction ou des outils semblables, mais inclut généralement les fonctions suivantes : aligneur de bitextes,

système de gestion de données terminologiques, dépouilleur terminologiques, traducteur de vocabulaire et

concordancier bilingue et/ou unilingue. Certains permettent également l’intégration de la traduction automatique.

Exemples

* SDL Trados, Fusion Translate, LogiTerm, MultiTrans, WordFast et OmegaT.

étiquetage

(angl. : part-of-speech tagging)

Définition

Activité qui consiste à expliciter, dans un texte, différents éléments d’une unité linguistique, par exemple la

catégorie grammaticale, des informations flexionnelles, le lemme, etc.

Exemples

* TreeTagger (anglais) web4u.setsunan.ac.jp/Website/TreeOnline.htm

* Laboratoire d’analyse et de technologie du langage (lemmatiseur anglais/français)

(essayer les fonctions « Tagger » et « Parser ») latlapps.unige.ch/Parser

Page 4: Outils de Terminotique Et d Aide a La Traduction

gestionnaire de données terminologique

système de gestion de données terminologiques

(angl. : terminology management system)

Définition

Outil qui fonctionne de façon similaire aux systèmes de gestion de bases de données génériques, mais qui est

spécifiquement conçu pour assister les traducteurs et autres professionnels du langage dans le stockage et la

gestion de données terminologiques (e.g. termes, équivalents, domaines, définitions, contextes et sources).

Il est important de noter la différence entre les systèmes de gestion de données terminologiques (généralement

utilisés pour stocker des fiches personnelles ou des fiches pour un petit groupe d’utilisateurs) et les banques de

données terminologiques (qui sont généralement créées et utilisées par des organisations ou peuvent même être

des produits publiques ou commerciaux comme TERMIUM® ou le GDT).

Exemples

* SDL Trados MultiTerm

* Certains environnements de traduction comme MultiTrans, LogiTerm et Fusion Translate comprennent aussi des fonctions

de gestion de données terminologiques

gestionnaire de mémoires de traduction

système de gestion de mémoires de traduction

(angl. : translation memory system)

Définition

Système conçu pour permettre aux traducteurs d’épargner temps et effort lors de la traduction de documents qui

contiennent des répétitions (soit internes, à l’intérieur d’un même texte, ou externes, à l’intérieur de documents

similaires). Les systèmes de gestion de mémoires de traduction stockent dans une base de données appelée une

mémoire de traduction des segments de textes qui ont été traduits, ainsi que leurs traductions.

Il ne faut pas confondre les systèmes de gestion de mémoires de traduction avec les systèmes de traduction

automatique (TA). Les mémoires de traduction permettent aux humains de recycler des segments de traductions

déjà faites par l’humain alors que les systèmes de TA effectuent des traductions de façon automatique et

dépendent très souvent de l’humain pour ensuite éditer la traduction. Bien que certains processus ou environnements

de traduction intègrent ces deux types d’outils, le fonctionnement de ces derniers est tout à fait différent.

Exemples

* Déjà Vu, Fusion Translate et SDL Trados (plus spécifiquement l’outil Translator’s Workbench)

* Des outils similaires se trouvent aussi dans les environnements de traduction de MultiTrans et LogiTerm

indexation

(angl. : indexing)

Définition

Traitement informatique qui consiste à diviser un texte en mots (c’est-à-dire de découper le texte en chaînes de

caractères discontinues) et à retenir pour chacune des occurrences de ces mots leur adresse dans le texte en vue de

les retrouver rapidement par la suite.

langage artificiel

(angl. : artificial language)

Définition

Langage, composé d’un vocabulaire et d’une syntaxe réduits, élaboré dans une optique particulière,

p. ex. langages informatiques, notation musicale, opérations mathématiques.

Page 5: Outils de Terminotique Et d Aide a La Traduction

langue naturelle

langage naturel

(angl. : natural language)

Définitions

Une des différentes formes du langage humain, comme l’espagnol, le français ou le russe.

Voir l’article « Le langage est-il naturel? » www.scienceshumaines.com/le-langage-est-il-naturel_fr_11993.html

Voir aussi Langage (avec sous-section « Langue naturelle et langue artificielle » dans le texte)

www.thecanadianencyclopedia.com/articles/fr/langage

Exemples

* Identification des langues www-rali.iro.umontreal.ca/rali/?q=fr/node/1223

* Nomino Assistant www.coginov.com/Produits/Nominoassistant/tabid/103/language/en-US/Default.aspx

* Les applications du traitement automatique du langage naturel

fr.wikipedia.org/wiki/Traitement_automatique_du_langage_naturel#Les_applications_TAL

* Présentation sur le traitement automatique du langage naturel www-lipn.univ-paris13.fr/~audibert/pages/enseignement/TAL_ITCN.pdf

* Mondeca (application du TAL dans le cadre de bases de connaissances sémantiques) www.mondeca.com/fr

lemmatiseur

(angl. : lemmatizer)

Définition

lemmatisation

Voir www.concordancesoftware.co.uk/manual/hs2330.htm et www.ling.uqam.ca/sato/glossaire/glos_l.htm#lemmatisation

Exemples

* Lemmatiseur du latin collatinus.fltr.ucl.ac.be/

* Lemmatiseur pour le moyen français et la langue française du XVIIe siècle www.atilf.fr/dmf/LGeRM

linguistique informatique

(angl. : computational linguistics)

Définition

Branche de la linguistique dont l’objet est la mise au point de modèles et de techniques pour faire traiter la langue

par des programmes informatiques.

Voir www.ling.uqam.ca/sato/glossaire/glos_l.htm#linguistique_informatique

Voir aussi www.linguistes.com et www.sfu.ca/fren270/introduction/index.html

Exemples

* Laboratoire d’Analyse et de Technologie du Langage www.latl.unige.ch

* Centre de traitement automatique du langage www.uclouvain.be/cental.html

* Analyse et traitement informatique de la langue française www.atilf.fr

* Compleat Lexical Tutor www.lextutor.ca

* Recherche appliquée en linguistique informatique de l’Université de Montréal www-rali.iro.umontreal.ca/rali/?q=fr/accueil

Page 6: Outils de Terminotique Et d Aide a La Traduction

mémoire de traduction

translation memory

Définitions

mémoire de traduction

Ensemble de programmes qui établissent une correspondance entre des phrases à traduire contenues dans un texte

source et des phrases préalablement traduites répertoriées dans une base de données. Si une correspondance est

établie, ils extraient les phrases cible associées aux phrases source répertoriées.

Voir aussi www.sdl.com/fr/technology/language-technology/what-is-translation-memory.html

Voir aussi ecolore.leeds.ac.uk/xml/materials/overview/tools/translation_memory.xml?lang=fr

mémoire de traduction à reconnaissance avancée (MTRA)

Voir www.multicorpora.com/fr/ressources/reconnaissance-avancee/

outils de localisation

(angl. : localization tools)

Définition

La localisation est une tâche qui implique la traduction et l’adaptation d’une page Web, d’un logiciel ou d’un

autre produit pour une communauté linguistique et culturelle particulière. Plusieurs participants sont généralement

impliqués dans le processus puisque la tâche implique la manipulation de codes informatiques complexes.

Bon nombre d’outils de localisation ont été créés afin d’assister les traducteurs et autres professionnels de la

localisation dans la gestion des complexités de la tâche (y compris la gestion des projets, le calcul d’un estimé ou

d’un décompte de mots exact, la séparation des composants textuels à traduire du code informatique qui doit être

préservé, et la gestion des données terminologiques et des textes ou segments de textes déjà traduits).

Exemples

* Alchemy Catalyst www.alchemysoftware.ie

* SDL Passolo www.sdl.com/products/sdl-passolo

* Aquino WebBudget www.amicus-transtec.com/en-gb/Website_Translation/Aquino_Software/WebbudgetXT.html

système de gestion de bases de données

SGBD

(angl. : database management system, DBMS)

Définition

Ensemble de programmes permettant de stocker des données logiquement reliées, de les organiser et de les interroger.

Exemples

* FileMaker Pro, Microsoft Access, MySQL, Oracle Database, OpenOffice.org Base

système de traduction automatique

(angl. : machine translation system)

Définition

Système qui prend en charge le processus entier de traduction de textes. Il y a différentes techniques sous-jacentes

utilisées par les systèmes de traduction automatique. Certaines tentent d’imiter la façon dont les humains

analysent la langue (p. ex. en utilisant des règles de grammaire), alors que d’autres fonctionnent en utilisant des

probabilités statistiques ou en utilisant des exemples de textes déjà traduits comme modèles.

Exemples

* Systran et Reverso, Babelfish et Google Translate, sont aussi disponibles en ligne gratuitement.

Page 7: Outils de Terminotique Et d Aide a La Traduction

terminotique

(angl. : computer-assisted terminology)

Définition

Ensemble des techniques visant à automatiser la recherche terminologique.

traducteur de vocabulaire

(angl. : active terminology recognition tool)

Définition

Outil qui analyse de façon automatique des textes en format électronique afin d’identifier les occurrences des

différents termes ou autres mots à l’intérieur du texte qui sont aussi présents dans une banque de données

terminologiques.

Lorsque les traducteurs de vocabulaire identifient des occurrences de termes connus, ils les mettent parfois en

surbrillance dans le texte et proposent à l’utilisateur des équivalents stockés dans la base de données pour

insertion dans le texte, ou remplacent automatiquement les occurrences de ces termes connus par leurs équivalents

dans la base de données.

Les traducteurs de vocabulaire doivent être utilisés avec une base terminologique (habituellement stockée dans un

système de gestion de données terminologiques) et sont souvent utilisés avec des systèmes de gestion de mémoires

de traduction.

Exemples

* Fonction de pré-traduction dans LogiTerm et l’Agent TermBase dans MultiTrans.

traduction assistée par ordinateur

TAO

(angl. : computer-assisted translation, CAT)

Définition

Ensemble des techniques visant à alléger, à accélérer ou à systématiser des tâches de traduction au moyen de

l’informatique.

traduction automatique

TA

(angl. : machine translation, MT)

Définition

Ensemble des techniques visant à faire traduire par un programme informatique un texte rédigé dans une langue

donnée dans une autre langue.

traitement automatique de la langue

traitement automatique du langage

TAL

(angl. : natural language processing, NLP)

Définitions

Ensemble des techniques visant à faire traiter la langue par l’ordinateur.

Voir www.lattice.cnrs.fr/sites/itellier/poly_info_ling/linguistique003.html

Voir aussi www.ling.uqam.ca/sato/glossaire/glos_t.htm#taln

Page 8: Outils de Terminotique Et d Aide a La Traduction

traitement de texte

word processing

Définition

Ensemble des techniques informatiques permettant la saisie, la mise en forme et la modification de textes. Les

traitements de texte sont des logiciels qui aident les utilisateurs à saisir, éditer, mettre en forme et sauvegarder des

documents texte. La plupart offrent aussi des fonctions additionnelles qui peuvent aider les traducteurs, rédacteurs

et réviseurs à comparer ou à réviser des documents, à enregistrer les données sous différents formats ou mises en

page (p. ex. des tableaux) et à convertir des fichiers vers différents formats.

Voir aussi fr.wikipedia.org/wiki/Logiciel_de_traitement_de_texte

Exemples

* Voir éditique