Glossaire des outils de terminotique et d’aide à la traduction
aligneur
(angl. : aligner)
Définition
Outil qui relie formellement les composantes (normalement les phrases) d’un texte source et d’un texte cible pour
qu’un utilisateur puisse les consulter simultanément. Le tout produit ce qu’il est convenu d’appeler un bitexte.
Exemples
* Fonction de création de bitexte dans LogiTerm
* Aligneur TextBase dans MultiTrans
* Aligneur dans Fusion Translate
* WinAlign dans SDL Trados
* Certains concordanciers bilingues, comme ParaConc, contiennent des fonctions d’alignement
* YouAlign (outil gratuit en ligne) youalign.com/Default.aspx
analyseur de texte
Définition
Voir www.ling.uqam.ca/sato/glossaire/glos_a.htm#ana_
Exemples
* WordSmith www.lexically.net/wordsmith/version5/index.html
* FIPSColor (analyse syntaxique du français) cms.unige.ch/lettres/linguistique/nebhi/FipsColor
* SATO (inscription gratuite) www.ling.uqam.ca/sato
* Outils du Summer Institute of Linguistics www.sil.org/computing/catalog/show_software_catalog.asp?by=cat&name=Text+Analysis
* Syntax Student Companion www-clips.imag.fr/geta/aurelien.max/SSC/frames.html
base de données
(angl. : database)
Définitions
base de connaissances
Voir fr.wikipedia.org/wiki/Base_de_connaissance
Voir aussi www.commentcamarche.net/faq/4855-organisation-creer-une-base-de-connaissances
base de données bibliographiques
Voir fr.wikipedia.org/wiki/Base_de_donn%C3%A9es_bibliographiques
Voir aussi www.h-h.ca/navigation/page_banques.php?page=1 et www.uclouvain.be/67394.html
base de données textuelles
Voir www.thesaurus.gouv.qc.ca/tag/terme.do?id=1447
bitexte
(angl. : bitext)
Définitions
Ensemble composé de textes source et de textes cibles dont les composantes formelles (les phrases ou les
paragraphes) ont été alignées afin d’en faciliter la consultation. Voir aussi aligneur.
Voir aussi alignalco.free.fr/alignalco/bi-texte.html et en.wikipedia.org/wiki/Parallel_text
concordancier
(angl. : concordancer)
Définitions
Ensemble de programmes qui repèrent les occurrences d’une chaîne de caractères (un mot, une partie de mot ou
une suite de mots) dans un ou plusieurs textes électroniques.
Voir fr.wikipedia.org/wiki/Concordancier et www.univ-montp3.fr/sl/rachel/E42SLL1/concordancier.htm
Voir aussi ecolore.leeds.ac.uk/xml/materials/overview/tools/concordancer.xml?lang=fr
Exemples
* Fonctions de recherche plein texte et bitexte de LogiTerm
* Page de LinguisTech sur les concordanciers www.linguistech.ca/Outils+en+ligne+-+accueil#concordanciers
* Concordance www.concordancesoftware.co.uk
* WebCorp www.webcorp.org.uk/live
* ConcQuest w3.u-grenoble3.fr/kraif/ConcQuest/concquest.php
* HyperTextBooks Concordancer papyr.com/applets/concordancer
* GlossaNet glossa.fltr.ucl.ac.be
corpus
(angl. : corpus, pl. corpora)
Définition
Collections de textes en format électronique qui ont été construites afin d’assister les utilisateurs dans leur étude
de la langue et de son usage. Ils sont généralement conçus pour fournir un échantillon représentatif qui donne une
vue d’ensemble d’un certain type de langage (p. ex. dans un registre, une région, un champ ou un type de texte
particulier). Ces collections de textes peuvent aider les utilisateurs à déterminer comment les unités lexicales sont
couramment utilisées ou combinées.
Généralement, on fait une recherche dans un corpus en utilisant un concordancier unilingue ou bilingue.
Exemples
* Frantext www.frantext.fr
* British National Corpus www.natcorp.ox.ac.uk
* Brown Corpus en.wikipedia.org/wiki/Brown_Corpus
* Corpus du journal Le Monde www.lextutor.ca/concordancers/concord_f.html
* Corpus Reuters about.reuters.com/researchandstandards/corpus
* European Language Resources Association www.elra.info
* WebCorp www.webcorp.org.uk/live
dépouilleur terminologique
extracteur de termes
extracteur terminologique
(angl. : term-extraction software, term extractor, termer)
Définition
Outils informatiques qui analysent des textes dans un format électronique et qui identifient les candidats-termes
(i.e. unités lexicales qui semblent être des termes dans un domaine spécifique).
Exemples
* Les environnements de traduction comme SDL, MultiTrans, LogiTerm et Fusion Translate offrent des fonctions
d’extraction ou de dépouillement
* TermoStat (inscription gratuite) olst.ling.umontreal.ca/~drouinp/termostat_web
édition électronique
éditique
(angl. : desktop publishing)
Définitions
éditique
Méthode d’édition permettant de créer et de publier au moyen d’un micro-ordinateur, de progiciels, de logiciels
spécialisés et d’une imprimante de qualité des documents comparables à ceux obtenus par photocomposition
PAO
Voir fr.wikipedia.org/wiki/Publication_assist%C3%A9e_par_ordinateur
PréAO
Voir www.clionautes.org/IMG/tutorielPPT.pdf
Voir formation.paris.iufm.fr/~pigeollot/cours_en_ligne/preao/preao.html
Exemples
* Scribus fr.wikipedia.org/wiki/Scribus
* OpenOffice www.openoffice.org/fr
* LibreOffice fr.libreoffice.org
* MS Office office.microsoft.com/fr-fr
* GIMP www.gimp.org
environnement de traduction
(angl. : translation environment, translation environment tool [TenT])
Définition
Système qui comprend plusieurs outils différents destinés aux traducteurs dans une seule et même interface
intégrée. Cet environnement de traduction est habituellement centré autour des systèmes gestion de mémoires de
traduction ou des outils semblables, mais inclut généralement les fonctions suivantes : aligneur de bitextes,
système de gestion de données terminologiques, dépouilleur terminologiques, traducteur de vocabulaire et
concordancier bilingue et/ou unilingue. Certains permettent également l’intégration de la traduction automatique.
Exemples
* SDL Trados, Fusion Translate, LogiTerm, MultiTrans, WordFast et OmegaT.
étiquetage
(angl. : part-of-speech tagging)
Définition
Activité qui consiste à expliciter, dans un texte, différents éléments d’une unité linguistique, par exemple la
catégorie grammaticale, des informations flexionnelles, le lemme, etc.
Exemples
* TreeTagger (anglais) web4u.setsunan.ac.jp/Website/TreeOnline.htm
* Laboratoire d’analyse et de technologie du langage (lemmatiseur anglais/français)
(essayer les fonctions « Tagger » et « Parser ») latlapps.unige.ch/Parser
gestionnaire de données terminologique
système de gestion de données terminologiques
(angl. : terminology management system)
Définition
Outil qui fonctionne de façon similaire aux systèmes de gestion de bases de données génériques, mais qui est
spécifiquement conçu pour assister les traducteurs et autres professionnels du langage dans le stockage et la
gestion de données terminologiques (e.g. termes, équivalents, domaines, définitions, contextes et sources).
Il est important de noter la différence entre les systèmes de gestion de données terminologiques (généralement
utilisés pour stocker des fiches personnelles ou des fiches pour un petit groupe d’utilisateurs) et les banques de
données terminologiques (qui sont généralement créées et utilisées par des organisations ou peuvent même être
des produits publiques ou commerciaux comme TERMIUM® ou le GDT).
Exemples
* SDL Trados MultiTerm
* Certains environnements de traduction comme MultiTrans, LogiTerm et Fusion Translate comprennent aussi des fonctions
de gestion de données terminologiques
gestionnaire de mémoires de traduction
système de gestion de mémoires de traduction
(angl. : translation memory system)
Définition
Système conçu pour permettre aux traducteurs d’épargner temps et effort lors de la traduction de documents qui
contiennent des répétitions (soit internes, à l’intérieur d’un même texte, ou externes, à l’intérieur de documents
similaires). Les systèmes de gestion de mémoires de traduction stockent dans une base de données appelée une
mémoire de traduction des segments de textes qui ont été traduits, ainsi que leurs traductions.
Il ne faut pas confondre les systèmes de gestion de mémoires de traduction avec les systèmes de traduction
automatique (TA). Les mémoires de traduction permettent aux humains de recycler des segments de traductions
déjà faites par l’humain alors que les systèmes de TA effectuent des traductions de façon automatique et
dépendent très souvent de l’humain pour ensuite éditer la traduction. Bien que certains processus ou environnements
de traduction intègrent ces deux types d’outils, le fonctionnement de ces derniers est tout à fait différent.
Exemples
* Déjà Vu, Fusion Translate et SDL Trados (plus spécifiquement l’outil Translator’s Workbench)
* Des outils similaires se trouvent aussi dans les environnements de traduction de MultiTrans et LogiTerm
indexation
(angl. : indexing)
Définition
Traitement informatique qui consiste à diviser un texte en mots (c’est-à-dire de découper le texte en chaînes de
caractères discontinues) et à retenir pour chacune des occurrences de ces mots leur adresse dans le texte en vue de
les retrouver rapidement par la suite.
langage artificiel
(angl. : artificial language)
Définition
Langage, composé d’un vocabulaire et d’une syntaxe réduits, élaboré dans une optique particulière,
p. ex. langages informatiques, notation musicale, opérations mathématiques.
langue naturelle
langage naturel
(angl. : natural language)
Définitions
Une des différentes formes du langage humain, comme l’espagnol, le français ou le russe.
Voir l’article « Le langage est-il naturel? » www.scienceshumaines.com/le-langage-est-il-naturel_fr_11993.html
Voir aussi Langage (avec sous-section « Langue naturelle et langue artificielle » dans le texte)
www.thecanadianencyclopedia.com/articles/fr/langage
Exemples
* Identification des langues www-rali.iro.umontreal.ca/rali/?q=fr/node/1223
* Nomino Assistant www.coginov.com/Produits/Nominoassistant/tabid/103/language/en-US/Default.aspx
* Les applications du traitement automatique du langage naturel
fr.wikipedia.org/wiki/Traitement_automatique_du_langage_naturel#Les_applications_TAL
* Présentation sur le traitement automatique du langage naturel www-lipn.univ-paris13.fr/~audibert/pages/enseignement/TAL_ITCN.pdf
* Mondeca (application du TAL dans le cadre de bases de connaissances sémantiques) www.mondeca.com/fr
lemmatiseur
(angl. : lemmatizer)
Définition
lemmatisation
Voir www.concordancesoftware.co.uk/manual/hs2330.htm et www.ling.uqam.ca/sato/glossaire/glos_l.htm#lemmatisation
Exemples
* Lemmatiseur du latin collatinus.fltr.ucl.ac.be/
* Lemmatiseur pour le moyen français et la langue française du XVIIe siècle www.atilf.fr/dmf/LGeRM
linguistique informatique
(angl. : computational linguistics)
Définition
Branche de la linguistique dont l’objet est la mise au point de modèles et de techniques pour faire traiter la langue
par des programmes informatiques.
Voir www.ling.uqam.ca/sato/glossaire/glos_l.htm#linguistique_informatique
Voir aussi www.linguistes.com et www.sfu.ca/fren270/introduction/index.html
Exemples
* Laboratoire d’Analyse et de Technologie du Langage www.latl.unige.ch
* Centre de traitement automatique du langage www.uclouvain.be/cental.html
* Analyse et traitement informatique de la langue française www.atilf.fr
* Compleat Lexical Tutor www.lextutor.ca
* Recherche appliquée en linguistique informatique de l’Université de Montréal www-rali.iro.umontreal.ca/rali/?q=fr/accueil
mémoire de traduction
translation memory
Définitions
mémoire de traduction
Ensemble de programmes qui établissent une correspondance entre des phrases à traduire contenues dans un texte
source et des phrases préalablement traduites répertoriées dans une base de données. Si une correspondance est
établie, ils extraient les phrases cible associées aux phrases source répertoriées.
Voir aussi www.sdl.com/fr/technology/language-technology/what-is-translation-memory.html
Voir aussi ecolore.leeds.ac.uk/xml/materials/overview/tools/translation_memory.xml?lang=fr
mémoire de traduction à reconnaissance avancée (MTRA)
Voir www.multicorpora.com/fr/ressources/reconnaissance-avancee/
outils de localisation
(angl. : localization tools)
Définition
La localisation est une tâche qui implique la traduction et l’adaptation d’une page Web, d’un logiciel ou d’un
autre produit pour une communauté linguistique et culturelle particulière. Plusieurs participants sont généralement
impliqués dans le processus puisque la tâche implique la manipulation de codes informatiques complexes.
Bon nombre d’outils de localisation ont été créés afin d’assister les traducteurs et autres professionnels de la
localisation dans la gestion des complexités de la tâche (y compris la gestion des projets, le calcul d’un estimé ou
d’un décompte de mots exact, la séparation des composants textuels à traduire du code informatique qui doit être
préservé, et la gestion des données terminologiques et des textes ou segments de textes déjà traduits).
Exemples
* Alchemy Catalyst www.alchemysoftware.ie
* SDL Passolo www.sdl.com/products/sdl-passolo
* Aquino WebBudget www.amicus-transtec.com/en-gb/Website_Translation/Aquino_Software/WebbudgetXT.html
système de gestion de bases de données
SGBD
(angl. : database management system, DBMS)
Définition
Ensemble de programmes permettant de stocker des données logiquement reliées, de les organiser et de les interroger.
Exemples
* FileMaker Pro, Microsoft Access, MySQL, Oracle Database, OpenOffice.org Base
système de traduction automatique
(angl. : machine translation system)
Définition
Système qui prend en charge le processus entier de traduction de textes. Il y a différentes techniques sous-jacentes
utilisées par les systèmes de traduction automatique. Certaines tentent d’imiter la façon dont les humains
analysent la langue (p. ex. en utilisant des règles de grammaire), alors que d’autres fonctionnent en utilisant des
probabilités statistiques ou en utilisant des exemples de textes déjà traduits comme modèles.
Exemples
* Systran et Reverso, Babelfish et Google Translate, sont aussi disponibles en ligne gratuitement.
terminotique
(angl. : computer-assisted terminology)
Définition
Ensemble des techniques visant à automatiser la recherche terminologique.
traducteur de vocabulaire
(angl. : active terminology recognition tool)
Définition
Outil qui analyse de façon automatique des textes en format électronique afin d’identifier les occurrences des
différents termes ou autres mots à l’intérieur du texte qui sont aussi présents dans une banque de données
terminologiques.
Lorsque les traducteurs de vocabulaire identifient des occurrences de termes connus, ils les mettent parfois en
surbrillance dans le texte et proposent à l’utilisateur des équivalents stockés dans la base de données pour
insertion dans le texte, ou remplacent automatiquement les occurrences de ces termes connus par leurs équivalents
dans la base de données.
Les traducteurs de vocabulaire doivent être utilisés avec une base terminologique (habituellement stockée dans un
système de gestion de données terminologiques) et sont souvent utilisés avec des systèmes de gestion de mémoires
de traduction.
Exemples
* Fonction de pré-traduction dans LogiTerm et l’Agent TermBase dans MultiTrans.
traduction assistée par ordinateur
TAO
(angl. : computer-assisted translation, CAT)
Définition
Ensemble des techniques visant à alléger, à accélérer ou à systématiser des tâches de traduction au moyen de
l’informatique.
traduction automatique
TA
(angl. : machine translation, MT)
Définition
Ensemble des techniques visant à faire traduire par un programme informatique un texte rédigé dans une langue
donnée dans une autre langue.
traitement automatique de la langue
traitement automatique du langage
TAL
(angl. : natural language processing, NLP)
Définitions
Ensemble des techniques visant à faire traiter la langue par l’ordinateur.
Voir www.lattice.cnrs.fr/sites/itellier/poly_info_ling/linguistique003.html
Voir aussi www.ling.uqam.ca/sato/glossaire/glos_t.htm#taln
traitement de texte
word processing
Définition
Ensemble des techniques informatiques permettant la saisie, la mise en forme et la modification de textes. Les
traitements de texte sont des logiciels qui aident les utilisateurs à saisir, éditer, mettre en forme et sauvegarder des
documents texte. La plupart offrent aussi des fonctions additionnelles qui peuvent aider les traducteurs, rédacteurs
et réviseurs à comparer ou à réviser des documents, à enregistrer les données sous différents formats ou mises en
page (p. ex. des tableaux) et à convertir des fichiers vers différents formats.
Voir aussi fr.wikipedia.org/wiki/Logiciel_de_traitement_de_texte
Exemples
* Voir éditique