iso 25964 : pour le développement, la gestion et l ... · the interoperability of documentary...

12
Tous droits réservés © Association pour l'avancement des sciences et des techniques de la documentation (ASTED), 2012 Ce document est protégé par la loi sur le droit d’auteur. L’utilisation des services d’Érudit (y compris la reproduction) est assujettie à sa politique d’utilisation que vous pouvez consulter en ligne. https://apropos.erudit.org/fr/usagers/politique-dutilisation/ Cet article est diffusé et préservé par Érudit. Érudit est un consortium interuniversitaire sans but lucratif composé de l’Université de Montréal, l’Université Laval et l’Université du Québec à Montréal. Il a pour mission la promotion et la valorisation de la recherche. https://www.erudit.org/fr/ Document généré le 1 oct. 2020 10:36 Documentation et bibliothèques ISO 25964 : pour le développement, la gestion et l’interopérabilité des langages documentaires ISO 25964: The Development, the Management and the Interoperability of Documentary Languages ISO 25964: para el desarrollo, la gestión y la interoperabilidad de los lenguajes documentales Michèle Hudon Normalisation et normes pour la gestion de l’information et des documents Volume 58, numéro 3, juillet–septembre 2012 URI : https://id.erudit.org/iderudit/1028903ar DOI : https://doi.org/10.7202/1028903ar Aller au sommaire du numéro Éditeur(s) Association pour l'avancement des sciences et des techniques de la documentation (ASTED) ISSN 0315-2340 (imprimé) 2291-8949 (numérique) Découvrir la revue Citer cet article Hudon, M. (2012). ISO 25964 : pour le développement, la gestion et l’interopérabilité des langages documentaires. Documentation et bibliothèques, 58 (3), 130–140. https://doi.org/10.7202/1028903ar Résumé de l'article Description du contexte au sein duquel la norme ISO 25964 Thésaurus et interopérabilité avec les autres vocabulaires a été conçue et élaborée. Présentation de la structure de la norme. Évocation de l’impact potentiel de cette norme sur l’interopérabilité sémantique des systèmes et sur la recherche d’information.

Upload: others

Post on 27-Jul-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Tous droits reacuteserveacutes copy Association pour lavancement des sciences et destechniques de la documentation (ASTED) 2012

Ce document est proteacutegeacute par la loi sur le droit drsquoauteur Lrsquoutilisation desservices drsquoEacuterudit (y compris la reproduction) est assujettie agrave sa politiquedrsquoutilisation que vous pouvez consulter en lignehttpsaproposeruditorgfrusagerspolitique-dutilisation

Cet article est diffuseacute et preacuteserveacute par EacuteruditEacuterudit est un consortium interuniversitaire sans but lucratif composeacute delrsquoUniversiteacute de Montreacuteal lrsquoUniversiteacute Laval et lrsquoUniversiteacute du Queacutebec agraveMontreacuteal Il a pour mission la promotion et la valorisation de la recherchehttpswwweruditorgfr

Document geacuteneacutereacute le 1 oct 2020 1036

Documentation et bibliothegraveques

ISO 25964 pour le deacuteveloppement la gestion etlrsquointeropeacuterabiliteacute des langages documentairesISO 25964 The Development the Management and theInteroperability of Documentary LanguagesISO 25964 para el desarrollo la gestioacuten y la interoperabilidadde los lenguajes documentalesMichegravele Hudon

Normalisation et normes pour la gestion de lrsquoinformation et desdocumentsVolume 58 numeacutero 3 juilletndashseptembre 2012

URI httpsideruditorgiderudit1028903arDOI httpsdoiorg1072021028903ar

Aller au sommaire du numeacutero

Eacutediteur(s)Association pour lavancement des sciences et des techniques de ladocumentation (ASTED)

ISSN0315-2340 (imprimeacute)2291-8949 (numeacuterique)

Deacutecouvrir la revue

Citer cet articleHudon M (2012) ISO 25964 pour le deacuteveloppement la gestion etlrsquointeropeacuterabiliteacute des langages documentaires Documentation et bibliothegraveques58 (3) 130ndash140 httpsdoiorg1072021028903ar

Reacutesumeacute de larticleDescription du contexte au sein duquel la norme ISO 25964 Theacutesaurus etinteropeacuterabiliteacute avec les autres vocabulaires a eacuteteacute conccedilue et eacutelaboreacuteePreacutesentation de la structure de la norme Eacutevocation de lrsquoimpact potentiel decette norme sur lrsquointeropeacuterabiliteacute seacutemantique des systegravemes et sur la recherchedrsquoinformation

i ipifejy MSNTAIcirc IumlON bull pl1|IumljoiicircH SITUES ISO 25964 pour le deacuteveloppement

la gestion et Interopeacuterabiliteacute des langages documentaires

MICHEgraveLE HUDON EBSI Universiteacute de Montreacuteal michelehudonumontrealca

REacuteSUMEacute | ABSTRACTS | RESUME

Description du contexte au sein duquel la norme ISO 25964 Theacuteshysaurus et interopeacuterabiliteacute avec les autres vocabulaires a eacuteteacute conccedilue et eacutelaboreacutee Preacutesentation de la structure de la norme Eacutevoshycation de limpact potentiel de cette norme sur linteropeacuterabiliteacute seacutemantique des systegravemes et sur la recherche dinformation

ISO 25964 The Development the Management and the Interoperability of Documentary Languages

The context in which the ISO 25964 standard (Thesauri and Interoshyperability with other Vocabularies) was developed is outlined in this article The structure of the standard is described as well as its potential impact on the semantic interoperability of systems and information retrieval

ISO 25964 para el desarrollo la gestion y la interoperabilidad de los lenguajes documentacirctes

Descripciocircn del contexto en el cual la norma ISO 25964 Tesauro e interoperabilidad con otros vocabularios ha sido concebida y elaborada Presentation de la estructura de la norma Evocashytion del impacto potential de esta norma en la interoperabilidad semacircntica de los sistemasy en la bucircsqueda de information

Les titres et titres de section sont une traduction de lauteure Aucune traduction officielle en franccedilais de la norme ISO 25964 nest encore disponible The titles and section titles were translated by the author An official French transshylation of the ISO 25964 standard is not yet available Los titulos y titulos de secciocircn fueron traducidos por la autora Todavia no existe traduccion oficial en franceacutes de la norma ISO 25964

ON RECONNAIcircT LE CARACTEgraveRE ESSENTIEL de

lexistence et de la stricte application de normes dans plusieurs domaines de lactiviteacute humaine

la construction reacutesidentielle le transport aeacuterien les essais cliniques et la mise en marcheacute de meacutedicaments etc on admet eacutegalement limportance de la normalisashytion dans le deacuteveloppement des technologies Il semble nettement plus difficile de percevoir linteacuterecirct de norshymaliser les composantes laquo non meacutecaniques raquo des sysshytegravemes de recherche dinformation les structures dorshyganisation des sujets et les langages de repreacutesentation et de recherche par exemple Cest ainsi que certaines directives ayant trait au traitement de la documentation eacutemises par lOrganisation internationale de normalishysation (ISO) lAssociation franccedilaise de normalisation (AFNOR) et la British Standard Institution (BSI) entre autres tendent agrave exceacuteder de beaucoup la dureacutee de leur vie utile et continuent decirctre appliqueacutees bien quon les sache deacutesuegravetes

Le cas qui nous inteacuteresse est celui des directives pour leacutelaboration et la gestion des theacutesaurus monoshylingues et multilingues Reacutedigeacutees dans le cadre du programme UNISIST de lUNESCO au deacutebut des anneacutees 1970 ces directives furent approuveacutees et adopshyteacutees par lISO qui en proposa une deuxiegraveme eacutedition agrave la communauteacute internationale en 1985 (ISO 5964 Theacutesaurus multilingues) et 1986 (ISO 2788 Theacutesaurus monolingues) Pourtant soumises agrave eacutevaluation agrave tous les cinq ans ces directives navaient jamais eacuteteacute remises en question avant les pressions exerceacutees en 2007 par des speacutecialistes britanniques ayant pris linitiative de reacuteeacutecrire leurs propres normes Consideacuterant la profonshydeur des changements qui ont radicalement transformeacute le champ du traitement et de la recherche documentaire au cours des trois derniegraveres deacutecennies on comprend mal que ces directives naient pas eacuteteacute reacuteeacutevalueacutees pendant cette peacuteriode

Quon se rassure les fondements philosophiques seacutemantiques et terminologiques des processus de creacuteashytion et dutilisation des langages documentaires restent bien eacutevidemment valides Mais avouons que le contexte dutilisation des outils langagiers daide agrave la navigation et au repeacuterage dinformation la diversiteacute de leurs applishycations potentielles et la complexiteacute des systegravemes au sein desquels ils sont utiliseacutes nont plus grand-chose agrave voir avec la reacutealiteacute des anneacutees 1980 Reacutedigeacutees dans un tout autre environnement celui des collections tradi-

1 3 0 | JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

tionnelles de livres et de peacuteriodiques et des bases de donneacutees parfois rudimentaires les normes ISO 2788 et ISO 5964 ne pouvaient prendre en compte les exigences lieacutees agrave lexploitation de langages documentaires dans un environnement numeacuterique reacuteseauteacute et la possibiliteacute dexplorer simultaneacutement une varieacuteteacute de sources plutocirct quune seule base de donneacutees au contenu circonscrit La porteacutee de ces normes se limite au theacutesaurus dans sa forme la plus pure sans reacutefeacuterence agrave dautres langages documentaires preacuteexistants (les systegravemes de vedettes-matiegravere ou les scheacutemas de classification par exemple) ou eacutetablis au cours des derniegraveres deacutecennies (les taxinomies par exemple) Les normes ISO 2788 et ISO 5964 reacutedigeacutees pour les professionnels de linformation nabordent la question de laffichage des donneacutees quen rapport avec lespace disponible sur une page imprimeacutee et fourshynissent peu de deacutetails sur les caracteacuteristiques requises des logiciels deacutedieacutes agrave la gestion et agrave lexploitation des theacutesaurus

Cet article a pour objectif de preacutesenter le contexte au sein duquel la norme ISO 25964 Theacutesaurus et inteshyropeacuterabiliteacute avec les autres vocabulaires a eacuteteacute conccedilue structureacutee et reacutedigeacutee ainsi que la structure et lessentiel du contenu de la norme elle-mecircme

De limportance des normes applicables aux langages documentaires

Plusieurs doutent encore de la neacutecessiteacute de reacuteeacutecrire une norme consacreacutee aux langages documentaires agrave leacutepoque des moteurs de recherche puissants et de la domination du vocabulaire libre et de la syntaxe natushyrelle pour la repreacutesentation et la recherche dinformashytion Pourtant theacutesaurus vedettes-matiegraveres et scheacutemas de classification sont encore bien preacutesents dans les systegravemes dinformation bien quils en aient quitteacute lavant-scegravene pour mieux assumer leur rocircle de soutien seacutemantique agrave la recherche Ces moteurs de recherche qui donnent lillusion de laquo reacutefleacutechir raquo et ces suggesshytions si laquo logiques raquo pour eacutelargir ou restreindre la porteacutee dune recherche sont tregraves deacutependants des structures et des relations fournies par les langages controcircleacutes preacutesents en arriegravere-plan De plus il semble raisonnable de croire que limplantation annonceacutee du Web dit laquo seacutemantique raquo accroicirct au lieu de la reacuteduire la neacutecessiteacute dun controcircle non intrusif des composantes langagiegraveres permettant dacceacuteder aux immenses reacuteservoirs de connaissances constitueacutes par lensemble des bases de donneacutees disposhynibles et dautres types de ressources numeacuteriques reacuteseauteacutees

Dans un environnement reacuteseauteacute et deacutecentraliseacute les normes techniques sont certes essentielles mais elles ne suffisent pas agrave reacutegler tous les problegravemes daccegraves agrave la diversiteacute des ressources disponibles Les langues humaines qui restent linstrument privileacutegieacute pour la

Pourtant theacutesaurus vedettes-matiegraveres et scheacutemas de classification sont encore bien preacutesents dans les systegravemes dinformation bien quiumlls en aient quitteacute Vavant-scegravene pour mieux assumer leur rocircle de soutien seacutemantique agrave la recherche 0ltgt00ltXgt00ltXgtltgtltgtltgtltgtltgtltgtltgtltgt0lt^

recherche dinformation reacutesistent agrave toute tentative duniformisation on peut au mieux les harmoniser et eacutetablir entre elles des passerelles en conservant agrave chacune un statut eacutegalitaire dans lunivers de la transshymission dinformation Des meacutethodes de controcircle langagier eacuteprouveacutees reacutesultant de lapplication combineacutee de theacuteories et de pratiques issues de la linguistique de la terminologie et de la bibliotheacuteconomie servent encore agrave faciliter les eacutechanges dinformation Aujourdhui indexeurs chercheurs et moteurs de recherche utilisent les mecircmes langages documentaires pour repreacutesenter et repeacuterer le contenu theacutematique des documents les fonctions les structures et les modes de gestion et dexploitation de ces langages controcircleacutes gagnent agrave ecirctre normaliseacutes

Par ailleurs nombre de langages documenshytaires traditionnels sont toujours dusage courant Les systegravemes de vedettes-matiegravere et les scheacutemas de classifishycation donnent accegraves agrave de volumineuses collections de ressources disponibles sous forme imprimeacutee ou numeacuteshyriseacutee et ces langages controcircleacutes conccedilus en fonction des besoins et des fonctionnaliteacutes de systegravemes dinformashytion creacuteeacutes aux XIXe et XXe siegravecles doivent pouvoir ecirctre exploiteacutes au XXIe Mecircme sils poursuivent des objectifs distincts ces outils daccegraves traditionnels peuvent deacutesorshymais ecirctre utiliseacutes en combinaison pour ameacuteliorer les reacutesultats de la recherche et la localisation de sources pertinentes La mise agrave disposition de directives claires sur les processus dalignement et deacutetablissement de passerelles entre les diffeacuterentes formes de repreacutesentation dun mecircme concept (par exemple sous forme de vedette-matiegravere de descripteur et dindice de classification) favorise linteropeacuterabiliteacute seacutemantique des systegravemes

Linteropeacuterabiliteacute est la capaciteacute quont certains agents services systegravemes et applications deacutechanger des donneacutees de linformation et des connaissances en preacuteservant linteacutegriteacute et la pleine signification de celles-ci Linteropeacuterabiliteacute seacutemantique concerne plus speacutecifiquement le langage et le vocabulaire utiliseacutes dans un processus de communication (entre systegravemes informatiques ou entre humains et systegravemes inforshymatiques) elle facilite pour lusager le repeacuterage et le partage dinformation peu importe le langage et le vocabulaire utiliseacutes Linteropeacuterabiliteacute seacutemantique passe par le controcircle plus ou moins strict des significashytions controcircle associeacute aux systegravemes dorganisation des

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 icirc

connaissances (SOC) de types verbal ou symbolique Or les SOC et plus particuliegraverement les theacutesaurus se sont multiplieacutes avec linteacutegration doutils technoloshygiques dans les systegravemes de recherche dinformation Cette multiplication des langages documentaires a de beaucoup diminueacute la capaciteacute des systegravemes agrave communishyquer et agrave eacutechanger des donneacutees tout en compliquant la vie des usagers forceacutes dapprendre un langage diffeacuterent agrave chaque fois quils interrogeaient une nouvelle base de donneacutees Dans les reacuteseaux dinformation contemposhyrains les problegravemes lieacutes agrave la multipliciteacute et agrave la divershysiteacute des langages de recherche sont devenus critiques comment peut-on par exemple assurer lexhausti-viteacute ou la preacutecision du repeacuterage dans un systegraveme ougrave cohabitent les indices de la classification Dewey des vedettes-matiegravere et les termes dun theacutesaurus speacuteciashyliseacute Le chercheur dinformation ne peut que beacuteneacuteficier de tout effort qui lui permette dexplorer simultaneacutement plusieurs reacuteservoirs dinformation agrave laide du langage documentaire qui lui est le plus familier sans eacutegard agrave la diversiteacute des langages utiliseacutes pour repreacutesenter les concepts et les sujets au sein de chacun dentre eux

Enfin normes et directives sont dautant plus utiles aujourdhui que les opeacuterations de repreacutesentation et de recherche ne sont plus lapanage de speacutecialistes formeacutes agrave lanalyse documentaire et agrave la recherche dinformation Dans les milieux autres que les milieux traditionnels de la documentation la gestion et la recherche dinforshymation et de documents sont la responsabiliteacute de non-speacutecialistes (de linformation) de plus en plus souvent le creacuteateur mecircme de la ressource ou lindividu qui en a un besoin immeacutediat

Normes pour leacutelaboration et la gestion des theacutesaurus

Devant lindiffeacuterence apparente des autoriteacutes compeacutetentes face agrave la neacutecessiteacute de revoir la porteacutee et le contenu des normes ISO 2788 et ISO 5964 quelques speacutecialistes britanniques du deacuteveloppement et de la gestion des langages documentaires deacutecident en 2000 de sattaquer agrave la reacutevision des normes britanniques eacutequishyvalentes (BS 5723 et BS 6723) avec lintention claire de proposer ensuite une nouvelle norme agrave la communauteacute internationale (Dextre Clarke Gilchrist et Will 2004) Sept ans plus tard la cinquiegraveme et derniegravere section de la nouvelle norme BS 8723 Structured vocabularies for information retrieval est publieacutee et limportance accordeacutee agrave linteropeacuterabiliteacute sur les reacuteseaux numeacuteriques mondiaux y est eacutevidente

Les sections 1 et 2 de la norme britannique teacutemoishygnent dune attitude plutocirct conservatrice chez ses reacutedacteurs ces sections reprennent en effet la quasi-totaliteacute du contenu de la norme ISO 2788-1986 Nos collegravegues britanniques innovent toutefois dans la preacuteshyparation de trois sections ineacutedites La section 3 laquo Vocashybularies other than thesauri raquo deacutecrit le contenu et la

structure des scheacutemas de classification des reacutepertoires de vedettes-matiegravere des taxinomies des ontologies et des fichiers dautoriteacutes dans le but daider les utilisashyteurs de la norme de plus en plus diversifieacutes agrave percevoir les diffeacuterences qui existent entre ces outils La section 4 laquo Interoperability between vocabularies raquo eacutenonce des directives pour leacutetablissement de passerelles dans le but de favoriser linteropeacuterabiliteacute seacutemantique des sysshytegravemes dinformation cest ici que lon trouve lessenshytiel du contenu portant sur les theacutesaurus multilingues consideacutereacutes comme cas complexe dans un processus de mise en eacutequivalence La cinquiegraveme et derniegravere section teacutemoigne du caractegravere essentiel de la technologie dans lenvironnement theacutesaural en deacutetaillant modegraveles proshytocoles et formats pour le traitement et leacutechange des donneacutees

Les Britanniques ne sont pas les seuls agrave devancer lISO dans ces travaux denvergure devenus essentiels Au deacutebut des anneacutees 2000 un groupe de travail sattelle aux Eacutetats-Unis agrave la restructuration de la norme pour le deacuteveloppement des theacutesaurus monolingues La norme reacuteviseacutee NISOANSIZ 3919 est mise agrave disposition en 2005 Les nouvelles directives ne sappliquent pas seulement aux theacutesaurus mais eacutegalement agrave dautres types de vocashybulaires controcircleacutes tels les anneaux de synonymes et les taxinomies Contrairement agrave la norme britannique cependant la norme Z 3919-2005 ne couvre ni les vocashybulaires multilingues ni la mise en correspondance de langages documentaires distincts

Les langages documentaires multilingues sont par contre lunique preacuteoccupation dun groupe de travail de lIFLA formeacute en 2003 agrave linstigation du neacuteerlandais Gerhard Riesthuis Une seacuterie de directives sappliquant au deacuteveloppement des theacutesaurus multilingues et destishyneacutees agrave ecirctre utiliseacutees en compleacutement agrave la norme ISO 5964 est publieacutee en 2009 (IFLA 2009)

En France le groupe informel Langages documenshytaires de lAssociation des documentalistes et bibliotheacuteshycaires speacutecialiseacutes (ADBS) se donne pour tacircche en 2005 dexaminer les normes NISO Z 3919-2005 et BS 8723 reacutecemment publieacutees Le groupe oriente sa reacuteflexion autour de plusieurs questions comment ces nouvelles normes posent-elles la probleacutematique des langages documentaires En quoi sont-elles novatrices Comment les taxinomies et les ontologies peuvent-elles sarticuler aux theacutesaurus (Chichereau et al 2007) Le groupe reconnaicirct les caracteacuteristiques essentielles de lenvishyronnement actuel dutilisation des normes un public plus large des interfaces souples et faciles daccegraves une gestion des recherches moins sophistiqueacutee et non exclushysivement destineacutee agrave des professionnels meacutediateurs des innovations technologiques constantes et la multiplicashytion de nouveaux outils dorganisation de linformation et des connaissances

1 3 2 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Naissance et deacuteveloppement dune norme ISO

La majoriteacute des normes ISO sont soumises agrave eacutevaluashytion de faccedilon reacuteguliegravere soit agrave tous les trois ou cinq ans Les pays membres du comiteacute technique responsable de la norme agrave eacutevaluer sont alors requis de se prononcer sur la neacutecessiteacute de reacuteviser de retirer ou de reconduire celle-ci pour une nouvelle peacuteriode agrave dureacutee deacutetermineacutee Sil est deacutecideacute agrave la majoriteacute des membres que des chanshygements sont requis lopeacuteration de reacutevision (re-editing) est lanceacutee1

La premiegravere eacutetape de lopeacuteration est la laquo proposishytion de nouveau projet raquo Agrave ce stade un document de travail proposant la restructuration et la reacuteeacutecriture de la norme est preacutepareacute par un ou plusieurs membres du comiteacute technique Si la proposition est accepteacutee un groupe de travail constitueacute dexperts est formeacute avec pour premier mandat de preacuteparer un laquo avant-projet de norme raquo (committee draft) lequel sera soumis agrave eacutevaluashytion et commentaires Le travail requis est plus ou moins lourd selon la longueur et la complexiteacute de la norme agrave reacuteviser la peacuteriode eacutecouleacutee depuis sa derniegravere reacutevision le nombre et limportance des changements agrave apporter la disponibiliteacute de documents de reacutefeacuterence le nombre de deacuteleacutegueacutes aupregraves desquels il faut rechercher un consensus la compeacutetence du chef de projet etc Le calendrier des travaux preacutevoit normalement la publishycation de la norme reacuteviseacutee au plus tard 36 mois apregraves acceptation de la proposition de nouveau projet

Le groupe de travail emprunte ou reacutedige un premier texte agrave partir duquel il preacutepare son avant-projet de norme Lavant-projet est soumis pour commenshytaires agrave lensemble des membres du comiteacute technique responsable de la norme Il nest pas rare que plusieurs avant-projets successifs soient soumis pour commenshytaires dans un processus iteacuteratif qui vise latteinte dun consensus sur le contenu technique du document et sur sa preacutesentation

Une fois le consensus obtenu une version deacutefinitive du texte devenu laquo projet de norme raquo (draft international standard) est expeacutedieacutee agrave tous les comiteacutes techniques de lISO et soumise au vote Les membres votants disposent de cinq mois pour examiner le texte de la norme et agrave ce stade il leur est encore possible de suggeacuterer des ajouts Un projet final de norme est soumis agrave lensemble des comiteacutes techniques de lISO deux mois avant publicashytion seules des modifications mineures dordre stylisshytique ou typographique peuvent alors y ecirctre apporteacutees

On notera quune proportion importante des 36 mois alloueacutes au deacuteveloppement dune norme est en fait consacreacutee agrave la relecture et agrave leacutevaluation par les deacuteleacuteshygueacutes des pays membres de lISO Les peacuteriodes consa-

1 On peut trouver une description complegravete du processus de preacuteparation dune norme ISO sur le site de lOrganisation agrave lthttpwwwisoorgisofrstandards_ developmenthtmx

creacutees agrave la relecture pourraient sembler inutilement longues mais elles sont neacutecessaires Lorsquil reccediloit un projet de norme lorganisme responsable dans chaque pays de la normalisation dans un domaine particushylier doit recruter des experts qui accepteront de lire tregraves attentivement et de commenter le contenu dun ou mecircme de plusieurs documents et ce sans aucune compensation financiegravere ou autre La lecture dune norme en deacuteveloppement est un travail ardu exigeant du temps et une eacutenergie que plusieurs praticiens ne sont pas toujours en mesure de fournir Au Canada pour examiner les normes de la documentation par exemple Bibliothegraveque et Archives Canada (BAC) doit solliciter des eacutevaluateurs provenant des deux groupes linguisshytiques officiels de diverses reacutegions du pays de diverses communauteacutes de pratique (universiteacute recherche gouvernement organisme agrave but non-lucratif entreprise priveacutee) etc Ces speacutecialistes ne sont pas neacutecessairement largement connus et un travail de reacuteseautage consideacuteshyrable peut devoir ecirctre effectueacute en un temps record

Le projet de norme ISO 25964

Le Comiteacute technique 46 (TC46) laquo Information et documentation raquo est chargeacute agrave lISO des normes touchant les pratiques relatives aux bibliothegraveques aux centres de documentation agrave leacutedition aux archives agrave la gestion des documents administratifs agrave la docushymentation museacuteographique aux services dindexashytion et de reacutesumeacutes et aux sciences de linformation plus geacuteneacuteralement une quarantaine de normes sont sous sa responsabiliteacute directe et une centaine dautres sont produites par dautres Comiteacutes techniques avec lesquels TC46 maintient des liens (citons en exemple les Comiteacutes techniques 37 laquoTerminologie et autres ressources langagiegraveres et ressources de contenuraquo et 154 laquo Processus eacuteleacutements dinformation et documents dans le commerce lindustrie et ladministration raquo) Trente-cinq pays participent activement aux travaux du Comiteacute technique 46 (dont lAustralie le Canada la Chine les Eacutetats-Unis et la France) et 36 autres y ont un statut dobservateur

Le Sous-comiteacute 9 (SC9) du Comiteacute technique 46 laquo Identification et description raquo est responsable agrave lui seul dune vingtaine de normes On y deacutenombre une dizaine de groupes de travail œuvrant agrave la preacuteparashytion de nouvelles normes ou agrave la reacuteeacutecriture de normes publieacutees

En mai 2007 lorsque les normes ISO 2788 et ISO 5964 sont une nouvelle fois soumises agraveeacutevaluation cest au Comiteacute technique 46 que les repreacutesentants du Royaume-Uni soumettent la norme BS 8723-2005 aux fins de comparaison et deacutevaluation par la communauteacute internationale Leur proposition souligne quune mise agrave jour des normes ISO 2788 et ISO 5964 sera beacuteneacutefique agrave tous ceux qui font usage de volumineux reacuteservoirs dinshyformation dans les secteurs publics priveacutes et sans but

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 3

lucratif Le projet de norme ISO 25964 est mis sur pied lorsque le Comiteacute technique 46 rejette (enfin ) le statu quo et recommande lutilisation de la norme britanshynique comme document de reacutefeacuterence pour le remplaceshyment des directives pour le deacuteveloppement et la gestion des theacutesaurus en vigueur depuis plus de 20 ans

Le projet de norme ISO 25964 est officialiseacute en octobre de la mecircme anneacutee par la creacuteation du groupe de travail TC46SC9WG8 laquo Vocabulaires structureacutes raquo formeacute de speacutecialistes repreacutesentant une quinzaine de pays et plusieurs groupes linguistiques2 Le mandat du groupe de travail est clair laquo deacutevelopper une nouvelle norme ISO portant sur les vocabulaires structureacutes pour remplacer les normes existantes ie ISO 5964 publieacutee en 198s et ISO 2788 publieacutee en 1986 raquo Le WG8 est dirigeacute par Stella Dextre Clarke speacutecialiste du deacuteveloppement de theacutesaurus et de taxinomies et coreacutedactrice de la norme BS 8723-2005

Les membres du groupe de travail se rencontrent virtuellement lors de confeacuterences teacuteleacutephoniques tenues le premier lundi de chaque mois Un ordre du jour serreacute permet dentendre les points de vue de chacun sur les questions litigieuses et de faire progresser la reacutedacshytion des directives et la validation des exemples La preacutesidente du groupe attribue agrave chacun des mandats et des tacircches preacutecises filtre les commentaires integravegre les ajouts et corrections sur lesquels il y a consensus applique les directives de lISO pour tout ce qui concerne lutilisation dune terminologie et dun style de reacutedaction normaliseacutes ainsi que pour la mise en forme des textes Les membres du WG8 et quelques consultants externes ont accegraves agrave lensemble des ordres du jour procegraves-verbaux brouillons commentaires textes et messages eacutechangeacutes sous forme eacutelectronique dans un espace de travail virtuel creacuteeacute agrave leur intention par la National Information Standards Organization (NISO) Les membres du groupe de travailont eacutegaleshyment tireacute avantage de quelques seacuteances de travail en mode preacutesentiel dans les bureaux londoniens du British Standards Institute (BSI) de nombreuses deacutecisions ont pu alors ecirctre finaliseacutees et des avanceacutees importantes ont eacuteteacute reacutealiseacutees

Deux sous-groupes de travail ont eacuteteacute actifs en 2008-2009 Un premier sous-groupe sest consacreacute agrave la preacuteparation des clauses concernant les theacutesaurus multishylingues et le deuxiegraveme a structureacute les clauses portant sur les modegraveles de donneacutees Un troisiegraveme sous-groupe a pris forme en 2010 pour convenir de la place agrave accorder aux ontologies et proposer les contenus approprieacutes

2 Les pays repreacutesenteacutes dans le groupe de travail original eacutetaient lAfrique du Sud

lAllemagne la Bulgarie le Canada la Chine le Danemark lEspagne les Eacutetats-

Unis la Finlande la France la Nouvelle-Zeacutelande le Royaume-Uniet la Suegravede Des

repreacutesentants de la Belgique et de lAustralie ont inteacutegreacute le groupe apregraves le deacutebut

des travaux

Structure et contenu de la norme ISO 25964

Dentreacutee de jeu il fut convenu entre les parties inteacuteresseacutees que la porteacutee de la norme ISO 25964 serait plus large que celle des normes ISO 2788 et ISO 5964 quelle remplace et quelle traiterait de leacutetablissement de passerelles entre diverses formes de langages docushymentaires et dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation Il parut eacutevident que la nouvelle norme devrait refleacuteter clairement limportance du numeacuterique et des reacuteseaux et reposer sur des bases dont la validiteacute ne serait pas lieacutee agrave des technologies des logiciels ou des architectures de systegravemes particuliers

Les cinq sections de la norme britannique BS 8723 furent soumises en janvier 2008 agrave lensemble des membres du groupe de travail pour lecture et eacutevaluashytion Cette premiegravere opeacuteration a geacuteneacutereacute des centaines de commentaires certains tregraves critiques et meneacute agrave la premiegravere deacutecision importante du groupe celle de strucshyturer la norme ISO 25964 en deux sections distinctes plutocirct quen cinq sections comme le faisait BS 8723 La premiegravere section traiterait uniquement des theacutesaurus et sinspirerait des sections 1 2 et 5 de la norme britanshynique la seconde traiterait de passerelles et dinteropeacuteshyrabiliteacute en inteacutegrant le contenu des sections 3 et 4

Objet et domaine dapplication

La norme ISO 25964 offre des recommandations pour le deacuteveloppement et la gestion de vocabulaires structureacutes de termes repreacutesentant des sujets et des concepts utilisables pour la recherche dinformation Elle propose eacutegalement des directives pour leacutechange de donneacutees entre vocabulaires controcircleacutes et entre un vocashybulaire controcircleacute et lapplication au sein de laquelle il est utiliseacute3

La norme ISO 25964 sapplique aux vocabulaires utiliseacutes pour le repeacuterage dinformation dans des sources textuelles telles que les bases de connaissances les bases de donneacutees bibliographiques et les collections de documents mais aussi dans les catalogues dimages ou dobjets comme ceux qui deacutecrivent les collections museacuteales par exemple Les vocabulaires structureacutes sont utiliseacutes dans des systegravemes dinformation post-coor-donneacutes dans les reacutepertoires hieacuterarchiseacutes les index preacuteshycoordonneacutes et les systegravemes de classification4

3 laquo ISO 25964 gives recommendations for the development and maintenance of

structured vocabularies of subject terms and concepts for information retrieval

It also gives guidance on the exchange of data between multiple vocabularies and

between a vocabulary and the software with which it interacts raquo (ISO 25964 Part 1)

4 laquo ISO 25964 applies to vocabularies used for retrieving information from text

resources such as knowledge bases bibliographic databases or collections of full text

documents and also catalogues of images or artefacts such as those in a museum

collection Structured vocabularies are used in post-coordinate retrieval systems

hierarchical directories pre-coordinate indexes and classification systems raquo (ISO

25964 Part 1)

1 3 4 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Tableau 1 Comparaison des clauses principales dans les normes ISO 25964 2788 et 5964

l$02S9S4

4 Le theacutesaurus et ses fonctions

5 Types de concepts repreacutesenteacutes

6 Seacutelection et forme des termes dans un theacutesaurus

7 Traitement des concepts complexes et des termes composeacutes

8 Leacutequivalence en contexte monolingue

9 Leacutequivalence entre langues naturelles

10 Relations entre concepts 102 Relation hieacuterarchique 103 Relation associative 104 Autres relations

11 Lanalyse par facettes

12 Preacutesentation et affichage des donneacutees

13 Construction et gestion du theacutesaurus

14 Fonctionnaliteacutes requises des logiciels deacutedieacutes agrave la gestion des theacutesaurus

15 Modegravele de donneacutees

16 Inteacutegration du theacutesaurus au SRI

17 Formats deacutechange des donneacutees

18 Protocoles

ISO 2788 ET ISO 5964

5 Le controcircle du vocabulaire

6 Les termes dindexation

62 La forme des termes dindexation 65 Le choix des termes

7 Les termes composeacutes

8 Les relations dans un theacutesaurus 82 La relation deacutequivalence

9 Problegravemes langagiers dans les theacutesaurus multilingues (ISO 5964)

83 La relation hieacuterarchique 84 La relation associative

--

9 Laffichage des termes et des relations (ISO 2788)

10 Construction du theacutesaurus (ISO 2788) 15 Organisation du travail (ISO 5964)

--

-

-

-

-

Structure

Lorsquon compare la norme ISO 25964 agrave celles quelle remplace on remarque immeacutediatement quelle propose un volume consideacuterable de textes explicatifs ou descriptifs plutocirct que strictement normatifs Les normes ISO 2788 et ISO 5964 sadressaient agrave des speacuteciashylistes et misaient sur la preacutesence de nombreux exemples pour assurer la compreacutehension Ici le parti de lexplishycation a eacuteteacute pris dans le but eacutevident de favoriser lutishylisation de la norme par les deacuteveloppeurs de langages ou de structures pour la repreacutesentation et la recherche dinformation qui ne sont pas familiers avec les regravegles du controcircle du vocabulaire

La norme ISO 25964 est constitueacutee de deux parties distinctes mais interdeacutependantes

Partie 1 Theacutesaurus et recherche dinformation (Thesauri for information retrieval)

Cest dans la premiegravere section de la norme que lon trouve les principes geacuteneacuteraux et les recommandations applicables agrave la conception et agrave la gestion des theacutesaurus monolingues et multilingues Le texte des dix premiegraveres clauses de la section 1 reste tregraves pregraves de celui que lon

trouvait deacutejagrave dans les normes ISO 2788 et ISO 5964 (Tableau 1) Ainsi aucune modification majeure nest agrave signaler dans les clauses touchant aux types de concepts repreacutesenteacutes dans les theacutesaurus (Clause 5) agrave la forme des termes et aux meacutethodes de deacutesambiguiumlsation des homographes (Clause 6) aux recommandations concershynant le traitement des concepts et des termes complexes (Clause 7) La structure relationnelle du theacutesaurus telle que preacutesenteacutee dans les clauses 8 agrave 10 ne seacuteloigne pas non plus du cadre traditionnel Les quelques parashygraphes (Clause 104) qui abordent la question de lutishyliteacute potentielle de relations additionnelles plus explishycites ressemblent davantage agrave une mise en garde sur la difficulteacute de lopeacuteration quagrave un encouragement agrave enrishychir le contenu du theacutesaurus

La partie 1 de la norme propose par ailleurs plusieurs directives nouvelles La clause 11 reacuteaffirme lutiliteacute de lanalyse par facettes un processus auquel on sinteacuteresse davantage aujourdhui quau moment de la reacutedaction des normes ISO 2788 et 5964 la clause syntheacutetise des eacuteleacutements dinformation disseacutemineacutes auparavant dans les clauses portant sur le deacuteveloppeshyment de la structure et la preacutesentation des donneacutees Les clauses 12 laquo Preacutesentation et affichage raquo 13 laquo Gestion (de la creacuteation agrave la mise agrave jour) raquo et 14 laquo Logiciels pour la

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 5

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 2: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

i ipifejy MSNTAIcirc IumlON bull pl1|IumljoiicircH SITUES ISO 25964 pour le deacuteveloppement

la gestion et Interopeacuterabiliteacute des langages documentaires

MICHEgraveLE HUDON EBSI Universiteacute de Montreacuteal michelehudonumontrealca

REacuteSUMEacute | ABSTRACTS | RESUME

Description du contexte au sein duquel la norme ISO 25964 Theacuteshysaurus et interopeacuterabiliteacute avec les autres vocabulaires a eacuteteacute conccedilue et eacutelaboreacutee Preacutesentation de la structure de la norme Eacutevoshycation de limpact potentiel de cette norme sur linteropeacuterabiliteacute seacutemantique des systegravemes et sur la recherche dinformation

ISO 25964 The Development the Management and the Interoperability of Documentary Languages

The context in which the ISO 25964 standard (Thesauri and Interoshyperability with other Vocabularies) was developed is outlined in this article The structure of the standard is described as well as its potential impact on the semantic interoperability of systems and information retrieval

ISO 25964 para el desarrollo la gestion y la interoperabilidad de los lenguajes documentacirctes

Descripciocircn del contexto en el cual la norma ISO 25964 Tesauro e interoperabilidad con otros vocabularios ha sido concebida y elaborada Presentation de la estructura de la norma Evocashytion del impacto potential de esta norma en la interoperabilidad semacircntica de los sistemasy en la bucircsqueda de information

Les titres et titres de section sont une traduction de lauteure Aucune traduction officielle en franccedilais de la norme ISO 25964 nest encore disponible The titles and section titles were translated by the author An official French transshylation of the ISO 25964 standard is not yet available Los titulos y titulos de secciocircn fueron traducidos por la autora Todavia no existe traduccion oficial en franceacutes de la norma ISO 25964

ON RECONNAIcircT LE CARACTEgraveRE ESSENTIEL de

lexistence et de la stricte application de normes dans plusieurs domaines de lactiviteacute humaine

la construction reacutesidentielle le transport aeacuterien les essais cliniques et la mise en marcheacute de meacutedicaments etc on admet eacutegalement limportance de la normalisashytion dans le deacuteveloppement des technologies Il semble nettement plus difficile de percevoir linteacuterecirct de norshymaliser les composantes laquo non meacutecaniques raquo des sysshytegravemes de recherche dinformation les structures dorshyganisation des sujets et les langages de repreacutesentation et de recherche par exemple Cest ainsi que certaines directives ayant trait au traitement de la documentation eacutemises par lOrganisation internationale de normalishysation (ISO) lAssociation franccedilaise de normalisation (AFNOR) et la British Standard Institution (BSI) entre autres tendent agrave exceacuteder de beaucoup la dureacutee de leur vie utile et continuent decirctre appliqueacutees bien quon les sache deacutesuegravetes

Le cas qui nous inteacuteresse est celui des directives pour leacutelaboration et la gestion des theacutesaurus monoshylingues et multilingues Reacutedigeacutees dans le cadre du programme UNISIST de lUNESCO au deacutebut des anneacutees 1970 ces directives furent approuveacutees et adopshyteacutees par lISO qui en proposa une deuxiegraveme eacutedition agrave la communauteacute internationale en 1985 (ISO 5964 Theacutesaurus multilingues) et 1986 (ISO 2788 Theacutesaurus monolingues) Pourtant soumises agrave eacutevaluation agrave tous les cinq ans ces directives navaient jamais eacuteteacute remises en question avant les pressions exerceacutees en 2007 par des speacutecialistes britanniques ayant pris linitiative de reacuteeacutecrire leurs propres normes Consideacuterant la profonshydeur des changements qui ont radicalement transformeacute le champ du traitement et de la recherche documentaire au cours des trois derniegraveres deacutecennies on comprend mal que ces directives naient pas eacuteteacute reacuteeacutevalueacutees pendant cette peacuteriode

Quon se rassure les fondements philosophiques seacutemantiques et terminologiques des processus de creacuteashytion et dutilisation des langages documentaires restent bien eacutevidemment valides Mais avouons que le contexte dutilisation des outils langagiers daide agrave la navigation et au repeacuterage dinformation la diversiteacute de leurs applishycations potentielles et la complexiteacute des systegravemes au sein desquels ils sont utiliseacutes nont plus grand-chose agrave voir avec la reacutealiteacute des anneacutees 1980 Reacutedigeacutees dans un tout autre environnement celui des collections tradi-

1 3 0 | JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

tionnelles de livres et de peacuteriodiques et des bases de donneacutees parfois rudimentaires les normes ISO 2788 et ISO 5964 ne pouvaient prendre en compte les exigences lieacutees agrave lexploitation de langages documentaires dans un environnement numeacuterique reacuteseauteacute et la possibiliteacute dexplorer simultaneacutement une varieacuteteacute de sources plutocirct quune seule base de donneacutees au contenu circonscrit La porteacutee de ces normes se limite au theacutesaurus dans sa forme la plus pure sans reacutefeacuterence agrave dautres langages documentaires preacuteexistants (les systegravemes de vedettes-matiegravere ou les scheacutemas de classification par exemple) ou eacutetablis au cours des derniegraveres deacutecennies (les taxinomies par exemple) Les normes ISO 2788 et ISO 5964 reacutedigeacutees pour les professionnels de linformation nabordent la question de laffichage des donneacutees quen rapport avec lespace disponible sur une page imprimeacutee et fourshynissent peu de deacutetails sur les caracteacuteristiques requises des logiciels deacutedieacutes agrave la gestion et agrave lexploitation des theacutesaurus

Cet article a pour objectif de preacutesenter le contexte au sein duquel la norme ISO 25964 Theacutesaurus et inteshyropeacuterabiliteacute avec les autres vocabulaires a eacuteteacute conccedilue structureacutee et reacutedigeacutee ainsi que la structure et lessentiel du contenu de la norme elle-mecircme

De limportance des normes applicables aux langages documentaires

Plusieurs doutent encore de la neacutecessiteacute de reacuteeacutecrire une norme consacreacutee aux langages documentaires agrave leacutepoque des moteurs de recherche puissants et de la domination du vocabulaire libre et de la syntaxe natushyrelle pour la repreacutesentation et la recherche dinformashytion Pourtant theacutesaurus vedettes-matiegraveres et scheacutemas de classification sont encore bien preacutesents dans les systegravemes dinformation bien quils en aient quitteacute lavant-scegravene pour mieux assumer leur rocircle de soutien seacutemantique agrave la recherche Ces moteurs de recherche qui donnent lillusion de laquo reacutefleacutechir raquo et ces suggesshytions si laquo logiques raquo pour eacutelargir ou restreindre la porteacutee dune recherche sont tregraves deacutependants des structures et des relations fournies par les langages controcircleacutes preacutesents en arriegravere-plan De plus il semble raisonnable de croire que limplantation annonceacutee du Web dit laquo seacutemantique raquo accroicirct au lieu de la reacuteduire la neacutecessiteacute dun controcircle non intrusif des composantes langagiegraveres permettant dacceacuteder aux immenses reacuteservoirs de connaissances constitueacutes par lensemble des bases de donneacutees disposhynibles et dautres types de ressources numeacuteriques reacuteseauteacutees

Dans un environnement reacuteseauteacute et deacutecentraliseacute les normes techniques sont certes essentielles mais elles ne suffisent pas agrave reacutegler tous les problegravemes daccegraves agrave la diversiteacute des ressources disponibles Les langues humaines qui restent linstrument privileacutegieacute pour la

Pourtant theacutesaurus vedettes-matiegraveres et scheacutemas de classification sont encore bien preacutesents dans les systegravemes dinformation bien quiumlls en aient quitteacute Vavant-scegravene pour mieux assumer leur rocircle de soutien seacutemantique agrave la recherche 0ltgt00ltXgt00ltXgtltgtltgtltgtltgtltgtltgtltgtltgt0lt^

recherche dinformation reacutesistent agrave toute tentative duniformisation on peut au mieux les harmoniser et eacutetablir entre elles des passerelles en conservant agrave chacune un statut eacutegalitaire dans lunivers de la transshymission dinformation Des meacutethodes de controcircle langagier eacuteprouveacutees reacutesultant de lapplication combineacutee de theacuteories et de pratiques issues de la linguistique de la terminologie et de la bibliotheacuteconomie servent encore agrave faciliter les eacutechanges dinformation Aujourdhui indexeurs chercheurs et moteurs de recherche utilisent les mecircmes langages documentaires pour repreacutesenter et repeacuterer le contenu theacutematique des documents les fonctions les structures et les modes de gestion et dexploitation de ces langages controcircleacutes gagnent agrave ecirctre normaliseacutes

Par ailleurs nombre de langages documenshytaires traditionnels sont toujours dusage courant Les systegravemes de vedettes-matiegravere et les scheacutemas de classifishycation donnent accegraves agrave de volumineuses collections de ressources disponibles sous forme imprimeacutee ou numeacuteshyriseacutee et ces langages controcircleacutes conccedilus en fonction des besoins et des fonctionnaliteacutes de systegravemes dinformashytion creacuteeacutes aux XIXe et XXe siegravecles doivent pouvoir ecirctre exploiteacutes au XXIe Mecircme sils poursuivent des objectifs distincts ces outils daccegraves traditionnels peuvent deacutesorshymais ecirctre utiliseacutes en combinaison pour ameacuteliorer les reacutesultats de la recherche et la localisation de sources pertinentes La mise agrave disposition de directives claires sur les processus dalignement et deacutetablissement de passerelles entre les diffeacuterentes formes de repreacutesentation dun mecircme concept (par exemple sous forme de vedette-matiegravere de descripteur et dindice de classification) favorise linteropeacuterabiliteacute seacutemantique des systegravemes

Linteropeacuterabiliteacute est la capaciteacute quont certains agents services systegravemes et applications deacutechanger des donneacutees de linformation et des connaissances en preacuteservant linteacutegriteacute et la pleine signification de celles-ci Linteropeacuterabiliteacute seacutemantique concerne plus speacutecifiquement le langage et le vocabulaire utiliseacutes dans un processus de communication (entre systegravemes informatiques ou entre humains et systegravemes inforshymatiques) elle facilite pour lusager le repeacuterage et le partage dinformation peu importe le langage et le vocabulaire utiliseacutes Linteropeacuterabiliteacute seacutemantique passe par le controcircle plus ou moins strict des significashytions controcircle associeacute aux systegravemes dorganisation des

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 icirc

connaissances (SOC) de types verbal ou symbolique Or les SOC et plus particuliegraverement les theacutesaurus se sont multiplieacutes avec linteacutegration doutils technoloshygiques dans les systegravemes de recherche dinformation Cette multiplication des langages documentaires a de beaucoup diminueacute la capaciteacute des systegravemes agrave communishyquer et agrave eacutechanger des donneacutees tout en compliquant la vie des usagers forceacutes dapprendre un langage diffeacuterent agrave chaque fois quils interrogeaient une nouvelle base de donneacutees Dans les reacuteseaux dinformation contemposhyrains les problegravemes lieacutes agrave la multipliciteacute et agrave la divershysiteacute des langages de recherche sont devenus critiques comment peut-on par exemple assurer lexhausti-viteacute ou la preacutecision du repeacuterage dans un systegraveme ougrave cohabitent les indices de la classification Dewey des vedettes-matiegravere et les termes dun theacutesaurus speacuteciashyliseacute Le chercheur dinformation ne peut que beacuteneacuteficier de tout effort qui lui permette dexplorer simultaneacutement plusieurs reacuteservoirs dinformation agrave laide du langage documentaire qui lui est le plus familier sans eacutegard agrave la diversiteacute des langages utiliseacutes pour repreacutesenter les concepts et les sujets au sein de chacun dentre eux

Enfin normes et directives sont dautant plus utiles aujourdhui que les opeacuterations de repreacutesentation et de recherche ne sont plus lapanage de speacutecialistes formeacutes agrave lanalyse documentaire et agrave la recherche dinformation Dans les milieux autres que les milieux traditionnels de la documentation la gestion et la recherche dinforshymation et de documents sont la responsabiliteacute de non-speacutecialistes (de linformation) de plus en plus souvent le creacuteateur mecircme de la ressource ou lindividu qui en a un besoin immeacutediat

Normes pour leacutelaboration et la gestion des theacutesaurus

Devant lindiffeacuterence apparente des autoriteacutes compeacutetentes face agrave la neacutecessiteacute de revoir la porteacutee et le contenu des normes ISO 2788 et ISO 5964 quelques speacutecialistes britanniques du deacuteveloppement et de la gestion des langages documentaires deacutecident en 2000 de sattaquer agrave la reacutevision des normes britanniques eacutequishyvalentes (BS 5723 et BS 6723) avec lintention claire de proposer ensuite une nouvelle norme agrave la communauteacute internationale (Dextre Clarke Gilchrist et Will 2004) Sept ans plus tard la cinquiegraveme et derniegravere section de la nouvelle norme BS 8723 Structured vocabularies for information retrieval est publieacutee et limportance accordeacutee agrave linteropeacuterabiliteacute sur les reacuteseaux numeacuteriques mondiaux y est eacutevidente

Les sections 1 et 2 de la norme britannique teacutemoishygnent dune attitude plutocirct conservatrice chez ses reacutedacteurs ces sections reprennent en effet la quasi-totaliteacute du contenu de la norme ISO 2788-1986 Nos collegravegues britanniques innovent toutefois dans la preacuteshyparation de trois sections ineacutedites La section 3 laquo Vocashybularies other than thesauri raquo deacutecrit le contenu et la

structure des scheacutemas de classification des reacutepertoires de vedettes-matiegravere des taxinomies des ontologies et des fichiers dautoriteacutes dans le but daider les utilisashyteurs de la norme de plus en plus diversifieacutes agrave percevoir les diffeacuterences qui existent entre ces outils La section 4 laquo Interoperability between vocabularies raquo eacutenonce des directives pour leacutetablissement de passerelles dans le but de favoriser linteropeacuterabiliteacute seacutemantique des sysshytegravemes dinformation cest ici que lon trouve lessenshytiel du contenu portant sur les theacutesaurus multilingues consideacutereacutes comme cas complexe dans un processus de mise en eacutequivalence La cinquiegraveme et derniegravere section teacutemoigne du caractegravere essentiel de la technologie dans lenvironnement theacutesaural en deacutetaillant modegraveles proshytocoles et formats pour le traitement et leacutechange des donneacutees

Les Britanniques ne sont pas les seuls agrave devancer lISO dans ces travaux denvergure devenus essentiels Au deacutebut des anneacutees 2000 un groupe de travail sattelle aux Eacutetats-Unis agrave la restructuration de la norme pour le deacuteveloppement des theacutesaurus monolingues La norme reacuteviseacutee NISOANSIZ 3919 est mise agrave disposition en 2005 Les nouvelles directives ne sappliquent pas seulement aux theacutesaurus mais eacutegalement agrave dautres types de vocashybulaires controcircleacutes tels les anneaux de synonymes et les taxinomies Contrairement agrave la norme britannique cependant la norme Z 3919-2005 ne couvre ni les vocashybulaires multilingues ni la mise en correspondance de langages documentaires distincts

Les langages documentaires multilingues sont par contre lunique preacuteoccupation dun groupe de travail de lIFLA formeacute en 2003 agrave linstigation du neacuteerlandais Gerhard Riesthuis Une seacuterie de directives sappliquant au deacuteveloppement des theacutesaurus multilingues et destishyneacutees agrave ecirctre utiliseacutees en compleacutement agrave la norme ISO 5964 est publieacutee en 2009 (IFLA 2009)

En France le groupe informel Langages documenshytaires de lAssociation des documentalistes et bibliotheacuteshycaires speacutecialiseacutes (ADBS) se donne pour tacircche en 2005 dexaminer les normes NISO Z 3919-2005 et BS 8723 reacutecemment publieacutees Le groupe oriente sa reacuteflexion autour de plusieurs questions comment ces nouvelles normes posent-elles la probleacutematique des langages documentaires En quoi sont-elles novatrices Comment les taxinomies et les ontologies peuvent-elles sarticuler aux theacutesaurus (Chichereau et al 2007) Le groupe reconnaicirct les caracteacuteristiques essentielles de lenvishyronnement actuel dutilisation des normes un public plus large des interfaces souples et faciles daccegraves une gestion des recherches moins sophistiqueacutee et non exclushysivement destineacutee agrave des professionnels meacutediateurs des innovations technologiques constantes et la multiplicashytion de nouveaux outils dorganisation de linformation et des connaissances

1 3 2 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Naissance et deacuteveloppement dune norme ISO

La majoriteacute des normes ISO sont soumises agrave eacutevaluashytion de faccedilon reacuteguliegravere soit agrave tous les trois ou cinq ans Les pays membres du comiteacute technique responsable de la norme agrave eacutevaluer sont alors requis de se prononcer sur la neacutecessiteacute de reacuteviser de retirer ou de reconduire celle-ci pour une nouvelle peacuteriode agrave dureacutee deacutetermineacutee Sil est deacutecideacute agrave la majoriteacute des membres que des chanshygements sont requis lopeacuteration de reacutevision (re-editing) est lanceacutee1

La premiegravere eacutetape de lopeacuteration est la laquo proposishytion de nouveau projet raquo Agrave ce stade un document de travail proposant la restructuration et la reacuteeacutecriture de la norme est preacutepareacute par un ou plusieurs membres du comiteacute technique Si la proposition est accepteacutee un groupe de travail constitueacute dexperts est formeacute avec pour premier mandat de preacuteparer un laquo avant-projet de norme raquo (committee draft) lequel sera soumis agrave eacutevaluashytion et commentaires Le travail requis est plus ou moins lourd selon la longueur et la complexiteacute de la norme agrave reacuteviser la peacuteriode eacutecouleacutee depuis sa derniegravere reacutevision le nombre et limportance des changements agrave apporter la disponibiliteacute de documents de reacutefeacuterence le nombre de deacuteleacutegueacutes aupregraves desquels il faut rechercher un consensus la compeacutetence du chef de projet etc Le calendrier des travaux preacutevoit normalement la publishycation de la norme reacuteviseacutee au plus tard 36 mois apregraves acceptation de la proposition de nouveau projet

Le groupe de travail emprunte ou reacutedige un premier texte agrave partir duquel il preacutepare son avant-projet de norme Lavant-projet est soumis pour commenshytaires agrave lensemble des membres du comiteacute technique responsable de la norme Il nest pas rare que plusieurs avant-projets successifs soient soumis pour commenshytaires dans un processus iteacuteratif qui vise latteinte dun consensus sur le contenu technique du document et sur sa preacutesentation

Une fois le consensus obtenu une version deacutefinitive du texte devenu laquo projet de norme raquo (draft international standard) est expeacutedieacutee agrave tous les comiteacutes techniques de lISO et soumise au vote Les membres votants disposent de cinq mois pour examiner le texte de la norme et agrave ce stade il leur est encore possible de suggeacuterer des ajouts Un projet final de norme est soumis agrave lensemble des comiteacutes techniques de lISO deux mois avant publicashytion seules des modifications mineures dordre stylisshytique ou typographique peuvent alors y ecirctre apporteacutees

On notera quune proportion importante des 36 mois alloueacutes au deacuteveloppement dune norme est en fait consacreacutee agrave la relecture et agrave leacutevaluation par les deacuteleacuteshygueacutes des pays membres de lISO Les peacuteriodes consa-

1 On peut trouver une description complegravete du processus de preacuteparation dune norme ISO sur le site de lOrganisation agrave lthttpwwwisoorgisofrstandards_ developmenthtmx

creacutees agrave la relecture pourraient sembler inutilement longues mais elles sont neacutecessaires Lorsquil reccediloit un projet de norme lorganisme responsable dans chaque pays de la normalisation dans un domaine particushylier doit recruter des experts qui accepteront de lire tregraves attentivement et de commenter le contenu dun ou mecircme de plusieurs documents et ce sans aucune compensation financiegravere ou autre La lecture dune norme en deacuteveloppement est un travail ardu exigeant du temps et une eacutenergie que plusieurs praticiens ne sont pas toujours en mesure de fournir Au Canada pour examiner les normes de la documentation par exemple Bibliothegraveque et Archives Canada (BAC) doit solliciter des eacutevaluateurs provenant des deux groupes linguisshytiques officiels de diverses reacutegions du pays de diverses communauteacutes de pratique (universiteacute recherche gouvernement organisme agrave but non-lucratif entreprise priveacutee) etc Ces speacutecialistes ne sont pas neacutecessairement largement connus et un travail de reacuteseautage consideacuteshyrable peut devoir ecirctre effectueacute en un temps record

Le projet de norme ISO 25964

Le Comiteacute technique 46 (TC46) laquo Information et documentation raquo est chargeacute agrave lISO des normes touchant les pratiques relatives aux bibliothegraveques aux centres de documentation agrave leacutedition aux archives agrave la gestion des documents administratifs agrave la docushymentation museacuteographique aux services dindexashytion et de reacutesumeacutes et aux sciences de linformation plus geacuteneacuteralement une quarantaine de normes sont sous sa responsabiliteacute directe et une centaine dautres sont produites par dautres Comiteacutes techniques avec lesquels TC46 maintient des liens (citons en exemple les Comiteacutes techniques 37 laquoTerminologie et autres ressources langagiegraveres et ressources de contenuraquo et 154 laquo Processus eacuteleacutements dinformation et documents dans le commerce lindustrie et ladministration raquo) Trente-cinq pays participent activement aux travaux du Comiteacute technique 46 (dont lAustralie le Canada la Chine les Eacutetats-Unis et la France) et 36 autres y ont un statut dobservateur

Le Sous-comiteacute 9 (SC9) du Comiteacute technique 46 laquo Identification et description raquo est responsable agrave lui seul dune vingtaine de normes On y deacutenombre une dizaine de groupes de travail œuvrant agrave la preacuteparashytion de nouvelles normes ou agrave la reacuteeacutecriture de normes publieacutees

En mai 2007 lorsque les normes ISO 2788 et ISO 5964 sont une nouvelle fois soumises agraveeacutevaluation cest au Comiteacute technique 46 que les repreacutesentants du Royaume-Uni soumettent la norme BS 8723-2005 aux fins de comparaison et deacutevaluation par la communauteacute internationale Leur proposition souligne quune mise agrave jour des normes ISO 2788 et ISO 5964 sera beacuteneacutefique agrave tous ceux qui font usage de volumineux reacuteservoirs dinshyformation dans les secteurs publics priveacutes et sans but

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 3

lucratif Le projet de norme ISO 25964 est mis sur pied lorsque le Comiteacute technique 46 rejette (enfin ) le statu quo et recommande lutilisation de la norme britanshynique comme document de reacutefeacuterence pour le remplaceshyment des directives pour le deacuteveloppement et la gestion des theacutesaurus en vigueur depuis plus de 20 ans

Le projet de norme ISO 25964 est officialiseacute en octobre de la mecircme anneacutee par la creacuteation du groupe de travail TC46SC9WG8 laquo Vocabulaires structureacutes raquo formeacute de speacutecialistes repreacutesentant une quinzaine de pays et plusieurs groupes linguistiques2 Le mandat du groupe de travail est clair laquo deacutevelopper une nouvelle norme ISO portant sur les vocabulaires structureacutes pour remplacer les normes existantes ie ISO 5964 publieacutee en 198s et ISO 2788 publieacutee en 1986 raquo Le WG8 est dirigeacute par Stella Dextre Clarke speacutecialiste du deacuteveloppement de theacutesaurus et de taxinomies et coreacutedactrice de la norme BS 8723-2005

Les membres du groupe de travail se rencontrent virtuellement lors de confeacuterences teacuteleacutephoniques tenues le premier lundi de chaque mois Un ordre du jour serreacute permet dentendre les points de vue de chacun sur les questions litigieuses et de faire progresser la reacutedacshytion des directives et la validation des exemples La preacutesidente du groupe attribue agrave chacun des mandats et des tacircches preacutecises filtre les commentaires integravegre les ajouts et corrections sur lesquels il y a consensus applique les directives de lISO pour tout ce qui concerne lutilisation dune terminologie et dun style de reacutedaction normaliseacutes ainsi que pour la mise en forme des textes Les membres du WG8 et quelques consultants externes ont accegraves agrave lensemble des ordres du jour procegraves-verbaux brouillons commentaires textes et messages eacutechangeacutes sous forme eacutelectronique dans un espace de travail virtuel creacuteeacute agrave leur intention par la National Information Standards Organization (NISO) Les membres du groupe de travailont eacutegaleshyment tireacute avantage de quelques seacuteances de travail en mode preacutesentiel dans les bureaux londoniens du British Standards Institute (BSI) de nombreuses deacutecisions ont pu alors ecirctre finaliseacutees et des avanceacutees importantes ont eacuteteacute reacutealiseacutees

Deux sous-groupes de travail ont eacuteteacute actifs en 2008-2009 Un premier sous-groupe sest consacreacute agrave la preacuteparation des clauses concernant les theacutesaurus multishylingues et le deuxiegraveme a structureacute les clauses portant sur les modegraveles de donneacutees Un troisiegraveme sous-groupe a pris forme en 2010 pour convenir de la place agrave accorder aux ontologies et proposer les contenus approprieacutes

2 Les pays repreacutesenteacutes dans le groupe de travail original eacutetaient lAfrique du Sud

lAllemagne la Bulgarie le Canada la Chine le Danemark lEspagne les Eacutetats-

Unis la Finlande la France la Nouvelle-Zeacutelande le Royaume-Uniet la Suegravede Des

repreacutesentants de la Belgique et de lAustralie ont inteacutegreacute le groupe apregraves le deacutebut

des travaux

Structure et contenu de la norme ISO 25964

Dentreacutee de jeu il fut convenu entre les parties inteacuteresseacutees que la porteacutee de la norme ISO 25964 serait plus large que celle des normes ISO 2788 et ISO 5964 quelle remplace et quelle traiterait de leacutetablissement de passerelles entre diverses formes de langages docushymentaires et dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation Il parut eacutevident que la nouvelle norme devrait refleacuteter clairement limportance du numeacuterique et des reacuteseaux et reposer sur des bases dont la validiteacute ne serait pas lieacutee agrave des technologies des logiciels ou des architectures de systegravemes particuliers

Les cinq sections de la norme britannique BS 8723 furent soumises en janvier 2008 agrave lensemble des membres du groupe de travail pour lecture et eacutevaluashytion Cette premiegravere opeacuteration a geacuteneacutereacute des centaines de commentaires certains tregraves critiques et meneacute agrave la premiegravere deacutecision importante du groupe celle de strucshyturer la norme ISO 25964 en deux sections distinctes plutocirct quen cinq sections comme le faisait BS 8723 La premiegravere section traiterait uniquement des theacutesaurus et sinspirerait des sections 1 2 et 5 de la norme britanshynique la seconde traiterait de passerelles et dinteropeacuteshyrabiliteacute en inteacutegrant le contenu des sections 3 et 4

Objet et domaine dapplication

La norme ISO 25964 offre des recommandations pour le deacuteveloppement et la gestion de vocabulaires structureacutes de termes repreacutesentant des sujets et des concepts utilisables pour la recherche dinformation Elle propose eacutegalement des directives pour leacutechange de donneacutees entre vocabulaires controcircleacutes et entre un vocashybulaire controcircleacute et lapplication au sein de laquelle il est utiliseacute3

La norme ISO 25964 sapplique aux vocabulaires utiliseacutes pour le repeacuterage dinformation dans des sources textuelles telles que les bases de connaissances les bases de donneacutees bibliographiques et les collections de documents mais aussi dans les catalogues dimages ou dobjets comme ceux qui deacutecrivent les collections museacuteales par exemple Les vocabulaires structureacutes sont utiliseacutes dans des systegravemes dinformation post-coor-donneacutes dans les reacutepertoires hieacuterarchiseacutes les index preacuteshycoordonneacutes et les systegravemes de classification4

3 laquo ISO 25964 gives recommendations for the development and maintenance of

structured vocabularies of subject terms and concepts for information retrieval

It also gives guidance on the exchange of data between multiple vocabularies and

between a vocabulary and the software with which it interacts raquo (ISO 25964 Part 1)

4 laquo ISO 25964 applies to vocabularies used for retrieving information from text

resources such as knowledge bases bibliographic databases or collections of full text

documents and also catalogues of images or artefacts such as those in a museum

collection Structured vocabularies are used in post-coordinate retrieval systems

hierarchical directories pre-coordinate indexes and classification systems raquo (ISO

25964 Part 1)

1 3 4 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Tableau 1 Comparaison des clauses principales dans les normes ISO 25964 2788 et 5964

l$02S9S4

4 Le theacutesaurus et ses fonctions

5 Types de concepts repreacutesenteacutes

6 Seacutelection et forme des termes dans un theacutesaurus

7 Traitement des concepts complexes et des termes composeacutes

8 Leacutequivalence en contexte monolingue

9 Leacutequivalence entre langues naturelles

10 Relations entre concepts 102 Relation hieacuterarchique 103 Relation associative 104 Autres relations

11 Lanalyse par facettes

12 Preacutesentation et affichage des donneacutees

13 Construction et gestion du theacutesaurus

14 Fonctionnaliteacutes requises des logiciels deacutedieacutes agrave la gestion des theacutesaurus

15 Modegravele de donneacutees

16 Inteacutegration du theacutesaurus au SRI

17 Formats deacutechange des donneacutees

18 Protocoles

ISO 2788 ET ISO 5964

5 Le controcircle du vocabulaire

6 Les termes dindexation

62 La forme des termes dindexation 65 Le choix des termes

7 Les termes composeacutes

8 Les relations dans un theacutesaurus 82 La relation deacutequivalence

9 Problegravemes langagiers dans les theacutesaurus multilingues (ISO 5964)

83 La relation hieacuterarchique 84 La relation associative

--

9 Laffichage des termes et des relations (ISO 2788)

10 Construction du theacutesaurus (ISO 2788) 15 Organisation du travail (ISO 5964)

--

-

-

-

-

Structure

Lorsquon compare la norme ISO 25964 agrave celles quelle remplace on remarque immeacutediatement quelle propose un volume consideacuterable de textes explicatifs ou descriptifs plutocirct que strictement normatifs Les normes ISO 2788 et ISO 5964 sadressaient agrave des speacuteciashylistes et misaient sur la preacutesence de nombreux exemples pour assurer la compreacutehension Ici le parti de lexplishycation a eacuteteacute pris dans le but eacutevident de favoriser lutishylisation de la norme par les deacuteveloppeurs de langages ou de structures pour la repreacutesentation et la recherche dinformation qui ne sont pas familiers avec les regravegles du controcircle du vocabulaire

La norme ISO 25964 est constitueacutee de deux parties distinctes mais interdeacutependantes

Partie 1 Theacutesaurus et recherche dinformation (Thesauri for information retrieval)

Cest dans la premiegravere section de la norme que lon trouve les principes geacuteneacuteraux et les recommandations applicables agrave la conception et agrave la gestion des theacutesaurus monolingues et multilingues Le texte des dix premiegraveres clauses de la section 1 reste tregraves pregraves de celui que lon

trouvait deacutejagrave dans les normes ISO 2788 et ISO 5964 (Tableau 1) Ainsi aucune modification majeure nest agrave signaler dans les clauses touchant aux types de concepts repreacutesenteacutes dans les theacutesaurus (Clause 5) agrave la forme des termes et aux meacutethodes de deacutesambiguiumlsation des homographes (Clause 6) aux recommandations concershynant le traitement des concepts et des termes complexes (Clause 7) La structure relationnelle du theacutesaurus telle que preacutesenteacutee dans les clauses 8 agrave 10 ne seacuteloigne pas non plus du cadre traditionnel Les quelques parashygraphes (Clause 104) qui abordent la question de lutishyliteacute potentielle de relations additionnelles plus explishycites ressemblent davantage agrave une mise en garde sur la difficulteacute de lopeacuteration quagrave un encouragement agrave enrishychir le contenu du theacutesaurus

La partie 1 de la norme propose par ailleurs plusieurs directives nouvelles La clause 11 reacuteaffirme lutiliteacute de lanalyse par facettes un processus auquel on sinteacuteresse davantage aujourdhui quau moment de la reacutedaction des normes ISO 2788 et 5964 la clause syntheacutetise des eacuteleacutements dinformation disseacutemineacutes auparavant dans les clauses portant sur le deacuteveloppeshyment de la structure et la preacutesentation des donneacutees Les clauses 12 laquo Preacutesentation et affichage raquo 13 laquo Gestion (de la creacuteation agrave la mise agrave jour) raquo et 14 laquo Logiciels pour la

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 5

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 3: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

tionnelles de livres et de peacuteriodiques et des bases de donneacutees parfois rudimentaires les normes ISO 2788 et ISO 5964 ne pouvaient prendre en compte les exigences lieacutees agrave lexploitation de langages documentaires dans un environnement numeacuterique reacuteseauteacute et la possibiliteacute dexplorer simultaneacutement une varieacuteteacute de sources plutocirct quune seule base de donneacutees au contenu circonscrit La porteacutee de ces normes se limite au theacutesaurus dans sa forme la plus pure sans reacutefeacuterence agrave dautres langages documentaires preacuteexistants (les systegravemes de vedettes-matiegravere ou les scheacutemas de classification par exemple) ou eacutetablis au cours des derniegraveres deacutecennies (les taxinomies par exemple) Les normes ISO 2788 et ISO 5964 reacutedigeacutees pour les professionnels de linformation nabordent la question de laffichage des donneacutees quen rapport avec lespace disponible sur une page imprimeacutee et fourshynissent peu de deacutetails sur les caracteacuteristiques requises des logiciels deacutedieacutes agrave la gestion et agrave lexploitation des theacutesaurus

Cet article a pour objectif de preacutesenter le contexte au sein duquel la norme ISO 25964 Theacutesaurus et inteshyropeacuterabiliteacute avec les autres vocabulaires a eacuteteacute conccedilue structureacutee et reacutedigeacutee ainsi que la structure et lessentiel du contenu de la norme elle-mecircme

De limportance des normes applicables aux langages documentaires

Plusieurs doutent encore de la neacutecessiteacute de reacuteeacutecrire une norme consacreacutee aux langages documentaires agrave leacutepoque des moteurs de recherche puissants et de la domination du vocabulaire libre et de la syntaxe natushyrelle pour la repreacutesentation et la recherche dinformashytion Pourtant theacutesaurus vedettes-matiegraveres et scheacutemas de classification sont encore bien preacutesents dans les systegravemes dinformation bien quils en aient quitteacute lavant-scegravene pour mieux assumer leur rocircle de soutien seacutemantique agrave la recherche Ces moteurs de recherche qui donnent lillusion de laquo reacutefleacutechir raquo et ces suggesshytions si laquo logiques raquo pour eacutelargir ou restreindre la porteacutee dune recherche sont tregraves deacutependants des structures et des relations fournies par les langages controcircleacutes preacutesents en arriegravere-plan De plus il semble raisonnable de croire que limplantation annonceacutee du Web dit laquo seacutemantique raquo accroicirct au lieu de la reacuteduire la neacutecessiteacute dun controcircle non intrusif des composantes langagiegraveres permettant dacceacuteder aux immenses reacuteservoirs de connaissances constitueacutes par lensemble des bases de donneacutees disposhynibles et dautres types de ressources numeacuteriques reacuteseauteacutees

Dans un environnement reacuteseauteacute et deacutecentraliseacute les normes techniques sont certes essentielles mais elles ne suffisent pas agrave reacutegler tous les problegravemes daccegraves agrave la diversiteacute des ressources disponibles Les langues humaines qui restent linstrument privileacutegieacute pour la

Pourtant theacutesaurus vedettes-matiegraveres et scheacutemas de classification sont encore bien preacutesents dans les systegravemes dinformation bien quiumlls en aient quitteacute Vavant-scegravene pour mieux assumer leur rocircle de soutien seacutemantique agrave la recherche 0ltgt00ltXgt00ltXgtltgtltgtltgtltgtltgtltgtltgtltgt0lt^

recherche dinformation reacutesistent agrave toute tentative duniformisation on peut au mieux les harmoniser et eacutetablir entre elles des passerelles en conservant agrave chacune un statut eacutegalitaire dans lunivers de la transshymission dinformation Des meacutethodes de controcircle langagier eacuteprouveacutees reacutesultant de lapplication combineacutee de theacuteories et de pratiques issues de la linguistique de la terminologie et de la bibliotheacuteconomie servent encore agrave faciliter les eacutechanges dinformation Aujourdhui indexeurs chercheurs et moteurs de recherche utilisent les mecircmes langages documentaires pour repreacutesenter et repeacuterer le contenu theacutematique des documents les fonctions les structures et les modes de gestion et dexploitation de ces langages controcircleacutes gagnent agrave ecirctre normaliseacutes

Par ailleurs nombre de langages documenshytaires traditionnels sont toujours dusage courant Les systegravemes de vedettes-matiegravere et les scheacutemas de classifishycation donnent accegraves agrave de volumineuses collections de ressources disponibles sous forme imprimeacutee ou numeacuteshyriseacutee et ces langages controcircleacutes conccedilus en fonction des besoins et des fonctionnaliteacutes de systegravemes dinformashytion creacuteeacutes aux XIXe et XXe siegravecles doivent pouvoir ecirctre exploiteacutes au XXIe Mecircme sils poursuivent des objectifs distincts ces outils daccegraves traditionnels peuvent deacutesorshymais ecirctre utiliseacutes en combinaison pour ameacuteliorer les reacutesultats de la recherche et la localisation de sources pertinentes La mise agrave disposition de directives claires sur les processus dalignement et deacutetablissement de passerelles entre les diffeacuterentes formes de repreacutesentation dun mecircme concept (par exemple sous forme de vedette-matiegravere de descripteur et dindice de classification) favorise linteropeacuterabiliteacute seacutemantique des systegravemes

Linteropeacuterabiliteacute est la capaciteacute quont certains agents services systegravemes et applications deacutechanger des donneacutees de linformation et des connaissances en preacuteservant linteacutegriteacute et la pleine signification de celles-ci Linteropeacuterabiliteacute seacutemantique concerne plus speacutecifiquement le langage et le vocabulaire utiliseacutes dans un processus de communication (entre systegravemes informatiques ou entre humains et systegravemes inforshymatiques) elle facilite pour lusager le repeacuterage et le partage dinformation peu importe le langage et le vocabulaire utiliseacutes Linteropeacuterabiliteacute seacutemantique passe par le controcircle plus ou moins strict des significashytions controcircle associeacute aux systegravemes dorganisation des

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 icirc

connaissances (SOC) de types verbal ou symbolique Or les SOC et plus particuliegraverement les theacutesaurus se sont multiplieacutes avec linteacutegration doutils technoloshygiques dans les systegravemes de recherche dinformation Cette multiplication des langages documentaires a de beaucoup diminueacute la capaciteacute des systegravemes agrave communishyquer et agrave eacutechanger des donneacutees tout en compliquant la vie des usagers forceacutes dapprendre un langage diffeacuterent agrave chaque fois quils interrogeaient une nouvelle base de donneacutees Dans les reacuteseaux dinformation contemposhyrains les problegravemes lieacutes agrave la multipliciteacute et agrave la divershysiteacute des langages de recherche sont devenus critiques comment peut-on par exemple assurer lexhausti-viteacute ou la preacutecision du repeacuterage dans un systegraveme ougrave cohabitent les indices de la classification Dewey des vedettes-matiegravere et les termes dun theacutesaurus speacuteciashyliseacute Le chercheur dinformation ne peut que beacuteneacuteficier de tout effort qui lui permette dexplorer simultaneacutement plusieurs reacuteservoirs dinformation agrave laide du langage documentaire qui lui est le plus familier sans eacutegard agrave la diversiteacute des langages utiliseacutes pour repreacutesenter les concepts et les sujets au sein de chacun dentre eux

Enfin normes et directives sont dautant plus utiles aujourdhui que les opeacuterations de repreacutesentation et de recherche ne sont plus lapanage de speacutecialistes formeacutes agrave lanalyse documentaire et agrave la recherche dinformation Dans les milieux autres que les milieux traditionnels de la documentation la gestion et la recherche dinforshymation et de documents sont la responsabiliteacute de non-speacutecialistes (de linformation) de plus en plus souvent le creacuteateur mecircme de la ressource ou lindividu qui en a un besoin immeacutediat

Normes pour leacutelaboration et la gestion des theacutesaurus

Devant lindiffeacuterence apparente des autoriteacutes compeacutetentes face agrave la neacutecessiteacute de revoir la porteacutee et le contenu des normes ISO 2788 et ISO 5964 quelques speacutecialistes britanniques du deacuteveloppement et de la gestion des langages documentaires deacutecident en 2000 de sattaquer agrave la reacutevision des normes britanniques eacutequishyvalentes (BS 5723 et BS 6723) avec lintention claire de proposer ensuite une nouvelle norme agrave la communauteacute internationale (Dextre Clarke Gilchrist et Will 2004) Sept ans plus tard la cinquiegraveme et derniegravere section de la nouvelle norme BS 8723 Structured vocabularies for information retrieval est publieacutee et limportance accordeacutee agrave linteropeacuterabiliteacute sur les reacuteseaux numeacuteriques mondiaux y est eacutevidente

Les sections 1 et 2 de la norme britannique teacutemoishygnent dune attitude plutocirct conservatrice chez ses reacutedacteurs ces sections reprennent en effet la quasi-totaliteacute du contenu de la norme ISO 2788-1986 Nos collegravegues britanniques innovent toutefois dans la preacuteshyparation de trois sections ineacutedites La section 3 laquo Vocashybularies other than thesauri raquo deacutecrit le contenu et la

structure des scheacutemas de classification des reacutepertoires de vedettes-matiegravere des taxinomies des ontologies et des fichiers dautoriteacutes dans le but daider les utilisashyteurs de la norme de plus en plus diversifieacutes agrave percevoir les diffeacuterences qui existent entre ces outils La section 4 laquo Interoperability between vocabularies raquo eacutenonce des directives pour leacutetablissement de passerelles dans le but de favoriser linteropeacuterabiliteacute seacutemantique des sysshytegravemes dinformation cest ici que lon trouve lessenshytiel du contenu portant sur les theacutesaurus multilingues consideacutereacutes comme cas complexe dans un processus de mise en eacutequivalence La cinquiegraveme et derniegravere section teacutemoigne du caractegravere essentiel de la technologie dans lenvironnement theacutesaural en deacutetaillant modegraveles proshytocoles et formats pour le traitement et leacutechange des donneacutees

Les Britanniques ne sont pas les seuls agrave devancer lISO dans ces travaux denvergure devenus essentiels Au deacutebut des anneacutees 2000 un groupe de travail sattelle aux Eacutetats-Unis agrave la restructuration de la norme pour le deacuteveloppement des theacutesaurus monolingues La norme reacuteviseacutee NISOANSIZ 3919 est mise agrave disposition en 2005 Les nouvelles directives ne sappliquent pas seulement aux theacutesaurus mais eacutegalement agrave dautres types de vocashybulaires controcircleacutes tels les anneaux de synonymes et les taxinomies Contrairement agrave la norme britannique cependant la norme Z 3919-2005 ne couvre ni les vocashybulaires multilingues ni la mise en correspondance de langages documentaires distincts

Les langages documentaires multilingues sont par contre lunique preacuteoccupation dun groupe de travail de lIFLA formeacute en 2003 agrave linstigation du neacuteerlandais Gerhard Riesthuis Une seacuterie de directives sappliquant au deacuteveloppement des theacutesaurus multilingues et destishyneacutees agrave ecirctre utiliseacutees en compleacutement agrave la norme ISO 5964 est publieacutee en 2009 (IFLA 2009)

En France le groupe informel Langages documenshytaires de lAssociation des documentalistes et bibliotheacuteshycaires speacutecialiseacutes (ADBS) se donne pour tacircche en 2005 dexaminer les normes NISO Z 3919-2005 et BS 8723 reacutecemment publieacutees Le groupe oriente sa reacuteflexion autour de plusieurs questions comment ces nouvelles normes posent-elles la probleacutematique des langages documentaires En quoi sont-elles novatrices Comment les taxinomies et les ontologies peuvent-elles sarticuler aux theacutesaurus (Chichereau et al 2007) Le groupe reconnaicirct les caracteacuteristiques essentielles de lenvishyronnement actuel dutilisation des normes un public plus large des interfaces souples et faciles daccegraves une gestion des recherches moins sophistiqueacutee et non exclushysivement destineacutee agrave des professionnels meacutediateurs des innovations technologiques constantes et la multiplicashytion de nouveaux outils dorganisation de linformation et des connaissances

1 3 2 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Naissance et deacuteveloppement dune norme ISO

La majoriteacute des normes ISO sont soumises agrave eacutevaluashytion de faccedilon reacuteguliegravere soit agrave tous les trois ou cinq ans Les pays membres du comiteacute technique responsable de la norme agrave eacutevaluer sont alors requis de se prononcer sur la neacutecessiteacute de reacuteviser de retirer ou de reconduire celle-ci pour une nouvelle peacuteriode agrave dureacutee deacutetermineacutee Sil est deacutecideacute agrave la majoriteacute des membres que des chanshygements sont requis lopeacuteration de reacutevision (re-editing) est lanceacutee1

La premiegravere eacutetape de lopeacuteration est la laquo proposishytion de nouveau projet raquo Agrave ce stade un document de travail proposant la restructuration et la reacuteeacutecriture de la norme est preacutepareacute par un ou plusieurs membres du comiteacute technique Si la proposition est accepteacutee un groupe de travail constitueacute dexperts est formeacute avec pour premier mandat de preacuteparer un laquo avant-projet de norme raquo (committee draft) lequel sera soumis agrave eacutevaluashytion et commentaires Le travail requis est plus ou moins lourd selon la longueur et la complexiteacute de la norme agrave reacuteviser la peacuteriode eacutecouleacutee depuis sa derniegravere reacutevision le nombre et limportance des changements agrave apporter la disponibiliteacute de documents de reacutefeacuterence le nombre de deacuteleacutegueacutes aupregraves desquels il faut rechercher un consensus la compeacutetence du chef de projet etc Le calendrier des travaux preacutevoit normalement la publishycation de la norme reacuteviseacutee au plus tard 36 mois apregraves acceptation de la proposition de nouveau projet

Le groupe de travail emprunte ou reacutedige un premier texte agrave partir duquel il preacutepare son avant-projet de norme Lavant-projet est soumis pour commenshytaires agrave lensemble des membres du comiteacute technique responsable de la norme Il nest pas rare que plusieurs avant-projets successifs soient soumis pour commenshytaires dans un processus iteacuteratif qui vise latteinte dun consensus sur le contenu technique du document et sur sa preacutesentation

Une fois le consensus obtenu une version deacutefinitive du texte devenu laquo projet de norme raquo (draft international standard) est expeacutedieacutee agrave tous les comiteacutes techniques de lISO et soumise au vote Les membres votants disposent de cinq mois pour examiner le texte de la norme et agrave ce stade il leur est encore possible de suggeacuterer des ajouts Un projet final de norme est soumis agrave lensemble des comiteacutes techniques de lISO deux mois avant publicashytion seules des modifications mineures dordre stylisshytique ou typographique peuvent alors y ecirctre apporteacutees

On notera quune proportion importante des 36 mois alloueacutes au deacuteveloppement dune norme est en fait consacreacutee agrave la relecture et agrave leacutevaluation par les deacuteleacuteshygueacutes des pays membres de lISO Les peacuteriodes consa-

1 On peut trouver une description complegravete du processus de preacuteparation dune norme ISO sur le site de lOrganisation agrave lthttpwwwisoorgisofrstandards_ developmenthtmx

creacutees agrave la relecture pourraient sembler inutilement longues mais elles sont neacutecessaires Lorsquil reccediloit un projet de norme lorganisme responsable dans chaque pays de la normalisation dans un domaine particushylier doit recruter des experts qui accepteront de lire tregraves attentivement et de commenter le contenu dun ou mecircme de plusieurs documents et ce sans aucune compensation financiegravere ou autre La lecture dune norme en deacuteveloppement est un travail ardu exigeant du temps et une eacutenergie que plusieurs praticiens ne sont pas toujours en mesure de fournir Au Canada pour examiner les normes de la documentation par exemple Bibliothegraveque et Archives Canada (BAC) doit solliciter des eacutevaluateurs provenant des deux groupes linguisshytiques officiels de diverses reacutegions du pays de diverses communauteacutes de pratique (universiteacute recherche gouvernement organisme agrave but non-lucratif entreprise priveacutee) etc Ces speacutecialistes ne sont pas neacutecessairement largement connus et un travail de reacuteseautage consideacuteshyrable peut devoir ecirctre effectueacute en un temps record

Le projet de norme ISO 25964

Le Comiteacute technique 46 (TC46) laquo Information et documentation raquo est chargeacute agrave lISO des normes touchant les pratiques relatives aux bibliothegraveques aux centres de documentation agrave leacutedition aux archives agrave la gestion des documents administratifs agrave la docushymentation museacuteographique aux services dindexashytion et de reacutesumeacutes et aux sciences de linformation plus geacuteneacuteralement une quarantaine de normes sont sous sa responsabiliteacute directe et une centaine dautres sont produites par dautres Comiteacutes techniques avec lesquels TC46 maintient des liens (citons en exemple les Comiteacutes techniques 37 laquoTerminologie et autres ressources langagiegraveres et ressources de contenuraquo et 154 laquo Processus eacuteleacutements dinformation et documents dans le commerce lindustrie et ladministration raquo) Trente-cinq pays participent activement aux travaux du Comiteacute technique 46 (dont lAustralie le Canada la Chine les Eacutetats-Unis et la France) et 36 autres y ont un statut dobservateur

Le Sous-comiteacute 9 (SC9) du Comiteacute technique 46 laquo Identification et description raquo est responsable agrave lui seul dune vingtaine de normes On y deacutenombre une dizaine de groupes de travail œuvrant agrave la preacuteparashytion de nouvelles normes ou agrave la reacuteeacutecriture de normes publieacutees

En mai 2007 lorsque les normes ISO 2788 et ISO 5964 sont une nouvelle fois soumises agraveeacutevaluation cest au Comiteacute technique 46 que les repreacutesentants du Royaume-Uni soumettent la norme BS 8723-2005 aux fins de comparaison et deacutevaluation par la communauteacute internationale Leur proposition souligne quune mise agrave jour des normes ISO 2788 et ISO 5964 sera beacuteneacutefique agrave tous ceux qui font usage de volumineux reacuteservoirs dinshyformation dans les secteurs publics priveacutes et sans but

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 3

lucratif Le projet de norme ISO 25964 est mis sur pied lorsque le Comiteacute technique 46 rejette (enfin ) le statu quo et recommande lutilisation de la norme britanshynique comme document de reacutefeacuterence pour le remplaceshyment des directives pour le deacuteveloppement et la gestion des theacutesaurus en vigueur depuis plus de 20 ans

Le projet de norme ISO 25964 est officialiseacute en octobre de la mecircme anneacutee par la creacuteation du groupe de travail TC46SC9WG8 laquo Vocabulaires structureacutes raquo formeacute de speacutecialistes repreacutesentant une quinzaine de pays et plusieurs groupes linguistiques2 Le mandat du groupe de travail est clair laquo deacutevelopper une nouvelle norme ISO portant sur les vocabulaires structureacutes pour remplacer les normes existantes ie ISO 5964 publieacutee en 198s et ISO 2788 publieacutee en 1986 raquo Le WG8 est dirigeacute par Stella Dextre Clarke speacutecialiste du deacuteveloppement de theacutesaurus et de taxinomies et coreacutedactrice de la norme BS 8723-2005

Les membres du groupe de travail se rencontrent virtuellement lors de confeacuterences teacuteleacutephoniques tenues le premier lundi de chaque mois Un ordre du jour serreacute permet dentendre les points de vue de chacun sur les questions litigieuses et de faire progresser la reacutedacshytion des directives et la validation des exemples La preacutesidente du groupe attribue agrave chacun des mandats et des tacircches preacutecises filtre les commentaires integravegre les ajouts et corrections sur lesquels il y a consensus applique les directives de lISO pour tout ce qui concerne lutilisation dune terminologie et dun style de reacutedaction normaliseacutes ainsi que pour la mise en forme des textes Les membres du WG8 et quelques consultants externes ont accegraves agrave lensemble des ordres du jour procegraves-verbaux brouillons commentaires textes et messages eacutechangeacutes sous forme eacutelectronique dans un espace de travail virtuel creacuteeacute agrave leur intention par la National Information Standards Organization (NISO) Les membres du groupe de travailont eacutegaleshyment tireacute avantage de quelques seacuteances de travail en mode preacutesentiel dans les bureaux londoniens du British Standards Institute (BSI) de nombreuses deacutecisions ont pu alors ecirctre finaliseacutees et des avanceacutees importantes ont eacuteteacute reacutealiseacutees

Deux sous-groupes de travail ont eacuteteacute actifs en 2008-2009 Un premier sous-groupe sest consacreacute agrave la preacuteparation des clauses concernant les theacutesaurus multishylingues et le deuxiegraveme a structureacute les clauses portant sur les modegraveles de donneacutees Un troisiegraveme sous-groupe a pris forme en 2010 pour convenir de la place agrave accorder aux ontologies et proposer les contenus approprieacutes

2 Les pays repreacutesenteacutes dans le groupe de travail original eacutetaient lAfrique du Sud

lAllemagne la Bulgarie le Canada la Chine le Danemark lEspagne les Eacutetats-

Unis la Finlande la France la Nouvelle-Zeacutelande le Royaume-Uniet la Suegravede Des

repreacutesentants de la Belgique et de lAustralie ont inteacutegreacute le groupe apregraves le deacutebut

des travaux

Structure et contenu de la norme ISO 25964

Dentreacutee de jeu il fut convenu entre les parties inteacuteresseacutees que la porteacutee de la norme ISO 25964 serait plus large que celle des normes ISO 2788 et ISO 5964 quelle remplace et quelle traiterait de leacutetablissement de passerelles entre diverses formes de langages docushymentaires et dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation Il parut eacutevident que la nouvelle norme devrait refleacuteter clairement limportance du numeacuterique et des reacuteseaux et reposer sur des bases dont la validiteacute ne serait pas lieacutee agrave des technologies des logiciels ou des architectures de systegravemes particuliers

Les cinq sections de la norme britannique BS 8723 furent soumises en janvier 2008 agrave lensemble des membres du groupe de travail pour lecture et eacutevaluashytion Cette premiegravere opeacuteration a geacuteneacutereacute des centaines de commentaires certains tregraves critiques et meneacute agrave la premiegravere deacutecision importante du groupe celle de strucshyturer la norme ISO 25964 en deux sections distinctes plutocirct quen cinq sections comme le faisait BS 8723 La premiegravere section traiterait uniquement des theacutesaurus et sinspirerait des sections 1 2 et 5 de la norme britanshynique la seconde traiterait de passerelles et dinteropeacuteshyrabiliteacute en inteacutegrant le contenu des sections 3 et 4

Objet et domaine dapplication

La norme ISO 25964 offre des recommandations pour le deacuteveloppement et la gestion de vocabulaires structureacutes de termes repreacutesentant des sujets et des concepts utilisables pour la recherche dinformation Elle propose eacutegalement des directives pour leacutechange de donneacutees entre vocabulaires controcircleacutes et entre un vocashybulaire controcircleacute et lapplication au sein de laquelle il est utiliseacute3

La norme ISO 25964 sapplique aux vocabulaires utiliseacutes pour le repeacuterage dinformation dans des sources textuelles telles que les bases de connaissances les bases de donneacutees bibliographiques et les collections de documents mais aussi dans les catalogues dimages ou dobjets comme ceux qui deacutecrivent les collections museacuteales par exemple Les vocabulaires structureacutes sont utiliseacutes dans des systegravemes dinformation post-coor-donneacutes dans les reacutepertoires hieacuterarchiseacutes les index preacuteshycoordonneacutes et les systegravemes de classification4

3 laquo ISO 25964 gives recommendations for the development and maintenance of

structured vocabularies of subject terms and concepts for information retrieval

It also gives guidance on the exchange of data between multiple vocabularies and

between a vocabulary and the software with which it interacts raquo (ISO 25964 Part 1)

4 laquo ISO 25964 applies to vocabularies used for retrieving information from text

resources such as knowledge bases bibliographic databases or collections of full text

documents and also catalogues of images or artefacts such as those in a museum

collection Structured vocabularies are used in post-coordinate retrieval systems

hierarchical directories pre-coordinate indexes and classification systems raquo (ISO

25964 Part 1)

1 3 4 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Tableau 1 Comparaison des clauses principales dans les normes ISO 25964 2788 et 5964

l$02S9S4

4 Le theacutesaurus et ses fonctions

5 Types de concepts repreacutesenteacutes

6 Seacutelection et forme des termes dans un theacutesaurus

7 Traitement des concepts complexes et des termes composeacutes

8 Leacutequivalence en contexte monolingue

9 Leacutequivalence entre langues naturelles

10 Relations entre concepts 102 Relation hieacuterarchique 103 Relation associative 104 Autres relations

11 Lanalyse par facettes

12 Preacutesentation et affichage des donneacutees

13 Construction et gestion du theacutesaurus

14 Fonctionnaliteacutes requises des logiciels deacutedieacutes agrave la gestion des theacutesaurus

15 Modegravele de donneacutees

16 Inteacutegration du theacutesaurus au SRI

17 Formats deacutechange des donneacutees

18 Protocoles

ISO 2788 ET ISO 5964

5 Le controcircle du vocabulaire

6 Les termes dindexation

62 La forme des termes dindexation 65 Le choix des termes

7 Les termes composeacutes

8 Les relations dans un theacutesaurus 82 La relation deacutequivalence

9 Problegravemes langagiers dans les theacutesaurus multilingues (ISO 5964)

83 La relation hieacuterarchique 84 La relation associative

--

9 Laffichage des termes et des relations (ISO 2788)

10 Construction du theacutesaurus (ISO 2788) 15 Organisation du travail (ISO 5964)

--

-

-

-

-

Structure

Lorsquon compare la norme ISO 25964 agrave celles quelle remplace on remarque immeacutediatement quelle propose un volume consideacuterable de textes explicatifs ou descriptifs plutocirct que strictement normatifs Les normes ISO 2788 et ISO 5964 sadressaient agrave des speacuteciashylistes et misaient sur la preacutesence de nombreux exemples pour assurer la compreacutehension Ici le parti de lexplishycation a eacuteteacute pris dans le but eacutevident de favoriser lutishylisation de la norme par les deacuteveloppeurs de langages ou de structures pour la repreacutesentation et la recherche dinformation qui ne sont pas familiers avec les regravegles du controcircle du vocabulaire

La norme ISO 25964 est constitueacutee de deux parties distinctes mais interdeacutependantes

Partie 1 Theacutesaurus et recherche dinformation (Thesauri for information retrieval)

Cest dans la premiegravere section de la norme que lon trouve les principes geacuteneacuteraux et les recommandations applicables agrave la conception et agrave la gestion des theacutesaurus monolingues et multilingues Le texte des dix premiegraveres clauses de la section 1 reste tregraves pregraves de celui que lon

trouvait deacutejagrave dans les normes ISO 2788 et ISO 5964 (Tableau 1) Ainsi aucune modification majeure nest agrave signaler dans les clauses touchant aux types de concepts repreacutesenteacutes dans les theacutesaurus (Clause 5) agrave la forme des termes et aux meacutethodes de deacutesambiguiumlsation des homographes (Clause 6) aux recommandations concershynant le traitement des concepts et des termes complexes (Clause 7) La structure relationnelle du theacutesaurus telle que preacutesenteacutee dans les clauses 8 agrave 10 ne seacuteloigne pas non plus du cadre traditionnel Les quelques parashygraphes (Clause 104) qui abordent la question de lutishyliteacute potentielle de relations additionnelles plus explishycites ressemblent davantage agrave une mise en garde sur la difficulteacute de lopeacuteration quagrave un encouragement agrave enrishychir le contenu du theacutesaurus

La partie 1 de la norme propose par ailleurs plusieurs directives nouvelles La clause 11 reacuteaffirme lutiliteacute de lanalyse par facettes un processus auquel on sinteacuteresse davantage aujourdhui quau moment de la reacutedaction des normes ISO 2788 et 5964 la clause syntheacutetise des eacuteleacutements dinformation disseacutemineacutes auparavant dans les clauses portant sur le deacuteveloppeshyment de la structure et la preacutesentation des donneacutees Les clauses 12 laquo Preacutesentation et affichage raquo 13 laquo Gestion (de la creacuteation agrave la mise agrave jour) raquo et 14 laquo Logiciels pour la

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 5

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 4: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

connaissances (SOC) de types verbal ou symbolique Or les SOC et plus particuliegraverement les theacutesaurus se sont multiplieacutes avec linteacutegration doutils technoloshygiques dans les systegravemes de recherche dinformation Cette multiplication des langages documentaires a de beaucoup diminueacute la capaciteacute des systegravemes agrave communishyquer et agrave eacutechanger des donneacutees tout en compliquant la vie des usagers forceacutes dapprendre un langage diffeacuterent agrave chaque fois quils interrogeaient une nouvelle base de donneacutees Dans les reacuteseaux dinformation contemposhyrains les problegravemes lieacutes agrave la multipliciteacute et agrave la divershysiteacute des langages de recherche sont devenus critiques comment peut-on par exemple assurer lexhausti-viteacute ou la preacutecision du repeacuterage dans un systegraveme ougrave cohabitent les indices de la classification Dewey des vedettes-matiegravere et les termes dun theacutesaurus speacuteciashyliseacute Le chercheur dinformation ne peut que beacuteneacuteficier de tout effort qui lui permette dexplorer simultaneacutement plusieurs reacuteservoirs dinformation agrave laide du langage documentaire qui lui est le plus familier sans eacutegard agrave la diversiteacute des langages utiliseacutes pour repreacutesenter les concepts et les sujets au sein de chacun dentre eux

Enfin normes et directives sont dautant plus utiles aujourdhui que les opeacuterations de repreacutesentation et de recherche ne sont plus lapanage de speacutecialistes formeacutes agrave lanalyse documentaire et agrave la recherche dinformation Dans les milieux autres que les milieux traditionnels de la documentation la gestion et la recherche dinforshymation et de documents sont la responsabiliteacute de non-speacutecialistes (de linformation) de plus en plus souvent le creacuteateur mecircme de la ressource ou lindividu qui en a un besoin immeacutediat

Normes pour leacutelaboration et la gestion des theacutesaurus

Devant lindiffeacuterence apparente des autoriteacutes compeacutetentes face agrave la neacutecessiteacute de revoir la porteacutee et le contenu des normes ISO 2788 et ISO 5964 quelques speacutecialistes britanniques du deacuteveloppement et de la gestion des langages documentaires deacutecident en 2000 de sattaquer agrave la reacutevision des normes britanniques eacutequishyvalentes (BS 5723 et BS 6723) avec lintention claire de proposer ensuite une nouvelle norme agrave la communauteacute internationale (Dextre Clarke Gilchrist et Will 2004) Sept ans plus tard la cinquiegraveme et derniegravere section de la nouvelle norme BS 8723 Structured vocabularies for information retrieval est publieacutee et limportance accordeacutee agrave linteropeacuterabiliteacute sur les reacuteseaux numeacuteriques mondiaux y est eacutevidente

Les sections 1 et 2 de la norme britannique teacutemoishygnent dune attitude plutocirct conservatrice chez ses reacutedacteurs ces sections reprennent en effet la quasi-totaliteacute du contenu de la norme ISO 2788-1986 Nos collegravegues britanniques innovent toutefois dans la preacuteshyparation de trois sections ineacutedites La section 3 laquo Vocashybularies other than thesauri raquo deacutecrit le contenu et la

structure des scheacutemas de classification des reacutepertoires de vedettes-matiegravere des taxinomies des ontologies et des fichiers dautoriteacutes dans le but daider les utilisashyteurs de la norme de plus en plus diversifieacutes agrave percevoir les diffeacuterences qui existent entre ces outils La section 4 laquo Interoperability between vocabularies raquo eacutenonce des directives pour leacutetablissement de passerelles dans le but de favoriser linteropeacuterabiliteacute seacutemantique des sysshytegravemes dinformation cest ici que lon trouve lessenshytiel du contenu portant sur les theacutesaurus multilingues consideacutereacutes comme cas complexe dans un processus de mise en eacutequivalence La cinquiegraveme et derniegravere section teacutemoigne du caractegravere essentiel de la technologie dans lenvironnement theacutesaural en deacutetaillant modegraveles proshytocoles et formats pour le traitement et leacutechange des donneacutees

Les Britanniques ne sont pas les seuls agrave devancer lISO dans ces travaux denvergure devenus essentiels Au deacutebut des anneacutees 2000 un groupe de travail sattelle aux Eacutetats-Unis agrave la restructuration de la norme pour le deacuteveloppement des theacutesaurus monolingues La norme reacuteviseacutee NISOANSIZ 3919 est mise agrave disposition en 2005 Les nouvelles directives ne sappliquent pas seulement aux theacutesaurus mais eacutegalement agrave dautres types de vocashybulaires controcircleacutes tels les anneaux de synonymes et les taxinomies Contrairement agrave la norme britannique cependant la norme Z 3919-2005 ne couvre ni les vocashybulaires multilingues ni la mise en correspondance de langages documentaires distincts

Les langages documentaires multilingues sont par contre lunique preacuteoccupation dun groupe de travail de lIFLA formeacute en 2003 agrave linstigation du neacuteerlandais Gerhard Riesthuis Une seacuterie de directives sappliquant au deacuteveloppement des theacutesaurus multilingues et destishyneacutees agrave ecirctre utiliseacutees en compleacutement agrave la norme ISO 5964 est publieacutee en 2009 (IFLA 2009)

En France le groupe informel Langages documenshytaires de lAssociation des documentalistes et bibliotheacuteshycaires speacutecialiseacutes (ADBS) se donne pour tacircche en 2005 dexaminer les normes NISO Z 3919-2005 et BS 8723 reacutecemment publieacutees Le groupe oriente sa reacuteflexion autour de plusieurs questions comment ces nouvelles normes posent-elles la probleacutematique des langages documentaires En quoi sont-elles novatrices Comment les taxinomies et les ontologies peuvent-elles sarticuler aux theacutesaurus (Chichereau et al 2007) Le groupe reconnaicirct les caracteacuteristiques essentielles de lenvishyronnement actuel dutilisation des normes un public plus large des interfaces souples et faciles daccegraves une gestion des recherches moins sophistiqueacutee et non exclushysivement destineacutee agrave des professionnels meacutediateurs des innovations technologiques constantes et la multiplicashytion de nouveaux outils dorganisation de linformation et des connaissances

1 3 2 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Naissance et deacuteveloppement dune norme ISO

La majoriteacute des normes ISO sont soumises agrave eacutevaluashytion de faccedilon reacuteguliegravere soit agrave tous les trois ou cinq ans Les pays membres du comiteacute technique responsable de la norme agrave eacutevaluer sont alors requis de se prononcer sur la neacutecessiteacute de reacuteviser de retirer ou de reconduire celle-ci pour une nouvelle peacuteriode agrave dureacutee deacutetermineacutee Sil est deacutecideacute agrave la majoriteacute des membres que des chanshygements sont requis lopeacuteration de reacutevision (re-editing) est lanceacutee1

La premiegravere eacutetape de lopeacuteration est la laquo proposishytion de nouveau projet raquo Agrave ce stade un document de travail proposant la restructuration et la reacuteeacutecriture de la norme est preacutepareacute par un ou plusieurs membres du comiteacute technique Si la proposition est accepteacutee un groupe de travail constitueacute dexperts est formeacute avec pour premier mandat de preacuteparer un laquo avant-projet de norme raquo (committee draft) lequel sera soumis agrave eacutevaluashytion et commentaires Le travail requis est plus ou moins lourd selon la longueur et la complexiteacute de la norme agrave reacuteviser la peacuteriode eacutecouleacutee depuis sa derniegravere reacutevision le nombre et limportance des changements agrave apporter la disponibiliteacute de documents de reacutefeacuterence le nombre de deacuteleacutegueacutes aupregraves desquels il faut rechercher un consensus la compeacutetence du chef de projet etc Le calendrier des travaux preacutevoit normalement la publishycation de la norme reacuteviseacutee au plus tard 36 mois apregraves acceptation de la proposition de nouveau projet

Le groupe de travail emprunte ou reacutedige un premier texte agrave partir duquel il preacutepare son avant-projet de norme Lavant-projet est soumis pour commenshytaires agrave lensemble des membres du comiteacute technique responsable de la norme Il nest pas rare que plusieurs avant-projets successifs soient soumis pour commenshytaires dans un processus iteacuteratif qui vise latteinte dun consensus sur le contenu technique du document et sur sa preacutesentation

Une fois le consensus obtenu une version deacutefinitive du texte devenu laquo projet de norme raquo (draft international standard) est expeacutedieacutee agrave tous les comiteacutes techniques de lISO et soumise au vote Les membres votants disposent de cinq mois pour examiner le texte de la norme et agrave ce stade il leur est encore possible de suggeacuterer des ajouts Un projet final de norme est soumis agrave lensemble des comiteacutes techniques de lISO deux mois avant publicashytion seules des modifications mineures dordre stylisshytique ou typographique peuvent alors y ecirctre apporteacutees

On notera quune proportion importante des 36 mois alloueacutes au deacuteveloppement dune norme est en fait consacreacutee agrave la relecture et agrave leacutevaluation par les deacuteleacuteshygueacutes des pays membres de lISO Les peacuteriodes consa-

1 On peut trouver une description complegravete du processus de preacuteparation dune norme ISO sur le site de lOrganisation agrave lthttpwwwisoorgisofrstandards_ developmenthtmx

creacutees agrave la relecture pourraient sembler inutilement longues mais elles sont neacutecessaires Lorsquil reccediloit un projet de norme lorganisme responsable dans chaque pays de la normalisation dans un domaine particushylier doit recruter des experts qui accepteront de lire tregraves attentivement et de commenter le contenu dun ou mecircme de plusieurs documents et ce sans aucune compensation financiegravere ou autre La lecture dune norme en deacuteveloppement est un travail ardu exigeant du temps et une eacutenergie que plusieurs praticiens ne sont pas toujours en mesure de fournir Au Canada pour examiner les normes de la documentation par exemple Bibliothegraveque et Archives Canada (BAC) doit solliciter des eacutevaluateurs provenant des deux groupes linguisshytiques officiels de diverses reacutegions du pays de diverses communauteacutes de pratique (universiteacute recherche gouvernement organisme agrave but non-lucratif entreprise priveacutee) etc Ces speacutecialistes ne sont pas neacutecessairement largement connus et un travail de reacuteseautage consideacuteshyrable peut devoir ecirctre effectueacute en un temps record

Le projet de norme ISO 25964

Le Comiteacute technique 46 (TC46) laquo Information et documentation raquo est chargeacute agrave lISO des normes touchant les pratiques relatives aux bibliothegraveques aux centres de documentation agrave leacutedition aux archives agrave la gestion des documents administratifs agrave la docushymentation museacuteographique aux services dindexashytion et de reacutesumeacutes et aux sciences de linformation plus geacuteneacuteralement une quarantaine de normes sont sous sa responsabiliteacute directe et une centaine dautres sont produites par dautres Comiteacutes techniques avec lesquels TC46 maintient des liens (citons en exemple les Comiteacutes techniques 37 laquoTerminologie et autres ressources langagiegraveres et ressources de contenuraquo et 154 laquo Processus eacuteleacutements dinformation et documents dans le commerce lindustrie et ladministration raquo) Trente-cinq pays participent activement aux travaux du Comiteacute technique 46 (dont lAustralie le Canada la Chine les Eacutetats-Unis et la France) et 36 autres y ont un statut dobservateur

Le Sous-comiteacute 9 (SC9) du Comiteacute technique 46 laquo Identification et description raquo est responsable agrave lui seul dune vingtaine de normes On y deacutenombre une dizaine de groupes de travail œuvrant agrave la preacuteparashytion de nouvelles normes ou agrave la reacuteeacutecriture de normes publieacutees

En mai 2007 lorsque les normes ISO 2788 et ISO 5964 sont une nouvelle fois soumises agraveeacutevaluation cest au Comiteacute technique 46 que les repreacutesentants du Royaume-Uni soumettent la norme BS 8723-2005 aux fins de comparaison et deacutevaluation par la communauteacute internationale Leur proposition souligne quune mise agrave jour des normes ISO 2788 et ISO 5964 sera beacuteneacutefique agrave tous ceux qui font usage de volumineux reacuteservoirs dinshyformation dans les secteurs publics priveacutes et sans but

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 3

lucratif Le projet de norme ISO 25964 est mis sur pied lorsque le Comiteacute technique 46 rejette (enfin ) le statu quo et recommande lutilisation de la norme britanshynique comme document de reacutefeacuterence pour le remplaceshyment des directives pour le deacuteveloppement et la gestion des theacutesaurus en vigueur depuis plus de 20 ans

Le projet de norme ISO 25964 est officialiseacute en octobre de la mecircme anneacutee par la creacuteation du groupe de travail TC46SC9WG8 laquo Vocabulaires structureacutes raquo formeacute de speacutecialistes repreacutesentant une quinzaine de pays et plusieurs groupes linguistiques2 Le mandat du groupe de travail est clair laquo deacutevelopper une nouvelle norme ISO portant sur les vocabulaires structureacutes pour remplacer les normes existantes ie ISO 5964 publieacutee en 198s et ISO 2788 publieacutee en 1986 raquo Le WG8 est dirigeacute par Stella Dextre Clarke speacutecialiste du deacuteveloppement de theacutesaurus et de taxinomies et coreacutedactrice de la norme BS 8723-2005

Les membres du groupe de travail se rencontrent virtuellement lors de confeacuterences teacuteleacutephoniques tenues le premier lundi de chaque mois Un ordre du jour serreacute permet dentendre les points de vue de chacun sur les questions litigieuses et de faire progresser la reacutedacshytion des directives et la validation des exemples La preacutesidente du groupe attribue agrave chacun des mandats et des tacircches preacutecises filtre les commentaires integravegre les ajouts et corrections sur lesquels il y a consensus applique les directives de lISO pour tout ce qui concerne lutilisation dune terminologie et dun style de reacutedaction normaliseacutes ainsi que pour la mise en forme des textes Les membres du WG8 et quelques consultants externes ont accegraves agrave lensemble des ordres du jour procegraves-verbaux brouillons commentaires textes et messages eacutechangeacutes sous forme eacutelectronique dans un espace de travail virtuel creacuteeacute agrave leur intention par la National Information Standards Organization (NISO) Les membres du groupe de travailont eacutegaleshyment tireacute avantage de quelques seacuteances de travail en mode preacutesentiel dans les bureaux londoniens du British Standards Institute (BSI) de nombreuses deacutecisions ont pu alors ecirctre finaliseacutees et des avanceacutees importantes ont eacuteteacute reacutealiseacutees

Deux sous-groupes de travail ont eacuteteacute actifs en 2008-2009 Un premier sous-groupe sest consacreacute agrave la preacuteparation des clauses concernant les theacutesaurus multishylingues et le deuxiegraveme a structureacute les clauses portant sur les modegraveles de donneacutees Un troisiegraveme sous-groupe a pris forme en 2010 pour convenir de la place agrave accorder aux ontologies et proposer les contenus approprieacutes

2 Les pays repreacutesenteacutes dans le groupe de travail original eacutetaient lAfrique du Sud

lAllemagne la Bulgarie le Canada la Chine le Danemark lEspagne les Eacutetats-

Unis la Finlande la France la Nouvelle-Zeacutelande le Royaume-Uniet la Suegravede Des

repreacutesentants de la Belgique et de lAustralie ont inteacutegreacute le groupe apregraves le deacutebut

des travaux

Structure et contenu de la norme ISO 25964

Dentreacutee de jeu il fut convenu entre les parties inteacuteresseacutees que la porteacutee de la norme ISO 25964 serait plus large que celle des normes ISO 2788 et ISO 5964 quelle remplace et quelle traiterait de leacutetablissement de passerelles entre diverses formes de langages docushymentaires et dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation Il parut eacutevident que la nouvelle norme devrait refleacuteter clairement limportance du numeacuterique et des reacuteseaux et reposer sur des bases dont la validiteacute ne serait pas lieacutee agrave des technologies des logiciels ou des architectures de systegravemes particuliers

Les cinq sections de la norme britannique BS 8723 furent soumises en janvier 2008 agrave lensemble des membres du groupe de travail pour lecture et eacutevaluashytion Cette premiegravere opeacuteration a geacuteneacutereacute des centaines de commentaires certains tregraves critiques et meneacute agrave la premiegravere deacutecision importante du groupe celle de strucshyturer la norme ISO 25964 en deux sections distinctes plutocirct quen cinq sections comme le faisait BS 8723 La premiegravere section traiterait uniquement des theacutesaurus et sinspirerait des sections 1 2 et 5 de la norme britanshynique la seconde traiterait de passerelles et dinteropeacuteshyrabiliteacute en inteacutegrant le contenu des sections 3 et 4

Objet et domaine dapplication

La norme ISO 25964 offre des recommandations pour le deacuteveloppement et la gestion de vocabulaires structureacutes de termes repreacutesentant des sujets et des concepts utilisables pour la recherche dinformation Elle propose eacutegalement des directives pour leacutechange de donneacutees entre vocabulaires controcircleacutes et entre un vocashybulaire controcircleacute et lapplication au sein de laquelle il est utiliseacute3

La norme ISO 25964 sapplique aux vocabulaires utiliseacutes pour le repeacuterage dinformation dans des sources textuelles telles que les bases de connaissances les bases de donneacutees bibliographiques et les collections de documents mais aussi dans les catalogues dimages ou dobjets comme ceux qui deacutecrivent les collections museacuteales par exemple Les vocabulaires structureacutes sont utiliseacutes dans des systegravemes dinformation post-coor-donneacutes dans les reacutepertoires hieacuterarchiseacutes les index preacuteshycoordonneacutes et les systegravemes de classification4

3 laquo ISO 25964 gives recommendations for the development and maintenance of

structured vocabularies of subject terms and concepts for information retrieval

It also gives guidance on the exchange of data between multiple vocabularies and

between a vocabulary and the software with which it interacts raquo (ISO 25964 Part 1)

4 laquo ISO 25964 applies to vocabularies used for retrieving information from text

resources such as knowledge bases bibliographic databases or collections of full text

documents and also catalogues of images or artefacts such as those in a museum

collection Structured vocabularies are used in post-coordinate retrieval systems

hierarchical directories pre-coordinate indexes and classification systems raquo (ISO

25964 Part 1)

1 3 4 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Tableau 1 Comparaison des clauses principales dans les normes ISO 25964 2788 et 5964

l$02S9S4

4 Le theacutesaurus et ses fonctions

5 Types de concepts repreacutesenteacutes

6 Seacutelection et forme des termes dans un theacutesaurus

7 Traitement des concepts complexes et des termes composeacutes

8 Leacutequivalence en contexte monolingue

9 Leacutequivalence entre langues naturelles

10 Relations entre concepts 102 Relation hieacuterarchique 103 Relation associative 104 Autres relations

11 Lanalyse par facettes

12 Preacutesentation et affichage des donneacutees

13 Construction et gestion du theacutesaurus

14 Fonctionnaliteacutes requises des logiciels deacutedieacutes agrave la gestion des theacutesaurus

15 Modegravele de donneacutees

16 Inteacutegration du theacutesaurus au SRI

17 Formats deacutechange des donneacutees

18 Protocoles

ISO 2788 ET ISO 5964

5 Le controcircle du vocabulaire

6 Les termes dindexation

62 La forme des termes dindexation 65 Le choix des termes

7 Les termes composeacutes

8 Les relations dans un theacutesaurus 82 La relation deacutequivalence

9 Problegravemes langagiers dans les theacutesaurus multilingues (ISO 5964)

83 La relation hieacuterarchique 84 La relation associative

--

9 Laffichage des termes et des relations (ISO 2788)

10 Construction du theacutesaurus (ISO 2788) 15 Organisation du travail (ISO 5964)

--

-

-

-

-

Structure

Lorsquon compare la norme ISO 25964 agrave celles quelle remplace on remarque immeacutediatement quelle propose un volume consideacuterable de textes explicatifs ou descriptifs plutocirct que strictement normatifs Les normes ISO 2788 et ISO 5964 sadressaient agrave des speacuteciashylistes et misaient sur la preacutesence de nombreux exemples pour assurer la compreacutehension Ici le parti de lexplishycation a eacuteteacute pris dans le but eacutevident de favoriser lutishylisation de la norme par les deacuteveloppeurs de langages ou de structures pour la repreacutesentation et la recherche dinformation qui ne sont pas familiers avec les regravegles du controcircle du vocabulaire

La norme ISO 25964 est constitueacutee de deux parties distinctes mais interdeacutependantes

Partie 1 Theacutesaurus et recherche dinformation (Thesauri for information retrieval)

Cest dans la premiegravere section de la norme que lon trouve les principes geacuteneacuteraux et les recommandations applicables agrave la conception et agrave la gestion des theacutesaurus monolingues et multilingues Le texte des dix premiegraveres clauses de la section 1 reste tregraves pregraves de celui que lon

trouvait deacutejagrave dans les normes ISO 2788 et ISO 5964 (Tableau 1) Ainsi aucune modification majeure nest agrave signaler dans les clauses touchant aux types de concepts repreacutesenteacutes dans les theacutesaurus (Clause 5) agrave la forme des termes et aux meacutethodes de deacutesambiguiumlsation des homographes (Clause 6) aux recommandations concershynant le traitement des concepts et des termes complexes (Clause 7) La structure relationnelle du theacutesaurus telle que preacutesenteacutee dans les clauses 8 agrave 10 ne seacuteloigne pas non plus du cadre traditionnel Les quelques parashygraphes (Clause 104) qui abordent la question de lutishyliteacute potentielle de relations additionnelles plus explishycites ressemblent davantage agrave une mise en garde sur la difficulteacute de lopeacuteration quagrave un encouragement agrave enrishychir le contenu du theacutesaurus

La partie 1 de la norme propose par ailleurs plusieurs directives nouvelles La clause 11 reacuteaffirme lutiliteacute de lanalyse par facettes un processus auquel on sinteacuteresse davantage aujourdhui quau moment de la reacutedaction des normes ISO 2788 et 5964 la clause syntheacutetise des eacuteleacutements dinformation disseacutemineacutes auparavant dans les clauses portant sur le deacuteveloppeshyment de la structure et la preacutesentation des donneacutees Les clauses 12 laquo Preacutesentation et affichage raquo 13 laquo Gestion (de la creacuteation agrave la mise agrave jour) raquo et 14 laquo Logiciels pour la

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 5

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 5: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Naissance et deacuteveloppement dune norme ISO

La majoriteacute des normes ISO sont soumises agrave eacutevaluashytion de faccedilon reacuteguliegravere soit agrave tous les trois ou cinq ans Les pays membres du comiteacute technique responsable de la norme agrave eacutevaluer sont alors requis de se prononcer sur la neacutecessiteacute de reacuteviser de retirer ou de reconduire celle-ci pour une nouvelle peacuteriode agrave dureacutee deacutetermineacutee Sil est deacutecideacute agrave la majoriteacute des membres que des chanshygements sont requis lopeacuteration de reacutevision (re-editing) est lanceacutee1

La premiegravere eacutetape de lopeacuteration est la laquo proposishytion de nouveau projet raquo Agrave ce stade un document de travail proposant la restructuration et la reacuteeacutecriture de la norme est preacutepareacute par un ou plusieurs membres du comiteacute technique Si la proposition est accepteacutee un groupe de travail constitueacute dexperts est formeacute avec pour premier mandat de preacuteparer un laquo avant-projet de norme raquo (committee draft) lequel sera soumis agrave eacutevaluashytion et commentaires Le travail requis est plus ou moins lourd selon la longueur et la complexiteacute de la norme agrave reacuteviser la peacuteriode eacutecouleacutee depuis sa derniegravere reacutevision le nombre et limportance des changements agrave apporter la disponibiliteacute de documents de reacutefeacuterence le nombre de deacuteleacutegueacutes aupregraves desquels il faut rechercher un consensus la compeacutetence du chef de projet etc Le calendrier des travaux preacutevoit normalement la publishycation de la norme reacuteviseacutee au plus tard 36 mois apregraves acceptation de la proposition de nouveau projet

Le groupe de travail emprunte ou reacutedige un premier texte agrave partir duquel il preacutepare son avant-projet de norme Lavant-projet est soumis pour commenshytaires agrave lensemble des membres du comiteacute technique responsable de la norme Il nest pas rare que plusieurs avant-projets successifs soient soumis pour commenshytaires dans un processus iteacuteratif qui vise latteinte dun consensus sur le contenu technique du document et sur sa preacutesentation

Une fois le consensus obtenu une version deacutefinitive du texte devenu laquo projet de norme raquo (draft international standard) est expeacutedieacutee agrave tous les comiteacutes techniques de lISO et soumise au vote Les membres votants disposent de cinq mois pour examiner le texte de la norme et agrave ce stade il leur est encore possible de suggeacuterer des ajouts Un projet final de norme est soumis agrave lensemble des comiteacutes techniques de lISO deux mois avant publicashytion seules des modifications mineures dordre stylisshytique ou typographique peuvent alors y ecirctre apporteacutees

On notera quune proportion importante des 36 mois alloueacutes au deacuteveloppement dune norme est en fait consacreacutee agrave la relecture et agrave leacutevaluation par les deacuteleacuteshygueacutes des pays membres de lISO Les peacuteriodes consa-

1 On peut trouver une description complegravete du processus de preacuteparation dune norme ISO sur le site de lOrganisation agrave lthttpwwwisoorgisofrstandards_ developmenthtmx

creacutees agrave la relecture pourraient sembler inutilement longues mais elles sont neacutecessaires Lorsquil reccediloit un projet de norme lorganisme responsable dans chaque pays de la normalisation dans un domaine particushylier doit recruter des experts qui accepteront de lire tregraves attentivement et de commenter le contenu dun ou mecircme de plusieurs documents et ce sans aucune compensation financiegravere ou autre La lecture dune norme en deacuteveloppement est un travail ardu exigeant du temps et une eacutenergie que plusieurs praticiens ne sont pas toujours en mesure de fournir Au Canada pour examiner les normes de la documentation par exemple Bibliothegraveque et Archives Canada (BAC) doit solliciter des eacutevaluateurs provenant des deux groupes linguisshytiques officiels de diverses reacutegions du pays de diverses communauteacutes de pratique (universiteacute recherche gouvernement organisme agrave but non-lucratif entreprise priveacutee) etc Ces speacutecialistes ne sont pas neacutecessairement largement connus et un travail de reacuteseautage consideacuteshyrable peut devoir ecirctre effectueacute en un temps record

Le projet de norme ISO 25964

Le Comiteacute technique 46 (TC46) laquo Information et documentation raquo est chargeacute agrave lISO des normes touchant les pratiques relatives aux bibliothegraveques aux centres de documentation agrave leacutedition aux archives agrave la gestion des documents administratifs agrave la docushymentation museacuteographique aux services dindexashytion et de reacutesumeacutes et aux sciences de linformation plus geacuteneacuteralement une quarantaine de normes sont sous sa responsabiliteacute directe et une centaine dautres sont produites par dautres Comiteacutes techniques avec lesquels TC46 maintient des liens (citons en exemple les Comiteacutes techniques 37 laquoTerminologie et autres ressources langagiegraveres et ressources de contenuraquo et 154 laquo Processus eacuteleacutements dinformation et documents dans le commerce lindustrie et ladministration raquo) Trente-cinq pays participent activement aux travaux du Comiteacute technique 46 (dont lAustralie le Canada la Chine les Eacutetats-Unis et la France) et 36 autres y ont un statut dobservateur

Le Sous-comiteacute 9 (SC9) du Comiteacute technique 46 laquo Identification et description raquo est responsable agrave lui seul dune vingtaine de normes On y deacutenombre une dizaine de groupes de travail œuvrant agrave la preacuteparashytion de nouvelles normes ou agrave la reacuteeacutecriture de normes publieacutees

En mai 2007 lorsque les normes ISO 2788 et ISO 5964 sont une nouvelle fois soumises agraveeacutevaluation cest au Comiteacute technique 46 que les repreacutesentants du Royaume-Uni soumettent la norme BS 8723-2005 aux fins de comparaison et deacutevaluation par la communauteacute internationale Leur proposition souligne quune mise agrave jour des normes ISO 2788 et ISO 5964 sera beacuteneacutefique agrave tous ceux qui font usage de volumineux reacuteservoirs dinshyformation dans les secteurs publics priveacutes et sans but

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 3

lucratif Le projet de norme ISO 25964 est mis sur pied lorsque le Comiteacute technique 46 rejette (enfin ) le statu quo et recommande lutilisation de la norme britanshynique comme document de reacutefeacuterence pour le remplaceshyment des directives pour le deacuteveloppement et la gestion des theacutesaurus en vigueur depuis plus de 20 ans

Le projet de norme ISO 25964 est officialiseacute en octobre de la mecircme anneacutee par la creacuteation du groupe de travail TC46SC9WG8 laquo Vocabulaires structureacutes raquo formeacute de speacutecialistes repreacutesentant une quinzaine de pays et plusieurs groupes linguistiques2 Le mandat du groupe de travail est clair laquo deacutevelopper une nouvelle norme ISO portant sur les vocabulaires structureacutes pour remplacer les normes existantes ie ISO 5964 publieacutee en 198s et ISO 2788 publieacutee en 1986 raquo Le WG8 est dirigeacute par Stella Dextre Clarke speacutecialiste du deacuteveloppement de theacutesaurus et de taxinomies et coreacutedactrice de la norme BS 8723-2005

Les membres du groupe de travail se rencontrent virtuellement lors de confeacuterences teacuteleacutephoniques tenues le premier lundi de chaque mois Un ordre du jour serreacute permet dentendre les points de vue de chacun sur les questions litigieuses et de faire progresser la reacutedacshytion des directives et la validation des exemples La preacutesidente du groupe attribue agrave chacun des mandats et des tacircches preacutecises filtre les commentaires integravegre les ajouts et corrections sur lesquels il y a consensus applique les directives de lISO pour tout ce qui concerne lutilisation dune terminologie et dun style de reacutedaction normaliseacutes ainsi que pour la mise en forme des textes Les membres du WG8 et quelques consultants externes ont accegraves agrave lensemble des ordres du jour procegraves-verbaux brouillons commentaires textes et messages eacutechangeacutes sous forme eacutelectronique dans un espace de travail virtuel creacuteeacute agrave leur intention par la National Information Standards Organization (NISO) Les membres du groupe de travailont eacutegaleshyment tireacute avantage de quelques seacuteances de travail en mode preacutesentiel dans les bureaux londoniens du British Standards Institute (BSI) de nombreuses deacutecisions ont pu alors ecirctre finaliseacutees et des avanceacutees importantes ont eacuteteacute reacutealiseacutees

Deux sous-groupes de travail ont eacuteteacute actifs en 2008-2009 Un premier sous-groupe sest consacreacute agrave la preacuteparation des clauses concernant les theacutesaurus multishylingues et le deuxiegraveme a structureacute les clauses portant sur les modegraveles de donneacutees Un troisiegraveme sous-groupe a pris forme en 2010 pour convenir de la place agrave accorder aux ontologies et proposer les contenus approprieacutes

2 Les pays repreacutesenteacutes dans le groupe de travail original eacutetaient lAfrique du Sud

lAllemagne la Bulgarie le Canada la Chine le Danemark lEspagne les Eacutetats-

Unis la Finlande la France la Nouvelle-Zeacutelande le Royaume-Uniet la Suegravede Des

repreacutesentants de la Belgique et de lAustralie ont inteacutegreacute le groupe apregraves le deacutebut

des travaux

Structure et contenu de la norme ISO 25964

Dentreacutee de jeu il fut convenu entre les parties inteacuteresseacutees que la porteacutee de la norme ISO 25964 serait plus large que celle des normes ISO 2788 et ISO 5964 quelle remplace et quelle traiterait de leacutetablissement de passerelles entre diverses formes de langages docushymentaires et dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation Il parut eacutevident que la nouvelle norme devrait refleacuteter clairement limportance du numeacuterique et des reacuteseaux et reposer sur des bases dont la validiteacute ne serait pas lieacutee agrave des technologies des logiciels ou des architectures de systegravemes particuliers

Les cinq sections de la norme britannique BS 8723 furent soumises en janvier 2008 agrave lensemble des membres du groupe de travail pour lecture et eacutevaluashytion Cette premiegravere opeacuteration a geacuteneacutereacute des centaines de commentaires certains tregraves critiques et meneacute agrave la premiegravere deacutecision importante du groupe celle de strucshyturer la norme ISO 25964 en deux sections distinctes plutocirct quen cinq sections comme le faisait BS 8723 La premiegravere section traiterait uniquement des theacutesaurus et sinspirerait des sections 1 2 et 5 de la norme britanshynique la seconde traiterait de passerelles et dinteropeacuteshyrabiliteacute en inteacutegrant le contenu des sections 3 et 4

Objet et domaine dapplication

La norme ISO 25964 offre des recommandations pour le deacuteveloppement et la gestion de vocabulaires structureacutes de termes repreacutesentant des sujets et des concepts utilisables pour la recherche dinformation Elle propose eacutegalement des directives pour leacutechange de donneacutees entre vocabulaires controcircleacutes et entre un vocashybulaire controcircleacute et lapplication au sein de laquelle il est utiliseacute3

La norme ISO 25964 sapplique aux vocabulaires utiliseacutes pour le repeacuterage dinformation dans des sources textuelles telles que les bases de connaissances les bases de donneacutees bibliographiques et les collections de documents mais aussi dans les catalogues dimages ou dobjets comme ceux qui deacutecrivent les collections museacuteales par exemple Les vocabulaires structureacutes sont utiliseacutes dans des systegravemes dinformation post-coor-donneacutes dans les reacutepertoires hieacuterarchiseacutes les index preacuteshycoordonneacutes et les systegravemes de classification4

3 laquo ISO 25964 gives recommendations for the development and maintenance of

structured vocabularies of subject terms and concepts for information retrieval

It also gives guidance on the exchange of data between multiple vocabularies and

between a vocabulary and the software with which it interacts raquo (ISO 25964 Part 1)

4 laquo ISO 25964 applies to vocabularies used for retrieving information from text

resources such as knowledge bases bibliographic databases or collections of full text

documents and also catalogues of images or artefacts such as those in a museum

collection Structured vocabularies are used in post-coordinate retrieval systems

hierarchical directories pre-coordinate indexes and classification systems raquo (ISO

25964 Part 1)

1 3 4 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Tableau 1 Comparaison des clauses principales dans les normes ISO 25964 2788 et 5964

l$02S9S4

4 Le theacutesaurus et ses fonctions

5 Types de concepts repreacutesenteacutes

6 Seacutelection et forme des termes dans un theacutesaurus

7 Traitement des concepts complexes et des termes composeacutes

8 Leacutequivalence en contexte monolingue

9 Leacutequivalence entre langues naturelles

10 Relations entre concepts 102 Relation hieacuterarchique 103 Relation associative 104 Autres relations

11 Lanalyse par facettes

12 Preacutesentation et affichage des donneacutees

13 Construction et gestion du theacutesaurus

14 Fonctionnaliteacutes requises des logiciels deacutedieacutes agrave la gestion des theacutesaurus

15 Modegravele de donneacutees

16 Inteacutegration du theacutesaurus au SRI

17 Formats deacutechange des donneacutees

18 Protocoles

ISO 2788 ET ISO 5964

5 Le controcircle du vocabulaire

6 Les termes dindexation

62 La forme des termes dindexation 65 Le choix des termes

7 Les termes composeacutes

8 Les relations dans un theacutesaurus 82 La relation deacutequivalence

9 Problegravemes langagiers dans les theacutesaurus multilingues (ISO 5964)

83 La relation hieacuterarchique 84 La relation associative

--

9 Laffichage des termes et des relations (ISO 2788)

10 Construction du theacutesaurus (ISO 2788) 15 Organisation du travail (ISO 5964)

--

-

-

-

-

Structure

Lorsquon compare la norme ISO 25964 agrave celles quelle remplace on remarque immeacutediatement quelle propose un volume consideacuterable de textes explicatifs ou descriptifs plutocirct que strictement normatifs Les normes ISO 2788 et ISO 5964 sadressaient agrave des speacuteciashylistes et misaient sur la preacutesence de nombreux exemples pour assurer la compreacutehension Ici le parti de lexplishycation a eacuteteacute pris dans le but eacutevident de favoriser lutishylisation de la norme par les deacuteveloppeurs de langages ou de structures pour la repreacutesentation et la recherche dinformation qui ne sont pas familiers avec les regravegles du controcircle du vocabulaire

La norme ISO 25964 est constitueacutee de deux parties distinctes mais interdeacutependantes

Partie 1 Theacutesaurus et recherche dinformation (Thesauri for information retrieval)

Cest dans la premiegravere section de la norme que lon trouve les principes geacuteneacuteraux et les recommandations applicables agrave la conception et agrave la gestion des theacutesaurus monolingues et multilingues Le texte des dix premiegraveres clauses de la section 1 reste tregraves pregraves de celui que lon

trouvait deacutejagrave dans les normes ISO 2788 et ISO 5964 (Tableau 1) Ainsi aucune modification majeure nest agrave signaler dans les clauses touchant aux types de concepts repreacutesenteacutes dans les theacutesaurus (Clause 5) agrave la forme des termes et aux meacutethodes de deacutesambiguiumlsation des homographes (Clause 6) aux recommandations concershynant le traitement des concepts et des termes complexes (Clause 7) La structure relationnelle du theacutesaurus telle que preacutesenteacutee dans les clauses 8 agrave 10 ne seacuteloigne pas non plus du cadre traditionnel Les quelques parashygraphes (Clause 104) qui abordent la question de lutishyliteacute potentielle de relations additionnelles plus explishycites ressemblent davantage agrave une mise en garde sur la difficulteacute de lopeacuteration quagrave un encouragement agrave enrishychir le contenu du theacutesaurus

La partie 1 de la norme propose par ailleurs plusieurs directives nouvelles La clause 11 reacuteaffirme lutiliteacute de lanalyse par facettes un processus auquel on sinteacuteresse davantage aujourdhui quau moment de la reacutedaction des normes ISO 2788 et 5964 la clause syntheacutetise des eacuteleacutements dinformation disseacutemineacutes auparavant dans les clauses portant sur le deacuteveloppeshyment de la structure et la preacutesentation des donneacutees Les clauses 12 laquo Preacutesentation et affichage raquo 13 laquo Gestion (de la creacuteation agrave la mise agrave jour) raquo et 14 laquo Logiciels pour la

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 5

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 6: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

lucratif Le projet de norme ISO 25964 est mis sur pied lorsque le Comiteacute technique 46 rejette (enfin ) le statu quo et recommande lutilisation de la norme britanshynique comme document de reacutefeacuterence pour le remplaceshyment des directives pour le deacuteveloppement et la gestion des theacutesaurus en vigueur depuis plus de 20 ans

Le projet de norme ISO 25964 est officialiseacute en octobre de la mecircme anneacutee par la creacuteation du groupe de travail TC46SC9WG8 laquo Vocabulaires structureacutes raquo formeacute de speacutecialistes repreacutesentant une quinzaine de pays et plusieurs groupes linguistiques2 Le mandat du groupe de travail est clair laquo deacutevelopper une nouvelle norme ISO portant sur les vocabulaires structureacutes pour remplacer les normes existantes ie ISO 5964 publieacutee en 198s et ISO 2788 publieacutee en 1986 raquo Le WG8 est dirigeacute par Stella Dextre Clarke speacutecialiste du deacuteveloppement de theacutesaurus et de taxinomies et coreacutedactrice de la norme BS 8723-2005

Les membres du groupe de travail se rencontrent virtuellement lors de confeacuterences teacuteleacutephoniques tenues le premier lundi de chaque mois Un ordre du jour serreacute permet dentendre les points de vue de chacun sur les questions litigieuses et de faire progresser la reacutedacshytion des directives et la validation des exemples La preacutesidente du groupe attribue agrave chacun des mandats et des tacircches preacutecises filtre les commentaires integravegre les ajouts et corrections sur lesquels il y a consensus applique les directives de lISO pour tout ce qui concerne lutilisation dune terminologie et dun style de reacutedaction normaliseacutes ainsi que pour la mise en forme des textes Les membres du WG8 et quelques consultants externes ont accegraves agrave lensemble des ordres du jour procegraves-verbaux brouillons commentaires textes et messages eacutechangeacutes sous forme eacutelectronique dans un espace de travail virtuel creacuteeacute agrave leur intention par la National Information Standards Organization (NISO) Les membres du groupe de travailont eacutegaleshyment tireacute avantage de quelques seacuteances de travail en mode preacutesentiel dans les bureaux londoniens du British Standards Institute (BSI) de nombreuses deacutecisions ont pu alors ecirctre finaliseacutees et des avanceacutees importantes ont eacuteteacute reacutealiseacutees

Deux sous-groupes de travail ont eacuteteacute actifs en 2008-2009 Un premier sous-groupe sest consacreacute agrave la preacuteparation des clauses concernant les theacutesaurus multishylingues et le deuxiegraveme a structureacute les clauses portant sur les modegraveles de donneacutees Un troisiegraveme sous-groupe a pris forme en 2010 pour convenir de la place agrave accorder aux ontologies et proposer les contenus approprieacutes

2 Les pays repreacutesenteacutes dans le groupe de travail original eacutetaient lAfrique du Sud

lAllemagne la Bulgarie le Canada la Chine le Danemark lEspagne les Eacutetats-

Unis la Finlande la France la Nouvelle-Zeacutelande le Royaume-Uniet la Suegravede Des

repreacutesentants de la Belgique et de lAustralie ont inteacutegreacute le groupe apregraves le deacutebut

des travaux

Structure et contenu de la norme ISO 25964

Dentreacutee de jeu il fut convenu entre les parties inteacuteresseacutees que la porteacutee de la norme ISO 25964 serait plus large que celle des normes ISO 2788 et ISO 5964 quelle remplace et quelle traiterait de leacutetablissement de passerelles entre diverses formes de langages docushymentaires et dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation Il parut eacutevident que la nouvelle norme devrait refleacuteter clairement limportance du numeacuterique et des reacuteseaux et reposer sur des bases dont la validiteacute ne serait pas lieacutee agrave des technologies des logiciels ou des architectures de systegravemes particuliers

Les cinq sections de la norme britannique BS 8723 furent soumises en janvier 2008 agrave lensemble des membres du groupe de travail pour lecture et eacutevaluashytion Cette premiegravere opeacuteration a geacuteneacutereacute des centaines de commentaires certains tregraves critiques et meneacute agrave la premiegravere deacutecision importante du groupe celle de strucshyturer la norme ISO 25964 en deux sections distinctes plutocirct quen cinq sections comme le faisait BS 8723 La premiegravere section traiterait uniquement des theacutesaurus et sinspirerait des sections 1 2 et 5 de la norme britanshynique la seconde traiterait de passerelles et dinteropeacuteshyrabiliteacute en inteacutegrant le contenu des sections 3 et 4

Objet et domaine dapplication

La norme ISO 25964 offre des recommandations pour le deacuteveloppement et la gestion de vocabulaires structureacutes de termes repreacutesentant des sujets et des concepts utilisables pour la recherche dinformation Elle propose eacutegalement des directives pour leacutechange de donneacutees entre vocabulaires controcircleacutes et entre un vocashybulaire controcircleacute et lapplication au sein de laquelle il est utiliseacute3

La norme ISO 25964 sapplique aux vocabulaires utiliseacutes pour le repeacuterage dinformation dans des sources textuelles telles que les bases de connaissances les bases de donneacutees bibliographiques et les collections de documents mais aussi dans les catalogues dimages ou dobjets comme ceux qui deacutecrivent les collections museacuteales par exemple Les vocabulaires structureacutes sont utiliseacutes dans des systegravemes dinformation post-coor-donneacutes dans les reacutepertoires hieacuterarchiseacutes les index preacuteshycoordonneacutes et les systegravemes de classification4

3 laquo ISO 25964 gives recommendations for the development and maintenance of

structured vocabularies of subject terms and concepts for information retrieval

It also gives guidance on the exchange of data between multiple vocabularies and

between a vocabulary and the software with which it interacts raquo (ISO 25964 Part 1)

4 laquo ISO 25964 applies to vocabularies used for retrieving information from text

resources such as knowledge bases bibliographic databases or collections of full text

documents and also catalogues of images or artefacts such as those in a museum

collection Structured vocabularies are used in post-coordinate retrieval systems

hierarchical directories pre-coordinate indexes and classification systems raquo (ISO

25964 Part 1)

1 3 4 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Tableau 1 Comparaison des clauses principales dans les normes ISO 25964 2788 et 5964

l$02S9S4

4 Le theacutesaurus et ses fonctions

5 Types de concepts repreacutesenteacutes

6 Seacutelection et forme des termes dans un theacutesaurus

7 Traitement des concepts complexes et des termes composeacutes

8 Leacutequivalence en contexte monolingue

9 Leacutequivalence entre langues naturelles

10 Relations entre concepts 102 Relation hieacuterarchique 103 Relation associative 104 Autres relations

11 Lanalyse par facettes

12 Preacutesentation et affichage des donneacutees

13 Construction et gestion du theacutesaurus

14 Fonctionnaliteacutes requises des logiciels deacutedieacutes agrave la gestion des theacutesaurus

15 Modegravele de donneacutees

16 Inteacutegration du theacutesaurus au SRI

17 Formats deacutechange des donneacutees

18 Protocoles

ISO 2788 ET ISO 5964

5 Le controcircle du vocabulaire

6 Les termes dindexation

62 La forme des termes dindexation 65 Le choix des termes

7 Les termes composeacutes

8 Les relations dans un theacutesaurus 82 La relation deacutequivalence

9 Problegravemes langagiers dans les theacutesaurus multilingues (ISO 5964)

83 La relation hieacuterarchique 84 La relation associative

--

9 Laffichage des termes et des relations (ISO 2788)

10 Construction du theacutesaurus (ISO 2788) 15 Organisation du travail (ISO 5964)

--

-

-

-

-

Structure

Lorsquon compare la norme ISO 25964 agrave celles quelle remplace on remarque immeacutediatement quelle propose un volume consideacuterable de textes explicatifs ou descriptifs plutocirct que strictement normatifs Les normes ISO 2788 et ISO 5964 sadressaient agrave des speacuteciashylistes et misaient sur la preacutesence de nombreux exemples pour assurer la compreacutehension Ici le parti de lexplishycation a eacuteteacute pris dans le but eacutevident de favoriser lutishylisation de la norme par les deacuteveloppeurs de langages ou de structures pour la repreacutesentation et la recherche dinformation qui ne sont pas familiers avec les regravegles du controcircle du vocabulaire

La norme ISO 25964 est constitueacutee de deux parties distinctes mais interdeacutependantes

Partie 1 Theacutesaurus et recherche dinformation (Thesauri for information retrieval)

Cest dans la premiegravere section de la norme que lon trouve les principes geacuteneacuteraux et les recommandations applicables agrave la conception et agrave la gestion des theacutesaurus monolingues et multilingues Le texte des dix premiegraveres clauses de la section 1 reste tregraves pregraves de celui que lon

trouvait deacutejagrave dans les normes ISO 2788 et ISO 5964 (Tableau 1) Ainsi aucune modification majeure nest agrave signaler dans les clauses touchant aux types de concepts repreacutesenteacutes dans les theacutesaurus (Clause 5) agrave la forme des termes et aux meacutethodes de deacutesambiguiumlsation des homographes (Clause 6) aux recommandations concershynant le traitement des concepts et des termes complexes (Clause 7) La structure relationnelle du theacutesaurus telle que preacutesenteacutee dans les clauses 8 agrave 10 ne seacuteloigne pas non plus du cadre traditionnel Les quelques parashygraphes (Clause 104) qui abordent la question de lutishyliteacute potentielle de relations additionnelles plus explishycites ressemblent davantage agrave une mise en garde sur la difficulteacute de lopeacuteration quagrave un encouragement agrave enrishychir le contenu du theacutesaurus

La partie 1 de la norme propose par ailleurs plusieurs directives nouvelles La clause 11 reacuteaffirme lutiliteacute de lanalyse par facettes un processus auquel on sinteacuteresse davantage aujourdhui quau moment de la reacutedaction des normes ISO 2788 et 5964 la clause syntheacutetise des eacuteleacutements dinformation disseacutemineacutes auparavant dans les clauses portant sur le deacuteveloppeshyment de la structure et la preacutesentation des donneacutees Les clauses 12 laquo Preacutesentation et affichage raquo 13 laquo Gestion (de la creacuteation agrave la mise agrave jour) raquo et 14 laquo Logiciels pour la

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 5

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 7: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Tableau 1 Comparaison des clauses principales dans les normes ISO 25964 2788 et 5964

l$02S9S4

4 Le theacutesaurus et ses fonctions

5 Types de concepts repreacutesenteacutes

6 Seacutelection et forme des termes dans un theacutesaurus

7 Traitement des concepts complexes et des termes composeacutes

8 Leacutequivalence en contexte monolingue

9 Leacutequivalence entre langues naturelles

10 Relations entre concepts 102 Relation hieacuterarchique 103 Relation associative 104 Autres relations

11 Lanalyse par facettes

12 Preacutesentation et affichage des donneacutees

13 Construction et gestion du theacutesaurus

14 Fonctionnaliteacutes requises des logiciels deacutedieacutes agrave la gestion des theacutesaurus

15 Modegravele de donneacutees

16 Inteacutegration du theacutesaurus au SRI

17 Formats deacutechange des donneacutees

18 Protocoles

ISO 2788 ET ISO 5964

5 Le controcircle du vocabulaire

6 Les termes dindexation

62 La forme des termes dindexation 65 Le choix des termes

7 Les termes composeacutes

8 Les relations dans un theacutesaurus 82 La relation deacutequivalence

9 Problegravemes langagiers dans les theacutesaurus multilingues (ISO 5964)

83 La relation hieacuterarchique 84 La relation associative

--

9 Laffichage des termes et des relations (ISO 2788)

10 Construction du theacutesaurus (ISO 2788) 15 Organisation du travail (ISO 5964)

--

-

-

-

-

Structure

Lorsquon compare la norme ISO 25964 agrave celles quelle remplace on remarque immeacutediatement quelle propose un volume consideacuterable de textes explicatifs ou descriptifs plutocirct que strictement normatifs Les normes ISO 2788 et ISO 5964 sadressaient agrave des speacuteciashylistes et misaient sur la preacutesence de nombreux exemples pour assurer la compreacutehension Ici le parti de lexplishycation a eacuteteacute pris dans le but eacutevident de favoriser lutishylisation de la norme par les deacuteveloppeurs de langages ou de structures pour la repreacutesentation et la recherche dinformation qui ne sont pas familiers avec les regravegles du controcircle du vocabulaire

La norme ISO 25964 est constitueacutee de deux parties distinctes mais interdeacutependantes

Partie 1 Theacutesaurus et recherche dinformation (Thesauri for information retrieval)

Cest dans la premiegravere section de la norme que lon trouve les principes geacuteneacuteraux et les recommandations applicables agrave la conception et agrave la gestion des theacutesaurus monolingues et multilingues Le texte des dix premiegraveres clauses de la section 1 reste tregraves pregraves de celui que lon

trouvait deacutejagrave dans les normes ISO 2788 et ISO 5964 (Tableau 1) Ainsi aucune modification majeure nest agrave signaler dans les clauses touchant aux types de concepts repreacutesenteacutes dans les theacutesaurus (Clause 5) agrave la forme des termes et aux meacutethodes de deacutesambiguiumlsation des homographes (Clause 6) aux recommandations concershynant le traitement des concepts et des termes complexes (Clause 7) La structure relationnelle du theacutesaurus telle que preacutesenteacutee dans les clauses 8 agrave 10 ne seacuteloigne pas non plus du cadre traditionnel Les quelques parashygraphes (Clause 104) qui abordent la question de lutishyliteacute potentielle de relations additionnelles plus explishycites ressemblent davantage agrave une mise en garde sur la difficulteacute de lopeacuteration quagrave un encouragement agrave enrishychir le contenu du theacutesaurus

La partie 1 de la norme propose par ailleurs plusieurs directives nouvelles La clause 11 reacuteaffirme lutiliteacute de lanalyse par facettes un processus auquel on sinteacuteresse davantage aujourdhui quau moment de la reacutedaction des normes ISO 2788 et 5964 la clause syntheacutetise des eacuteleacutements dinformation disseacutemineacutes auparavant dans les clauses portant sur le deacuteveloppeshyment de la structure et la preacutesentation des donneacutees Les clauses 12 laquo Preacutesentation et affichage raquo 13 laquo Gestion (de la creacuteation agrave la mise agrave jour) raquo et 14 laquo Logiciels pour la

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 5

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 8: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Tableau 2 ISO 25964-2 Structure et contenu

ISO 25964-2 SECTION 1

5 Objectifs

6 Modegraveles structuraux pour leacutetablissement de passerelles

7 Types de laquo mapping raquo

8 Eacutequivalence

9 Hieacuterarchie

10 Association

11 Eacutequivalence exacte inexacte et partielle

12 laquo Mapping raquo et recherche dinformation

13 La preacute-coordination

14 Identification des candidats

15 Gestion et eacutechange des donneacutees

16 Affichage des donneacutees

gestion des theacutesaurus raquo ont eacuteteacute reacuteviseacutees et augmenteacutees pour rendre compte de la reacutealiteacute du contexte actuel de gestion et dexploitation des theacutesaurus Quant au modegravele de donneacutees et au scheacutema XML deacuteriveacute deacutetailleacutes agrave la clause 15 ils reacutesultent des discussions et deacutecisions dun sous-groupe de speacutecialistes membres du WG8 et dexperts externes appeleacutes en renfort Il faut souligner que bien que les deux modegraveles ne soient pas idenshytiques le modegravele de donneacutees proposeacute par ISO 25964 est compatible dans ses grandes lignes avec le modegravele SKOS (Simple Knowledge Organization System) du W3C (Miles et Bechhofer 2009) la publication et lexshyploitation sur le Web de theacutesaurus deacuteveloppeacutes dans le respect de la norme ISO 25964 devraient en ecirctre granshydement faciliteacutees Les clauses 16 agrave 18 sur les protocoles dapplication teacutemoignent de la volonteacute de preacutesenter le theacutesaurus comme composante essentielle dun systegraveme de recherche dinformation

Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires (Interoperability with other vocabularies)

La Partie 2 de la norme ISO 25964 est consacreacutee agrave leacutetablissement de passerelles (mapping) entre langages documentaires pour faciliter dune part latteinte de lobjectif dinteropeacuterabiliteacute des langages eux-mecircmes et dautre part dinteropeacuterabiliteacute sur le plan seacutemanshytique des systegravemes dinformation qui en font usage ISO 25964-2 propose des solutions fonctionnelles aux problegravemes engendreacutes par lutilisation simultaneacutee de plusieurs langages documentaires pour acceacuteder rapideshyment agrave de larges collections de ressources distribueacutees sur de multiples reacuteseaux Lexistence de passerelles entre langages documentaires permet la conversion autoshymatique de termes dindexation ou dexpressions de recherche eacutetablis agrave laide dun langage documentaire

ISO 25964-2 SECTION

17 Scheacutemas de classification

18 Plans de classement pour la gestion des documents

19 Taxinomies

20 Systegravemes de vedettes-matiegravere

21 Ontologies

22 Terminologies

23 Liste dautoriteacute des noms

24 Anneaux de synonymes

X en termes dindexation ou expressions de recherche eacutetablis agrave laide dautres langages documentaires de structure identique ou diffeacuterente

On distingue deux sous-sections dans la partie 2 de la norme (Tableau 2)

Les 16 premiegraveres clauses preacutesentent le processus de mise en eacutequivalence Les clauses 17 agrave 24 traitent de leacutetablissement de passerelles entre le theacutesaurus objet de la norme et une varieacuteteacute de langages documentaires traditionnels (theacutesaurus systegraveme de vedettes-matiegravere scheacutema de classification liste dautoriteacute des noms terminologie) ou dimplantation reacutecente (taxinomie ontologie anneau de synonymes) Lobjectif nest pas de guider le deacuteveloppement et la gestion de ces langages documentaires et le minimum dinformation offert sur leur contenu et leur structure ne sera daucune assistance aux speacutecialistes qui les connaissent deacutejagrave Les clauses 17 agrave 24 sont plutocirct reacutedigeacutees agrave lintention des professionnels dont la tacircche est de rendre interopeacuterables des langages agrave structures identiques comparables ou complegravetement diffeacuterentes et elles soulignent les caracshyteacuteristiques de chaque langage qui pourraient avoir un impact sur le processus La mise en eacutequivalence est toujours directionnelle et seul leacutetablissement dune passerelle qui part du theacutesaurus pour aller vers un autre langage est traiteacute jamais linverse Les cas et les diffishyculteacutes les plus courants sont abordeacutes les cas dexcepshytion quon sait tregraves nombreux ne sont pas preacutesenteacutes

La norme ISO 25964-2 deacutefinit le processus de mise en correspondance et son reacutesultat comme leacutetablisseshyment dune relation entre un concept repreacutesenteacute dans un langage documentaire et un ou plusieurs concepts repreacutesenteacutes dans un autre langage documentaire La relation la plus importante et la plus inteacuteressante est eacutevidemment leacutequivalence mais il peut ecirctre utile de reconnaicirctre agrave loccasion une relation hieacuterarchique ou

1 3 6 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 9: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Figure 1 Mise en eacutequivalence directe

Voc A

gt f

Voc C

)x( Voc

B

A

T

Voc D

une relation dassociation entre deux concepts comme on le fait deacutejagrave dans un theacutesaurus monolingue

Lutiliteacute des deux parties de la norme est inconshytestable mais la partie 2 est lapport le plus significatif au fonctionnement des systegravemes et agrave lefficaciteacute de la recherche dinformation Par ses directives concregravetes sur leacutetablissement de passerelles la norme ISO 25964-2 contribue agrave latteinte de lobjectif dinteropeacuterabiliteacute seacutemantique des systegravemes dinformation en facilishytant la recherche simultaneacutee dans plusieurs bases de donneacutees agrave partir dun seul et mecircme langage ainsi que laccegraves aux connaissances repreacutesenteacutees dans plusieurs langues naturelles Elle favorise aussi la deacutemocratishysation de laccegraves agrave deacutenormes reacuteservoirs de donneacutees et de ressources jusque-lagrave disponibles agrave quelques indishyvidus seulement et la fin de lisolement dans lequel ont longtemps existeacute les bases de donneacutees et les collecshytions documentaires Elle facilite enfin louverture des systegravemes dinformation agrave des usagers non professionshynels pour la recherche dabord mais eacutegalement pour la repreacutesentation des concepts et des sujets sur le Web participatif notamment

Modegraveles de mise en eacutequivalence

Lorsquil sagit de mettre en correspondance plusieurs langages de repreacutesentation et de recherche deux faccedilons de faire paraissent efficaces Dans le cas dune opeacuteration deacutetablissement de passerelles entre plusieurs langages documentaires leacutequivalence directe implique leacutetablissement de passerelles distinctes entre chaque concept repreacutesenteacute dans le langage A et ses eacutequivalents dans chacun des langages B C Dn entre chaque concept repreacutesenteacute dans le langage B et ses eacutequivalents dans chacun des langages A C Dn etc (Figure 1) Le processus est efficace et preacutecis mais coucircteux en temps et en ressources

Figure 2 Mise en eacutequivalence par commutation

Voc C

S

Voc A

A

Y

Voc B

^ N k

Voc D

La mise en eacutequivalence par commutation est plus eacuteconomique mais preacutesente le deacutesavantage de necirctre pas aussi exacte que la mise en eacutequivalence directe Lorsque ce modegravele est adopteacute chacun des concepts dun langage A est lieacute agrave un ou plusieurs eacutequivalents preacutesents dans un langage de commutation X chacun des concepts du langage B est agrave son tour lieacute agrave ses eacutequivalents dans le langage de commutation X et ainsi de suite (Figure 2) Une seule opeacuteration deacutetablissement de relations est ici requise pour chacun des langages agrave rendre interopeacuteshyrables alors que le nombre dopeacuterations de mise en relashytion neacutecessaires est eacutequivalent au nombre de langages documentaires concerneacutes dans le modegravele direct

Dans la figure 2 cest le langage B qui joue le rocircle de langage de commutation et qui permet de lier indishyrectement les langages A C et D Le langage de commushytation peut ecirctre un langage verbal un theacutesaurus ou un reacutepertoire de vedette-matiegraveres par exemple ou un langage symbolique comme un scheacutema de classificashytion On choisit comme langage de commutation celui qui eacutenumegravere deacutejagrave la totaliteacute ou agrave tout le moins le plus grand nombre des concepts repreacutesenteacutes dans tous les vocabulaires agrave reacuteconcilier Si un tel langage nest pas disponible il peut ecirctre avantageux de construire un langage de commutation

Eacutequivalence exacte et inexacte

La relation deacutequivalence entre concepts est essenshytielle agrave leacutetablissement de passerelles entre langages documentaires couvrant en totaliteacute ou en partie le mecircme domaine ISO 25964-2 reconnaicirct lexistence de deux types deacutequivalence leacutequivalence exacte et leacutequishyvalence inexacte

La creacuteation du lien deacutequivalence entre concepts repreacutesenteacutes dans des langages documentaires distincts

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2 0 1 2 | 1 3 7

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 10: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Figure 3 Exemple deacutequivalence composeacutee (par intersection)

femmes meacutedecins

peu importe que ces derniers soient de structure simishylaire ou diffeacuterente nest pas un processus aussi simple quon peut limaginer au premier abord Mecircme dans des langages documentaires qui couvrent un mecircme domaine (deux theacutesaurus dans le domaine de leacutedushycation ou encore un theacutesaurus en eacuteducation et la divishysion 370 de la Classification deacutecimale de Dewey par exemple) tous les concepts ne seront pas neacutecessairement repreacutesenteacutes et ceux qui le sont ne sont pas neacutecessaireshyment repreacutesenteacutes de la mecircme faccedilon Cest donc leacutequishyvalence inexacte qui se rencontrera le plus souvent on en trouve la description dans les clauses de la norme qui portent sur leacutequivalence dite laquo composeacutee raquo (ou encore eacutequivalence un-agrave-plusieurs) Une eacutequivalence composeacutee existe lorsquun seul concept dun langage A a deux eacutequivalents ou plus dans un langage B On distingue alors leacutequivalence par intersection (Figure 3) de leacutequishyvalence par cumul (Figure 4)

Dans lexemple de la Figure 3 le concept laquo femmes meacutedecins raquo est repreacutesenteacute sous forme preacute-coordonneacutee dans le langage documentaire A mais pas dans le langage documentaire B Pour obtenir une eacutequivalence conceptuelle il faut utiliser deux concepts constitutifs heureusement preacutesents dans le langage B (laquo femmes raquo et laquo meacutedecins raquo) agrave la jonction desquels se trouve laire seacutemantique couverte par le concept laquo femmes meacutedeshycins raquo et le terme qui le repreacutesente

Dans lexemple de la Figure 4 le concept laquo cours deau raquo du langage documentaire A ne peut ecirctre repreacuteshysenteacute de maniegravere eacutequivalente que par le cumul des significations recouvertes par les concepts distincts laquo riviegraveres raquo et laquo canaux raquo repreacutesenteacutes dans le langage documentaire B

Figure 4 Exemple deacutequivalence composeacutee (par cumul)

cours deau

Les theacutesaurus multilingues

La norme ISO 25964 accorde une attention consishydeacuterable aux questions touchant le multilinguisme et le multiculturalisme dans les systegravemes dorganisation de linformation et dans les langages documentaires Le tableau qui preacutesente les codes et symboles utiliseacutes dans un theacutesaurus par exemple eacutenumegravere deacutejagrave ceux-ci en une dizaine de langues naturelles distinctes et il est preacutevu que dautres sajouteront au fil de ladoption de la norme sur le plan international

Mais cest surtout la disparition de la norme distincte traitant des theacutesaurus multilingues (ISO 5964-1985) qui doit retenir lattention Quelques ajustements aux directives geacuteneacuterales et lajout dune clause deacutedieacutee agrave la relation deacutequivalence entre diffeacuterentes langues naturelles ont permis dinteacutegrer les particulariteacutes du theacutesaurus multilingue agrave la nouvelle norme Ces modishyfications ont ainsi permis de leacutegitimer le theacutesaurus multilingue consideacutereacute jusque-lagrave comme un langage documentaire distinct (et complexe) plutocirct que comme un type particulier de theacutesaurus dont la caracteacuterisshytique essentielle est de repreacutesenter les concepts dun domaine ou dune discipline au moyen de termes issus de diverses langues naturelles Cest agrave la clause 9 de la Partie 1 laquo Eacutequivalence entre langues naturelles raquo que sont preacutesenteacutes les quatre degreacutes deacutequivalence possibles entre repreacutesentations dun mecircme concept dans deux langues naturelles (exacte inexacte partielle non eacutequivalence) ainsi que les solutions les plus efficaces au problegraveme de non-eacutequivalence Les directives concershynant les relations hieacuterarchiques et associatives dans les theacutesaurus multilingues ainsi que laffichage des termes et de leurs relations ont eacuteteacute aiseacutement inteacutegreacutes aux clauses geacuteneacuterales de la Partie 1 qui traitent de ces sujets

On se souviendra que la norme britannique deacutecrishyvait le theacutesaurus multilingue dans la section consashycreacutee agrave linteropeacuterabiliteacute dans la norme ISO 25964 on ne seacutetonne donc pas de constater que la clause 9 de la

1 3 8 JUILLET bull SEPTEMBRE 2 0 1 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 11: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Partie 1 maintient de nombreux renvois vers la Partie 2 de la nouvelle norme

Deacutefis

Comme cest le cas pour tout projet de cette envershygure la preacuteparation de la norme ISO 25964 preacutesente plusieurs deacutefis La premiegravere cateacutegorie de difficulteacutes agrave surmonter est lieacutee agrave la gestion geacuteneacuterale du projet La langue des deacutelibeacuterations et de la reacutedaction est langlais deuxiegraveme ou mecircme troisiegraveme langue pour la majoriteacute des membres du groupe de travail il faut reconnaicirctre que cela complique la poursuite dune laquo conversation raquo productive par courrier eacutelectronique ou par teacuteleacutephone et les eacutechanges sur un site de travail collaboratif La gestion des nombreuses versions de chacun des docushyments de travail nest pas simple il arrive trop reacutegushyliegraverement que plusieurs versions annoteacutees dun mecircme document circulent simultaneacutement Il faut inteacutegrer les suggestions parfois contradictoires venant des membres du groupe de travail tous deacutetenteurs dune excellente connaissance et dune expeacuterience pratique consideacuterable dans le domaine Il faut reacuteagir aux commentaires parfois non pertinents ou inapplicables en contexte des deacuteleacutegueacutes votants de lISO la tacircche est deacutelicate sachant le temps et leacutenergie quils ont consacreacute agrave la mise en forme de suggestions qui seront eacuteventuelleshyment rejeteacutees Et tout ce travail doit ecirctre accompli dans le respect deacutecheacuteanciers serreacutes

La deuxiegraveme cateacutegorie de difficulteacutes et de deacutefis la plus importante touche au contenu mecircme de la norme lequel doit ecirctre coheacuterent et teacutemoigner clairement dun consensus Les deacutecisions quant aux termes utiliseacutes et agrave leur deacutefinition sont cruciales puisque ceux-ci seront reacuteutiliseacutes pendant plusieurs anneacutees dans les discussions et les eacutecrits des speacutecialistes et des chercheurs Une fois seacutelectionneacute et deacutefini le terme speacutecialiseacute doit toujours ecirctre utiliseacute avec la mecircme signification Il faut eacutetablir ce qui doit ecirctre conserveacute des normes ISO 2788 et ISO 5964 et ce qui ne sera pas repris dans la norme ISO 25964 Il faut constamment sinterroger sur la porteacutee de la norme et deacutevelopper en conseacutequence les eacuteleacutements de contenus approprieacutes lorsque la deacutecision a eacuteteacute prise dinteacutegrer un eacuteleacutement de contenu il faut sassurer de son insertion agrave lendroit le plus approprieacute et deacuteterminer le niveau de deacutetail neacutecessaire agrave sa compreacutehension et agrave son utilisashytion Il faut choisir et valider les exemples Il faut revenir constamment sur les questions de multilinguisme et de multiculturalisme sur lesquelles les speacutecialistes anglophones peuvent avoir des opinions divergentes de celles quexpriment leurs collegravegues allemands franccedilais canadiens belges et Scandinaves pour qui leacutegaliteacute des langues en preacutesence ne signifie pas lidentiteacute de toutes les versions linguistiques dun langage bilingue ou multilingue

Conclusion

La Partie 1 Theacutesaurus de la norme ISO 25964 a eacuteteacute approuveacutee et publieacutee en aoucirct 2011 La publication de la Partie 2 Interopeacuterabiliteacute avec les autres vocabulaires est annonceacutee pour la fin de lanneacutee 2012

Pour le deacuteveloppement la gestion et lutilisation des langages documentaires la norme ISO 25964 repreacuteshysente une combinaison fonctionnelle du traditionnel et du contemporain Soutenue par les principes eacutetablis et les conventions dicteacutees par les normes existantes elle introduit des concepts et des directives qui la rendront utilisable en environnement reacuteseauteacute

Les normes applicables agrave la gestion et de la recherche dinformation ne font pas lobjet de regravegles leacutegislatives au mecircme titre que les normes sur la seacutecushyriteacute aeacuterienne ou la mise en marcheacute de meacutedicaments par exemple et leur adoption reste deacutependante de leur qualiteacute intrinsegraveque et de la volonteacute des intervenants concerneacutes Les normes dont lapplication nest pas oblishygatoire auront davantage de chances decirctre adopteacutees si elles sont simples reacutepondent agrave un besoin reacuteel proposent des directives deacutejagrave accepteacutees par les communauteacutes de pratique peuvent sappliquer sans reacuteinvestissements majeurs notamment au plan technologique sont mises agrave disposition tregraves largement et si possible gratuitement

On doit deacuteplorer que le travail remarquable reacutealiseacute au sein des organismes nationaux et internationaux de normalisation par des dizaines de chefs de projets deacutevoueacutes et des centaines dexperts qui ne comptent pas leurs heures soit mal publicise et peu connu en dehors des cercles dinitieacutes Il est dommage que les projets et documents de travail soient proteacutegeacutes par des clauses de confidentialiteacute et de proprieacuteteacute intellectuelle tregraves strictes et que les normes elles-mecircmes soient vendues agrave des prix qui nen favorisent pas lutilisation agrave grande eacutechelle Ce modegravele de diffusion des normes deacutecrieacute reacutecemment par Lynch (2011) doit ecirctre remis en question face agrave leacuteclo-sion des normes du W3C par exemple mises agrave disposishytion tregraves largement et gratuitement

Les membres du groupe de travail TC46SC9 WG8 sont conscients que la nouvelle norme ISO 25964 ne sera pas neacutecessairement accessible agrave lensemble des institutions documentaires et des petits organismes et entreprises qui en auraient pourtant besoin pour geacuterer plus efficacement leurs collections et exploiter les reacutesershyvoirs dinformation dont ils ne sont pas proprieacutetaires Le WG8 convaincu que les langages documentaires construits ou mis en relation dans le respect de la norme ISO 25964 seront plus utiles plus adaptables et plus performants a entrepris de publiciser la norme le plus largement possible et espegravere que des modaliteacutes daccegraves mieux adapteacutees agrave ses utilisateurs potentiels en permetshytront ladoption au cours des anneacutees qui viennent reg

DOCUMENTATION ET BIBLIOTHEgraveQUES | JUILLET bull SEPTEMBRE 2012 | 1 3 9

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES

Page 12: ISO 25964 : pour le développement, la gestion et l ... · the Interoperability of Documentary Languages The context in which the ISO 25964 standard (Thesauri and Intero perability

Sources consulteacutees

Chichereau Dominique et al 2007 Les normes de conception gestion et maintenance de theacutesaurus eacutevolutions reacutecentes et perspectives Documentaliste - Sciences de Vinformation 44 (1) 66-74

Dextre Clarke Stella 2008 ISO 2788 + ISO 5964 + Much Energy = ISO 25964 Bulletin of the American Society for Information Science 35 (1) 31-33

Dextre Clarke Stella Alan Gilchrist and Leonard Will 2004 Revision and extension of theacutesaurus standards In Knowledge organization and the global information society Proceedings of the 8th International ISKO Conference 13-16 July 2004 London UK Wurzburg Ergon 215-219

Lynch Clifford A2011 The case for new economic models to support standardization efforts [Page web]Accessible agrave lthttp wwwnisoorgpublicationswhite_paperswp_lynchgt

Miles A et S Bechhofer eacuted 2009 SKOS Simple Knowledge Organshyization System Reference W3C Recommendation [Page web] lthttpwwww3orgTRskos-referencegt

Normes citeacutees

Association franccedilaise de normalisation 1981 NF Z47-100 Regravegles deacutetablissement des theacutesaurus monolingues Paris AFNOR

Association franccedilaise de normalisation 1991 NFZ47-101 Regravegles deacutetablissement des theacutesaurus multilingues Paris AFNOR

IFLA Section on Classification and Indexing Working Group on Guidelines for Multilingual ThesmriGuidelines for multilinshygual thesauri The Hague IFLA 2009 lthttparchiveiflaorg VIIs29pubsProfrepii5 pdfgt

National Information Standards Organisation 2005 Z 39-19 Guideshylines for the construction format and management of monolinshygual controlled vocabularies Baltimore MD NISO Press

Organisation internationale de normalisation 1986 ISO 2788 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus monolingues Genegraveve ISO

Organisation internationale de normalisation 1985 ISO 5964 Docushymentation Principes directeurs pour le deacuteveloppement et leacutetashyblissement de theacutesaurus multilingues Genegraveve ISO

1 4 0 JUILLET bull SEPTEMBRE 201 2 | DOCUMENTATION ET BIBLIOTHEgraveQUES