Élaboration et gestion continue d'un thésaurus à la...

21
COMMISSION ECONOMIQUE POUR L'AFRIQUE (C.E.A.) Promotion de la formation pratique et théorique des professionnels et des utilisateurs de l'information Élaboration et gestion continue d'un thésaurus à la C.E.A. /ARCHIVES^ A PGI J par Jean-Marie Hubert desérie:FMFVPGI/80/107 II [S 1 1 Document à diffusion restreinte Rapport technique PP/1979-80/5/10.1/05 .- Paris, 1 980

Upload: dinhthuan

Post on 15-Sep-2018

214 views

Category:

Documents


0 download

TRANSCRIPT

COMMISSION ECONOMIQUE POUR L'AFRIQUE (C.E.A.) Promotion de la formation pratique et théorique des professionnels et des utilisateurs de l'information

Élaboration et gestion continue d'un thésaurus à la C . E . A .

/ARCHIVES^

A PGI J

par Jean-Marie Hubert

N° desérie:FMFVPGI/80/107

II [S 1

1

Document à diffusion restreinte Rapport technique PP/1979 -80 /5 /10 .1 /05 .-

Paris, 1 9 8 0

COMMISSION ECONOMIQUE POUR AFRIQUE (CEA)!

ELABORATION ET GESTION CONTINUE D'UN THESAURUS A LA CEA ¡

par Jean-Marie Hubert

Rapport établi à 1'intention de la Commission économique pour Afrique (CE.A.) par l'Organisation des Nations Unies pour l'éducation, la science et la culture (Unesco)

U N E S C O

Rapport technique PP/1979-80/5/10.1/05 FMR/PGI/80/107(Hubert) le 31 mars 1980

© Unesco 1980 Printed in France

SOMMAIRE

Page

A . INTRODUCTION 1

B . GENERATION ET GESTION D U THESAURUS DE L A CEA 2

(a) Les instruments de travail proposés pour l ' indexation 3

(i) La macrothésaurus de l ' O C D E

(ii) Le thésaurus de la bibliothèque informatisée de 1 'Unesco

(iii) Autres documents de référence

(b) Fonds documentaire de la CEA et capacité de traitement 5

(i) Phase préparatoire

(ii) Phase opérationnelle

(c) Méthodologie de génération et de gestion du thésaurus de la CEA 7

(i) Utilisation du macrothésaurus de l'OCDE, du thésaurus Unesco et des autres documents de référence

(ii) Méthode d'indexation et génération du lexique

C. DISPOSITIONS PRATIQUES ET PLAN DE TRAVAIL 10

(a) Formation préparatoire des indexeurs 11

(b) Mise en place du système 11

(c) Préparation du premier index de la CEA 12

CONCLUSIONS ET RECOMMANDATIONS 14

iE. PROPOSITIONS BUDGETAIRES 14

ANNEXES

1. RECRUTEMENT DE L'EQUIPE DES INDEXEURS DE LA CEA 1 6

2. SIGLES UTILISES DANS LE RAPPORT 1 7

A. INTRODUCTION

1. Cette mission s'inscrit dans le cadre du rapport DEVSIS-AFRIQUE consacré à la mise en place d'un système panafricain de documentation et d'information

à la CEA/ . Elle s'applique directement au "Consultant chargé d'adapter le macro­thésaurus de l'OCDE aux besoins africains" (p. 114, par. 3 du rapport DEVSIS-AFRIQUE) et indirectement à 1'"Elaboration de l'édition pilote de DEVINDEX-AFRIQUE (p. 111). Le système documentaire informatisé comportera :

- Une banque de données numériques (Statistiques socio-économiques tenues à jour).

- Une base de données bibliographiques.

2. Parallèlement à cette mission, quatre autres experts avaient été réunis par le secrétariat de la:CEA au cours de la période du 13 au 30 novembre 1979.

(a) Base de données bibliographiques :

- Mme J. Forestier, bibliothécaire à 1'Unesco, chargée de la formation et de la définition des bordereaux d'entrée de documents. Une colla­boration étroite s'est établie avec Mme Forestier, notamment sur le plan du recrutement des indexeurs. Les deux rapports d'experts sont complémentai res.

- Mme Hassani-Salzman, chargée des problèmes d'arabisation et de l'intro­duction de la langue arabe dans le système informatisé.

(b) Banque de données numériques :

- M. Divoy, statisticien à l'INSEE (Paris)

- M. Milelli, Sciences humaines (CNRS, Paris)

Le responsable du projet à la CEA a procédé le 13 novembre, à un briefing du groupe d'experts et a réuni ensuite les chefs de division de la Commission pour des exposés et des échanges où ont été notamment exprimés les besoins documentaires dans les disciplines de la CEA : statistiques, transport et communications, administration publique, population, sciences et technologie - ressources natu­relles, commerce, planification économique, industrie, bibliothèque...

Les termes de référence, précisés*par le Programme général d'information de 1'Unesco indiquaient : une collaboration avec l'équipe d'indexeurs constituée par la CEA pour une adaptation du macrothésaurus de l'OCDE au contexte africain, l'examen des documents sélectionnés pour l'extraction de mots clés et la prépa­ration d'un plan de travail devant être poursuivi par l'équipe d'indexeurs.

4. En fait, le macrothésaurus de l'OCDE, seul document de base prévu pour « l'élaboration du langage documentaire, a été associé au thésaurus de la

bibliothèque de 1'Unesco, mieux adapté au développement social. D'autres lexiques et thésaurus ont été également recommandés dans un souci de compatibilité avec les centres de documentation informatisés opérationnels en Afrique.

1. Commission économique des Nations Unies pour l'Afrique & Centre de recherches pour le développement international (Canada). - DEVSIS-AFRIQUE, un système panafricain de documentation et d'information pour le développement social et économique. - (Rapport du groupe de spécialistes). Organisation des Nations Unies, 1 vol. in 4°, 253 p. (1979).

- 2 -

5. Le secrétariat de la CEA avait justement estimé que le recrutement des indexeurs devait se faire à partir de tests établis par les experts. Le

recrutement a donc été effectué au début de la mission sur 23 candidats, avec la collaboration de Mme Forestier. Trois indexeurs anglophones et trois indexeurs francophones ont été proposés après correction des épreuves et consultation des dossiers (Annexe 1).

Comme l'équipe d'indexeurs ne devait être engagée qu'au début de janvier 1980, le travail du consultant a consisté :

- à proposer une méthodologie pour la création et la gestion continue du thésaurus de la CEA (applicable par l'équipe d'indexeurs dès janvier 1980).

- à établir un plan de travail sur 6 mois (janvier-juin 1980) pour le traite­ment des 800 documents sélectionnés par la CEA.

- à chiffrer les coûts approximatifs de l'opération.

6. Au cours de cette mission, le système documentaire informatisé MINISIS, développé par le CRDI, a été adopté par les responsables CEA du projet et

un mini-ordinateur HEWLETT-PACKARD HP 3000 a été commandé pour être installé en février 1980/1.

Les opérations de thésaurus et de traitement documentaire devront être menées de pair avec l'installation du système informatique.

B. GENERATION ET GESTION DU THESAURUS DE LA CEA

7. Le système informatique documentaire choisi devra être autant que possible compatible avec les systèmes internationaux et les systèmes automatisés des

centres nationaux et régionaux de l'Afrique et des pays en développement.

Cette compatibilité est en effet une condition nécessaire :

- à l'accès aux bases de données existantes et aux réseaux d'IST en cours de création en Afrique.

- à l'échange et au traitement des Informations scientifiques et techniques (1ST) extérieures enregistrées sur bandes magnétiques.

- pour favoriser l'extension et la diffusion du système documentaire de la CEA en Afrique.

8. La compatibilité s'applique en premier lieu à l'élaboration d'un langage documentaire commun qui servira d'instrument de travail au système infor­

matisé. Les échanges d'informations seront d'autant plus aisés et étendus que le langage utilisé sera plus universel.

1. DANELIUK, F.A. - Information retrieval and Library Management : An interactive Minicomputer System. IDRC (Ottawa), Brochure in 8°, 16 p. 1978 (IDRC-TS 14e).

--3 -

(a) Les instruments de travail proposés pour l'indexation.

(i) Le macrothésaurus de l'OCDE.

Sur le plan du développement économique et social, une liste commune de descripteurs, publiée en 1969 par l'OCDE, suivie d'un macrothésaurus édité en 1973 et réédité en 1979, font autorité auprès d'importants centres de documen­tation informatisés. Publié en anglais, français et espagnol par l'OCDE, des organisations spécialisées dans les pays en développement ont édité des versions espagnole, brésilienne, portugaise, arabe, iranienne et indonésienne. La couver­ture linguistique du macrothésaurus de l'OCDE apparaît donc particulièrement large. Cet outil de travail a été adopté dans son intégralité pour le traitement de l'in­formation par des organisations internationales telles que l'OCDE, le BIT (Genève), le CRDI (Ottawa) et d'autres organisations nationales et internationales qui ont le développement pour objectif.

Dans le cadre spécifique des pays en développement, la liste commune des descrip­teurs OCDE a été largement exploitée, lors de la création du centre de documenta­tion informatisé de la FAO. A partir de 1968, la FAO a mis en place des centres nationaux et régionaux de documentation en Afrique et en Amérique du Sud qui ont appliqué les programmes et la méthodologie de son centre de documentation. La liste commune des descripteurs de l'OCDE et le. mâcrothésaurus ont servi de noyau aux lexiques des systèmes documentaires du CND, Maroc, de l'OMVS, du CNDST à Dakar (Sénégal), du Centre régional de la CFN, du CNDES, Algérie, du CNDA de Tunisie, CNA du Zaïre, de l'ADRAO et du CND du Brésil

- l'édition à se procurer est :

Macrothésaurus de l'OCDE New English Edition, Paris 1978, 438 p. Nouvelle édition française, Paris 1979, 434 p.

La nouvelle édition en langue arabe devait être publiée au Caire par l'IDCAS en janvier 1980.

Chaque indexeur devra disposer d'un exemplaire dans sa langue de travail et l'expérience montre que quelques exemplaires sont nécessaires en réserve :

3 exemplaires en anglais pour 3 indexeurs + 2 en réserve. 3 exemplaires en français pour 3 indexeurs + 2 en réserve. 3 exemplaires en arabe pour 3 indexeurs + 2 en réserve.

Le travail courant des indexeurs exige une consultation permanente de la liste alphabétique des termes du macrothésaurus (Unités lexicales substantives simples, adjectivales et composées, classées par ordre alphabétique).

C'est pourquoi, l'index permuté (KWOC-INDEX) du macrothésaurus, qui répond à cette exigence de travail devrait être extrait et reproduit séparément :

p. 319 à 434 de l'édition française p. 320 à 438 de l'édition anglaise

Cette liste de termes étant d'un grand usage et sujette à de nombreuses annota­tions, il faudrait prévoir un tirage en xérocopie de 10 exemplaires en anglais et 10 exemplaires en français à répartir entre les indexeurs.

- 4 -

(ii) Le thésaurus de la bibliothèque informatisée de l'Unesco

Ce thésaurus a été réalisé en association étroite avec l'OCDE et s'est déve­loppé dans des domaines complémentaires utiles à la CEA (formation, éducation, sociologie...). Il devrait être utilisé au même titre que le macrothésaurus de l'OCDE par l'équipe d'indexeurs.

C'est essentiellement la liste permutée (KWOC-INDEX) de ce thésaurus qu'il serait utile de mettre à leur disposition dans l'immédiat :

- 10 exemplaires en langue anglaise sont à reproduire en xérocopie

- 10 exemplaires en langue française sont également à reproduire, dès que l'édition en langue française prévue début 1980 sera disponible.

En résumé les documents de base à fournir à l'équipe d'indexeurs avant le 1er janvier 1980, date prévue pour le démarrage du projet sont :

- Macrothésaurus OCDE : 5 exemplaires en français et 10 listes permutées 5 exemplaires en anglais et 10 listes permutées

- Thésaurus Unesco : 5 exemplaires en anglais et 10 listes permutées.

En janvier 1980, dès leur sortie de presse :

- Macrothésaurus OCDE : 5 exemplaires en arabe et 10 listes permutées

- Thésaurus Unesco 5 exemplaires en français et 10 listes permutées.

Ces deux instruments de travail sont spécialement destinés aux indexeurs pour la réalisation des premières listes de termes destinées à l'indexation des documents de la CEA.

(iii) Autres documents de référence

Le macrothésaurus de l'OCDE et le thésaurus de l'Unesco garantissent une compatibilité du langage documentaire sur un plan international. Mais de nombreux termes spécifiques, nécessaires à l'indexation ne seront pas trouvés dans ces deux documents de travail. L'introduction de nouveaux termes en cours de l'indexation posera au spécialiste chargé de la gestion du thésaurus le problème de leur vali­dité et de leur contrôle. Le contrôle des termes à introduire dans le système se fera à partir de thésaurus spécialisés et d'autres lexiques utilisés en Afrique.

Les principaux documents de contrôle à se procurer sont :

- MAKNAZ (Thésaurus du système de documentation scientifique et technique du Centre national de documentation du Maroc) : Dictionnaire alphabétique inversé (décembre 1977) .

Ce thésaurus a l'avantage de couvrir un grand nombre de domaines et d'être la première compilation de termes en Afrique destinée à une exploitation en ordinateur.

- 5 -

- Lexique du Centre national de documentation de l'OMVS St. Louis, Sénégal. (Lexique spécialisé en agriculture et aménagements hydrauliques).

- Vocabulaire permuté du Centre national de documentation économique et social (CNDES) d'Alger. (Agriculture, économie, problèmes sociaux)

- Vocabulaire de l'Association pour le développement de la riziculture en Afrique de 1'Ouest (ADRAO), Monrovia (Agriculture et riziculture)

- Vocabulaire du Centre national de documentation agricole (CNDA) de Tunis

- Vocabulaire du Centre de documentation agricole (CDA) du Zaïre Kinshasa

- SMUH (Secrétariat des Missions d'urbanisme et d'habitat) Volume 1 - Thésaurus English - French Volume 1 - Thésaurus Français - Anglais Volume 2 - Tableaux de catégories PARIS, SMUH, 1975.

- Vocabulaire FAO (Anglais - Français - Espagnol)

- ISO. Norme internationale. - Documentation - Principes directeurs pour l'établissement et le développement de thésaurus monolingues. - (Guidelines for the establishement and development of monolingual thesauri). - 14 p. : ISO 2788-1974.

Cette liste d'ouvrages de référence est indicative. Elle pourrait être complétée au cours de la gestion du Thésaurus de la CEA par d'autres documents : SPINES, Dictionnaires multilingues d'agriculture et autres domaines.

(b) Fonds documentaire de la CEA et capacité de traitement

(i) Phase préparatoire

Ce fonds documentaire est destiné à alimenter le système. Un lot représentatif et expérimental de 800 documents a été soigneusement sélectionné par les services de la CEA pour la formation des indexeurs, la génération du thésaurus et la mise en place du système informatique adopté.

A la fin de cette première phase, le système fournira ses premiers produits : Index et autres sorties ordinateur.

Le système, bilingue au départ (anglais et français) sera complété dès que possible par la langue arabe. Le principe envisagé par les responsables de la CEA est de fournir un catalogage et un résumé en anglais, en français, puis en arabe pour chaque document retenu, quelle que soit la langue originale de publication :

- Les indexeurs de langue anglaise traiteront les documents originaux en anglais et transmettront leur travail pour "traduction" en français.

- Les indexeurs de langue française traiteront les documents originaux en français et transmettront leur travail pour "traduction" en anglais.

- Les indexeurs de langue arabe traiteront les documents originaux en arabe et "traduiront" dans leur langue les indexations soit à partir de l'anglais, soit à partir du français.'

- 6 -

Dans ces conditions, un travail comparable sera demandé à chaque indexeur de 1'équipe.

La capacité de traitement peut être théoriquement évaluée de la manière suivante au cours de la phase préparatoire :

(Thésaurus CEA, formation et mise en place du système)

- 2 groupes linguistiques au cours de la phase préparatoire - 3 indexeurs par groupe linguistique - 3 analyses/jour par indexeur (en moyenne pour les 6 premiers mois) - soit 9 documents/jour traités dans les 2 langues, puis dans les 3 langues

du système. - (Le système prévoit que chaque document donnera lieu à une indexation en

anglais, une indexation en français et une indexation en arabe. 9 documents x 20 (jours) x 6 (mois) = 1080 documents.

La période de formation des indexeurs peut être théoriquement évaluée à 6 mois. Au cours de cette phase, un lot de 1080 documents aura été catalogué et indexé et si le système informatique a été parallèlement mis en place, un premier index pourra être publié au terme de cette phase préparatoire (janvier - juin 1980).

(ii) Phase opérationnelle

L'indexation de 5 documents/jour peut être exigée des indexeurs en phase opérationnelle. Soit 15 indexations/jour en anglais, français et arabe par l'équipe des 9 indexeurs du centre de traitement documentaire (3 par groupe linguistique).

Ce système pourra donc absorber régulièrement :

15 indexations/jour x 20 (jours) x 10 mois = 3.000 documents/an

C'est sur cette base de 3.000 documents/an qu'il conviendra d'alimenter le système.

La CEA distingue deux étapes dans le traitement des documents destinés à sa base de données bibliographiques :

Ire Etape ; Documents intérieurs à la CEA

- Traitement de la documentation rétrospective sélectionnée :

2.000 documents

- Traitement de la documentation courante sélectionnée :

5.000 documents

Ces 2.500 documents pourront être théoriquement traités en moins d'un an à partir de la phase opérationnelle :

juillet 1980 - mars 1981

Compte- tenu du traitement de la documentation courante (500 documents par an), 2.500 documents sont à collecter par an pour alimenter le système à partir d'avril 1980.

- 7 -

Ces documents pourront être extraits :

1.. Du dépouillement des périodiques traitant des problèmes de l'Afrique reçus à la bibliothèque de la CEA

2. Des documents non conventionnels de la CEA

3. Des documents collectés en Afrique par les services de la CEA (documents conventionnels et non conventionnels).

Une unité documentaire a été prévue dans chacune des divisions de la CEA où le responsable est notamment chargé de prospecter les sources documentaires et de collecter les documents sur place et à l'extérieur.

Il faut souligner qu'une collecte de 3.000 documents/an est nécessaire pour garantir le bon fonctionnement du système. Mais si cette collecte venait à dépasser les 3.000 documents l'équipe d'indexeurs devrait être augmentée en conséquence.

(c) Méthodologie de génération et de gestion du thésaurus de la CEA

(i) Utilisation du macrothésaurus de l'OCDE, du thésaurus Unesco et des autres documents de référence.

- L'élaboration d'un langage documentaire exige au départ un travail et un temps considérables car tous les termes significatifs extraits du contexte pour la rédaction des résumés devront être contrôlés, c'est-à-dire comparés terme à terme avec ceux des thésaurus et lexiques de référence. L'intro­duction de termes est massive au début de la génération du lexique et se réduit au fur et à mesure que le travail d'indexation progresse. On peut considérer qu'après trois ans, l'introduction de nouveaux termes se réduira à quelques dizaines par an.

- Le macrothésaurus de l'OCDE sera l'outil de travail principal. Constitué de "macrotermes" il ne permettra pas de réaliser une indexation fine. En second lieu, ce document a été élaboré dans le cadre des pays industrialisés euro­péens et n'est pas toujours adapté aux problèmes spécifiques des pays en développement.

C'est pourquoi, le macrothésaurus de l'OCDE ne constitue qu'un "noyau" dans les lexiques et thésaurus des systèmes documentaires développés en Afrique.

Compte tenu de ces réserves, le macrothésaurus de l'OCDE devrait être utilisé avec une certaine liberté et avec critique comme source de termes, de même que le thésaurus de la bibliothèque de l'Unesco, et les lexiques utilisés par les centres de documentation informatisés en Afrique.

Cette technique de travail garantit un maximum de compatibilité avec les autres langages documentaires et permet un développement du langage élaboré à la CEA dans un cadre spécialement adapté à l'Afrique.

(ii) Méthode d'indexation et génération du lexique

Les services de la CEA ont sélectionné un lot de 800 documents qui servira de matériel documentaire :

- à là formation des indexeurs

- au démarrage du thésaurus'

- à la publication d'un premier'index

- 8 -

Tous ces documents ont été résumés sur fiches en langue anglaise qui pourront aider les indexeurs au cours de leur travail.

- Extraction des mots significatifs (mots clés) du document à indexer

- Les indexeurs identifieront les sujets traités dans le document et rédigeront une liste de termes significatifs (profil). Les termes retenus doivent être nécessairement une source importante d'infor­mations dans le texte. Il faut éviter le piège de mots significatifs simplement cités et non développés dans le document.

Cette première opération consistera à extraire les mots significatifs du titre du document, puis des paragraphes et, en s'aidant du sommaire, de la conclusion et éventuellement du résumé.

- La seconde opération consistera, par une lecture rapide du document, à contrôler la pertinence des mots retenus au cours de la première opération et à les complé­ter par d'autres mots significatifs en évitant la perte d'information.

- La liste finale de mots clés sera organisée en phrases simples utilisant un minimum de termes de liaison et mots vides non significatifs.

La forme du résumé pourra être définie avec précision au cours du travail et en recueillant les avis des utilisateurs futurs du système :

- Titre amélioré

- Analyse plus ou moins approfondie du document

- Longueur du résumé

- Présence de descripteurs de groupe (Grands domaines traités dans le document).

- "Traduction" des indexations et des résumés

- Lorsque l'indexeur aura réalisé son profil de termes significatifs, il relèvera au cours du contrôle et en même temps la traduction de ces termes dans les autres langues du système. Cette traduction est donnée dans les thésaurus multilingues sous chacun des termes dans la partie alphabétique.

- Il transmettra ensuite ce profil, ainsi que son résumé à l'indexeur de l'autre langue qui réalisera un résumé traduit avec les termes d'indexation de sa langue et à l'aide de mots outils et de liaison dans sa langue de travail.

- Les termes non trouvés dans les deux thésaurus de référence et proposés pour être introduits ne seront pris en compte dans les profils qu'après avoir suivi les dispositions particulières prises plus loin dans le texte. Il sera donc nécessaire de revenir périodiquement sur ces résumés chaque fois qu'une liste de mots "acceptés pour être introduits" sera établie.

- Cette opération de "traduction" doit être effectuée par les indexeurs et non par les traducteurs.

- Etablissement de listes de termes contrôlés

Après chaque résumé, l'indexeur procédera au contrôle des mots clés utilisés en vérifiant-leur présence dans :

- La liste alphabétique permutée du macrothësaurus OCDE.

- La liste permutée du thésaurus de la bibliothèque Unesco.

- 9 -

Les cas suivants peuvent se présenter :

- Le mot existe dans la liste permutée OCDE : L'indexeur établira progressivement une liste séparée de ces termes.

- Le mot existe dans la liste permutée Unesco : L'indexeur établira progressivement une liste séparée de ces termes.

- Le mot n'existe pas dans les deux listes permutées qui utilisent un terme équivalent (synonyme).

Ex. : Afrique de l'ouest, retenu par l'indexeur et Afrique occidentale dans le macrothésaurus OCDE Trafic routier et Circulation routière

Dans ce cas, l'indexeur choisira toujours le synonyme des listes permutées OCDE . et Unes_cO!, corrigera son résumé et portera ce terme sur une des listes manuscrites/ .

- Le mot utilisé n'existe pas dans les listes permutées de référence et il n'existe aucun synonyme. Dans ce cas, l'indexeur portera le terme sur une liste séparée de "mots à introduire".

- Après une période d'indexation à définir selon un rythme ¡optimal de travail, les listes établies par les indexeurs seront rassemblées et soumises à un spécialiste :

- Les listes de termes extraits du macrothésaurus OCDE seront fusion­nées (élimination des mots doubles) et une fiche manuelle sera établie portant la mention OCDE et le numéro du terme.

- Même opération pour les termes extraits du thésaurus Unesco.

- Les listes de termes "à introduire" seront traitées par le spécialiste :

- Contrôle de la présence du terme dans d'autres lexiques utilisés en Afrique.

- Si le terme n'est pas trouvé, son adoption sera proposée au cours d'une réunion des indexeurs et consultation de spécia­listes du domaine. Au cours de cette réunion, les relations avec d'autres termes seront établies en commun pour la structuration future de ces listes. On prendra pour modèle la structuration adoptée dans le macrothésaurus de l'OCDE.'

- L'utilisation de synonymes ou la suppression de termes donneront lieu à des corrections dans les•résumés.

Un fichier manuel, par ordre alphabétique sera tenu à jour et constitué par les mots rencontrés dans les listes permutées et par les mots introduits, de manière à permettre un pointage constant par les indexeurs de chaque groupe linguistique

1. Cet exemple illustre bien le rôle des langages documentaires normalisés. Si l'indexeur n'avait effectué aucun contrôle et conservé ses propres termes Afrique de l'ouest et, trafic routier, une interrogation avec ces mots clés, des bases de données utilisant les thésaurus OCDE et Unesco ne donnera aucune réponse.

- 10 -

(un fichier de termes anglais, un fichier de termes français et un fichier de termes arabes).

Cette méthode de travail a pour objectif de familiariser les indexeurs avec l'utilisation des deux thésaurus de base et à choisir les termes équivalents rencontrés dans des instruments de travail. Les indexeurs assimileront ainsi progressivement le langage documentaire de la CEA et procéderont à des indexa­tions et à des pointages de plus en plus rapides.

- Le contrôle systématique des termes utilisés se fera en deux temps :

- au niveau des indexeurs qui effectueront un pointage avec les deux listes de base (OCDE et Unesco) et au niveau du documentaliste qui procédera à des pointages supplémentaires des mots à introduire sur les listes uti­lisées par les autres systèmes documentaires informatisés en Afrique.

- Ce contrôle de vocabulaire garantit une compatibilité de langages, indispensable à l'interrogation de bandes magnétiques en provenance de bases de données extérieures.

- Le lexique de la CEA se constituera et se développera par la gestion continue des termes retenus au cours du travail des indexeurs.

- Dès la mise en place du système informatique, la CEA devra se procurer les programmes de création et de gestion du thésaurus OCDE soit auprès de l'OCDE, soit auprès d'une organisation internationale qui exploite ces programmes (CRDI).

- Bordereaux d'entrée du thésaurus

- Bordereaux de suppression et de correction

- Bordereaux d'introduction de nouveaux termes.

L'entrée du lexique pourrait se faire à la fin de la période de formation des indexeurs après traitement d'un millier de documents (avril - mai 1980) et en adoptant la structure du macrothésaurus de l'OCDE considérée comme modèle.

En raison de l'expérience acquise au cours de cette période, le documentaliste pourra juger de l'opportunité d'une entrée plus massive de termes (termes non encore rencontrés mais probablement nécessaires à la poursuite de l'indexation).

Il pourra également juger s'il est plus rentable d'entrer intégralement le macro­thésaurus de l'OCDE comme c'est le cas-au CRDI en procédant à des suppressions et introductions ou s'il est profitable d'entrer progressivement les listes de termes établies en cours d'indexation.

Au moment de l'entrée du lexique en mémoire, il sera nécessaire de prévoir le concours d'un personnel supplémentaire pour la rédaction des bordereaux si le lexique est entré en ordinateur par cartes perforées (ou d'opérateurs sur clavier à écran).

C. DISPOSITIONS PRATIQUES ET PLAN DE TRAVAIL

9. La CEA dispose à Addis-Abetia de conditions très favorables à la mise en place d'un projet d'automatisation documentaire. Le démarrage de ce projet pourrait

donc se faire très rapidement.

- 11 -

Les conditions favorables sont :

- Existence de locaux fonctionnels pour la formation du personnel et la mise en place du système documentaire.

- Equipe de trois indexeurs anglophones et de trois indexeurs francophones d'excel­lent niveau, à former mais déjà recrutés.

- Lot de 800 documents sélectionnés à la CEA et sources potentielles importantes de documents à traiter.

- Modalités de collaboration étroite (à définir) avec l'équipe d'indexeurs de l'ILCA à Addis-Abeba qui utilise un système d'indexation analogue.

- Choix du système documentaire informatisé MINISIS, développé par le CRDI pour exploitation en mini-ordinateur à partir des programmes CDS/ISIS de l'UNISIST. Ce système est en cours d'application et de développement en Afrique.

- Commande par la CEA d'un [mini-ordinateur HP 3000 _( Hewlett-Packard) pour le traitement des programmes CRDI. L'installation de l'appareil est prévue en février 1980.

Le plan de travail prévoit une formation préparatoire des indexeurs recrutés fin novembre 1979 au cours du premier trimestre 1980 et le recrutement d'un expert à partir d'avril 1980.

(a) Formation préparatoire des indexeurs

L'équipe d'indexeurs de la CEA pourra être formée sur place, à 1'ILCA, après un accord entre les responsables.

Cet accord pourrait prévoir la formation par roulement de deux indexeurs renouvelés chaque semaine (1 indexeur anglophone et un indexeur francophone).

Les deux indexeurs de la CEA, ¡s'intégreraient dans l'équipe des indexeurs de l'ILCA en travaillant sur les documents de la CEA et en appliquant la méthodologie d'indexation proposée.

Cette période de formation ne devrait pas dépasser trois mois /(janvier - mars 1980), au cours desquels seront rassemblées les listes de termes OCDE, Unesco et mots à introduire pour le thésaurus de la CEA.

Le catalogage appliqué par les indexeurs sera celui défini dans le rapport de Mme J. Forestier, bibliothécaire de 1'Unesco, inspiré du Bordereau AGRIS et adapté aux besoins de la CEA.

(b) Mise en place du système

Les matériaux accumulés pour l'élaboration du thésaurus de la CEA ne pourront être exploités que par un documentaliste familiarisé avec les systèmes informatisés.

- 12 -

(c) Préparation du premier index de la CEA

Dans le programme de trjavail prévu, une période de six mois est néces­saire pour mener de pair la formation des indexeurs et le traitement des documents sélectionnés par la CEA.

Un index de 800 à 1000 documents pourrait donc être sorti de l'ordinateur fin juin 1980 si une excellente coordination et un planning rigoureux étaient établis entre :

- La mise en place de l'ordinateur (février 1980)

- Les essais de programmes thésaurus et index

- L'entrée en mémoire du lexique correspondant aux documents indexés

- L'entrée en mémoire des documents puis leur traitement par programme.

->

- 13 -

ELABORATION ET GESTION CONTINUE D'UN ' THESAURUS A LA CEA (CALENDRIER DES TRAVAUX)

A C T I V I T E S

- METHODOLOGIE : Création et Gestion continue, du Thésaurus CEA

- Recrutement des indexeurs

- Formation préparatoire des indexeurs (ILCA)

- Recrutement Expert P3/F4 (Thésaurus/Formation/Contrôle des indexations/Index)

- Formation approfondie des indexeurs

- Mise en place- du système informatique

- Essais programme Thésaurus

- Perforation du Thésaurus (recrutement d'un personnel temporaire)

- Entrée du Thésaurus en mémoire

- Essais des programmes index

- Entrée des documents en machine (Ecran ou perfo)

- Listings index

- Corrections.

— Traitement de la; documentation rétrospective (2e Index)

- Traitement de la documentation courante (1er Index courant)

1979 1980

N . D . J . F . . M . A . . M . J . J . A . . S . . O . N . D .

- 14 -

D. CONCLUSIONS ET RECOMMANDATIONS

10. Ce rapport a essentiellement pour but de fournir des éléments de travail et de servir de guide à l'équipe de 6 indexeurs recrutés en novembre 1979 à la

CEA) .

- Les principales recommandations touchent à la formation et au traitement simul­tanés d'un lot de 800 documents (pouvant être complétés à 1.000) au cours d'une période de 6 mois (janvier - juin 1980).

- Formation préparatoire à l'ILCA de l'équipe d'indexeurs en appliquant la métho­dologie d'indexation proposée et en utilisant le macrothésaurus de l'OCDE,et le thésaurus de 1'Unesco comme instruments de travail.

- Recrutement d'un expert de niveau P3/P4 à partir d'avril 1980 qui sera chargé des tâches suivantes :

- Elaboration et gestion continue du thésaurus : fusion et contrôle des listes de termes - choix des mots à introduire avec le concours de spécialistes dans les domaines spécifiques.

- Formation plus approfondie des indexeurs après la phase de formation prépa­ratoire précédente.

- Correction des résumés et du catalogage.

- Correction des bordereaux thésaurus et des listings.

- Correction des documents entrés pour l'index sur listing.

L'expert devra essentiellement assumer un rôle de formation (indexeurs et personnel affecté aux bordereaux thésaurus), de contrôle (thésaurus), de corrections et d'une manière générale de coordination pour tous les travaux appliqués au thésaurus.

Un tel service ne pourra être assuré que par un expert recruté à temps complet pour un an, du mois d'avril 1980 au mois de mai 1981.

- La formation des indexeurs, la génération du thésaurus de la CEA et le trai­tement docajmentaire sont trois opérations conduites simultanément. La sortie d'un index sur ordinateur devrait être le résultat de ce travail après une période de six mois.

- Le mandat de l'expert se limitant à l'opération thésaurus, la réalisation et le contrôle de l'index seront plus spécialement du ressort de l'expert recruté qui consultera pour plus de détails le document DEVSIS-AFRIQUE (page 1 de ce rapport), ainsi que le rapport de Mme J. Forestier pour la définition du catalogage.

E. PROPOSITIONS BUDGETAIRES

12. Le rapport du groupe de spécialistes DEVSIS-AFRIQUE recommande page 13, chapitre IV (recommandations soumises aux organisations internationales et

aux organismes donateurs) :

"2. L'Unesco est invitée à fournir toute l'aide possible au développement de DEVSIS-AFRIQUE, qui se fonde sur le cadre conceptuel de son programme

UNISIST et qui constitue le premier effort d'organisation et de coopération bénévole entre des systèmes d'information nationaux à l'échelle du continent dans le domaine du développement économique*. "

- 15 -

Cette aide de 1'Unesco pourrait se concrétiser, dans le cadre de ce projet en recrutant un expert pour une durée de un an, à partir du mois d'avril 1980. (Eventuellement renouvelable).

Il est en effet apparu que la création d'un thésaurus et sa gestion continue à la CEA, la formation approfondie des indexeurs, le contrôle de l'entrée des documents en mémoire ne pouvaient être assurés par des missions périodiques d'expert. Seul un expert sur place, à temps complet, peut mener à bien cette tâche.

- Dans ces conditions les sommes prévues pour des missions périodiques pourraient être affectées à cet expert et complétées.

- Les dépenses relatives à cette opération devraient aussi comprendre une somme consacrée à l'achat de documents de travail, nécessaires à la gestion continue du thésaurus.

SECTION DE LA DOCUMENTATION INFORMATISEE

Avril-décembre 1980 1981

- DOCUMENTALISTE chargé de la gestion P3/P4 33.375 44.500 continue du thésaurus, de la formation et du contrôle du traitement documentaire

- Achat de documents de travail (lexiques, thésaurus, dictionnaires... 1.500

TOTAL ¡i 34.875 44.500

TOTAL $ 79.375

13. La participation à la CEA s'appliquant à cette opération couvrirait :

- Le chef de la section

- Six puis neuf indexeurs/analystes

- Deux opérateurs de clavier

- Un secrétaire

- Traitement informatique

- (Thésaurus et traitement des documents)

- Index

- 16 -

ANNEXE 1

RECRUTEMENT DE L'EQUIPE DES INDEXEURS DE LA CEA

L'équipe des indexeurs n'avait pas été recrutée par la CEA avant l'arrivée des experts comme les termes du contrat le prévoyaient pour les raisons suivantes :

- La sélection du personnel, ne pouvait être bien conduite qu'à partir d'un début de formation et de tests établis par des experts documentalistes.

- L'indexation des documents avec l'équipe constituée ne pouvait commencer qu'après- la mise au point d'une méthodologie pour la création et la gestion du thésaurus de la CEA.

Toutes les dispositions avaient été prises sur le plan administratif pour procéder à cette sélection et 23 candidats, membres du personnel de la Commission ont été convoqués. Un second recrutement a été prévu ultérieurement pour compléter, s'il y a lieu, l'équipe d'indexeurs par du personnel extérieur à la CEA.

Mise au point des tests

Deux tests ont été soumis, après un court exposé destiné à sensibiliser le personnel au traitement moderne de l'information.

- Un test de Qualité où les candidats devaient résumer un document de la CEA sans limitation de temps. Le texte du résumé ne devait pas dépasser une page.

- Un test Qualité/Vitesse où les candidats devaient résumer un document d'une cinquantaine de pages de la CEA en 1 h 30.

Sélection des candidats

Le premier test a permis d'éliminer 5 candidats et de présélectionner 12 candidats classés en deux groupes (bons et moyens).

Les épreuves du second test Qualité/Vitesse, ont été corrigées selon le principe de la double correction séparée par les deux experts de cette mission : Mme J. Forestier (formation) et M. J.-M. Hubert (thésaurus).

Les examinateurs ont comparé ensuite leur sélection respective et ont proposé le recrutement d'une équipe de six indexeurs composée de trois anglo­phones et de trois francophones. (Cf. texte du mémo remis au directeur de ce projet).

- 17 -

ANNEXE 2

SIGLES UTILISES DANS LE RAPPORT

ADRAO - Association pour le développement de la riziculture en Afrique de l'Ouest

BIT - Bureau international du travail

CDS - Système de documentation informatisé

CEA - Commission économique des Nations Unies pour l'Afrique

CFN - Commission du fleuve Niger

CNA - Centre national agricole (Zaire)

CND - Centre national de documentation

CNDA - Centre national de documentation agricole (Tunisie)

CNDES - Centre national de documentation économique et sociale (Algérie)

CNDST - Centre national de documentation scientifique et technique (Sénégal)

CNRS - Centre national de la recherche scientifique (France)

CRDI - Centre de recherches pour le développement international (Canada)

DEVINDEX - Index sur le développement

DEVSIS - Système d'information pour les sciences du développement

FAO - Organisation des Nations Unies pour l'alimentation et l'agriculture (Rome)

IDCAS - Centre de développement industriel pour les pays arabes (Le Caire)

ILCA - Centre international de l'élevage pour l'Afrique (Addis-Abéba)

INSEE - Institut national de la statistique et des études économiques (France)

1ST - Information scientifique et technique

KWOC - Keyword out of context

MINISIS - Ensemble intégré de systèmes d'information adapté au mini-ordinateur

OCDE - Organisation de coopération et de développement économiques (Paris)

OMVS - Organisation pour la mise en valeur du fleuve Sénégal

Unesco - Organisation des Nations Unies pour l'éducation, la science et la culture (Paris)

UNISIST - Système d'information mondial pour la science et la technique