7 – la recherche fédérée 7.1 – objectifs 7.2 – les connecteurs disponibles

79
-Projet FSP 2002-70 – SIST Système d’information scientifique et technique 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles 7.3 – La sélection des sources 7.4 – Sources à accès protégé 7.5 – Les sites Web à indexer 7.6 – Le tri par pertinence 7.7 – L’exportation des données 7 – La Recherche Fédérée

Upload: devin

Post on 22-Jan-2016

29 views

Category:

Documents


0 download

DESCRIPTION

7 – La Recherche Fédérée. 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles 7.3 – La sélection des sources 7.4 – Sources à accès protégé 7.5 – Les sites Web à indexer 7.6 – Le tri par pertinence 7.7 – L’exportation des données. 7 – La Recherche Fédérée. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

7 – La Recherche Fédérée7.1 – Objectifs

7.2 – Les connecteurs disponibles7.3 – La sélection des sources7.4 – Sources à accès protégé7.5 – Les sites Web à indexer

7.6 – Le tri par pertinence7.7 – L’exportation des données

7 – La Recherche Fédérée

Page 2: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

7 – La Recherche Fédérée

Page 3: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Rappels de quelques objectifs du SIST

• Le SIST est un système de valorisation des fonds scientifiques existants dans les pays où il est installé

• Le SIST facilite l’accès aux bases de données internationales des partenaires

• Le SIST est un outil simple et pragmatique• Le SIST est un système de référencement rapide de l’IST et

non un système de stockage• Le SIST est évolutif et doit pouvoir prendre en compte

rapidement l’évolution de la production scientifique nationale

• Le SIST traite l’IST au sens large : universalité et multi thèmes

7 – La Recherche Fédérée

7.1 - Objectifs

Un dispositif original

Page 4: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

La réponse technique : le module de recherche fédérée

Un méta moteur de recherche en IST

• Traiter n’importe quelle forme de source IST quelle que soit sa nature, son type et son format

• Une interface extrêmement simple qui s’apparente à celle de « Google »

• Une homogénéisation des résultats• L’affichage de méta données mais la possibilité d’accéder à la

totalité de l’information• Des temps de réponse courts• Une grande souplesse d’administration qui autorise le rajout

simple de nouvelles sources à interroger

Une réponse originale

7 – La Recherche Fédérée

7.1 - Objectifs

Page 5: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

SISTPays A

Organisme B

Agence E Université CCentre de

recherche D

Bibliothèque F

Institution A

SISTPays B

Site Web

Site Web

Base données

Base données

Base données

Base données

Texte intégral

Texte intégral

Base données

Module Recherche Fédérée

Base données en

ligneSite Web Texte

intégralSIST

?

Résultat n

Résultat 1

Résultat 2

Lien source originale

Connecteurs

Méta données Question

Le module de Recherche Fédérée

Base données

Archive ouverte

Archive ouverte

Base donnéesBase

données

Base données

7 – La Recherche Fédérée

7.1 - Objectifs

Page 6: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Une utilisation simple

• L’utilisateur rentre ses critères de recherche, un ou plusieurs mots séparés par des espaces

• L’utilisateur sélectionne les sources d’information qu’il souhaite interroger simultanément

• Il peut préciser le nombre de résultats par page qu’il souhaite visualiser• Il lance la recherche• Aussitôt qu’une source répond, le module de recherche fédérée affiche les

premiers résultats• Les résultats sont affichés de manière homogène sous une forme « Titre, auteur,

date, description et liens »• L’utilisateur peut cliquer sur le résultat qui l’intéresse et il accède directement à

la source des données sur le site qui est propriétaire de cette information• Lorsqu’il revient sur le SIST, les résultats des autres sources qui ont répondues

entre temps sont affichés• Il peut alors parcourir les différentes pages de résultats et suivre les liens vers les

sources originelles

Principes de fonctionnement

7 – La Recherche Fédérée

7.1 - Objectifs

Page 7: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Principes de fonctionnement

7 – La Recherche Fédérée

7.1 - Objectifs

Page 8: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Un connecteur par type de source de données

Actuellement le SIST V2 est doté des connecteurs

suivants :

• A - Bases de données en ligne• B - Sites Web scientifiques• C - Réservoirs de texte intégral• D - Répertoires de documents• E - Archives ouvertes (OAI)• F - Bases de données MySQL (locales ou distantes)• G - Autres dispositifs SIST• H - Sources « partenaires »

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 9: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

A - Bases de données en ligneQuoi ?• Toute ressource accessible sur le WEB qui dispose d’un formulaire

d’interrogation (bases de données, annuaire, bibliothèque ….)• Plus largement, toute ressource qui se trouve sur le Web et qui peut être

retrouvée et affichée via un formulaire Web

Comment ?• L’interrogation se passe en simulant l’action d’un utilisateur sur le formulaire• Les données récupérées sont retraitées et affichées dans le format standard

utilisé par le SIST (RSS)

Remarques : • Certains formulaires spécifiques (produits propriétaires) ne sont pas

raccordables au SIST via ce connecteur.• Les bases de données interrogeables peuvent aussi être celles gérées en

central par le SIST (catalogues, annuaires…)

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 10: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

B - Sites Web scientifiques

Quoi ?

• Tout site Web à vocation scientifique dont les contenus auront été jugés pertinents pour le SIST

Comment ? • Exactement comme un moteur de recherche de type google ou Yahoo• Les sites Web désignés dans le SIST sont balayés périodiquement par un

moteur d’indexation qui garde trace des mots clés contenus dans les pages

Remarques : • Ne pas indexer à outrance pour limiter le bruit. Raisonner le choix des

sites qui sont indexés.• La profondeur d’indexation est paramétrable

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 11: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

C - Réservoirs de texte intégral

Quoi ?• Tout logiciel accessible via le Web disposant d’une interface Web,

disposant d’un moteur d’indexation et capable de restituer un accès en ligne sur les documents

Comment ?• Comme pour un formulaire Web, le SIST simule les actions que ferait

un Internaute sur l’interface Web, puis il reformate dans le format standard (RSS) les résultats

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 12: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

D - Répertoires de documents

Quoi ?• Tout emplacement local au SIST ou accessible par une URL qui contient

des documents dans la plupart des formats classiques (Word, PDF, Excel …)

Comment ?• Les contenus de ces documents sont alors indexés périodiquement par

le SIST • Les mots clés repéré par le SIST sont utilisés lors de la recherche

fédérée

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 13: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

E - Archives ouvertes

Quoi ?• Tout entrepôt (institution) qui obéit à la norme OAI (qui utilise un

logiciel de gestion d’archive ouverte

Comment ?• Les notices contenues dans ces entrepôts sont lues périodiquement par

le SIST qui constitue des index.• Lors de la recherche fédérée, le SIST interroge ces index• Lors d’une consultation de résultat, le SIST affiche la notice à la norme

OAI et propose un lien sur la notice originelle directement sur le site propriétaire

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 14: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

F - Bases de données MySQL

Quoi ?• Toute base de données structurées de type MySQL locale au serveur du

SIST ou accessible via le réseau

Comment ?• Le SIST se connecte à la base de données MySQL désignée• Il parcours alors toutes les rubriques à la recherche du critère de

sélection• Lors d’une consultation de résultat, le SIST affiche la fiche signalétique

de l’enregistrement concerné, puis permet un accès à toutes les information de l’enregistrement dans la base.

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 15: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

G - Autres dispositifs SIST

Quoi ?• Tous les SIST nationaux possèdent un point d’entrée qui permet de

traiter une interrogation provenant d’un autre SIST

Comment ? • Les critères de recherche envoyés par le SIST appelant sont alors

transmis à l’ensemble des ressources sélectionnées par défaut sur le SIST appelé.

• Le SIST appelé effectue la recherche, met en forme les résultats et les transmet au SIST appelant

Remarque : • Chaque SIST national peut, par ce biais là, se comporter comme un

SIST central. En effet, il peut lancer une interrogation sur l’ensemble des sources accessibles par les SIST.

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 16: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

H - Sources partenairesQuoi ?

• Dans le cadre de conventions liées au projets SIST, les partenaires peuvent réaliser des accès spécifiques « SIST » à leurs ressources.

• Il s’agit d’attribuer un point d’entrée spécifique au SIST et de retourner le résultat de la recherche directement sous le format utilisé par le SIST (RSS)

Comment ? • Le SIST dialogue directement avec le serveur du partenaire• Ces accès sont plus rapides et fiables que les connexions normales et

surtout ils permettent généralement une plus grande précision dans la recherche

• Le partenaire garde la maîtrise de l’interrogation, c’est lui qui décide du périmètre d’action du SIST sur son système

Remarque : • Nous tendons progressivement à généraliser ces accès auprès des

partenaires du projet.

Ressources interrogeables

7 – La Recherche Fédérée

7.2 – Les connecteurs disponibles

Page 17: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

LA SELECTION DES SOURCES

Quatre possibilités pour sélectionner les sources à interroger :

• Valeurs par défautVous ne faite rien, l’interrogation portera sur un jeu de sources

sélectionnées par défaut

• Sélection manuelleVous cochez ou décochez les sources à votre grès

• Sélection par groupesVous disposez de quatre critères pour sélectionner automatiquement les

sources

• Sélection programméeLe lien qui appelle le moteur de recherche fédéré peut porter la liste des

sources qui doivent être cochées

La sélection des sources

7 – La Recherche Fédérée

7.3 – La sélection des sources

Page 18: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

La Sélection par groupes

• Sélection par PaysLes sources sont identifiées à un pays ou à une région du monde

• Sélection par ThèmesChaque source est associé à un thème principal lorsque cela est possible.

• Sélection par CatégorieLa sélection peut se faire selon le type de connecteur utilisé pour accéder à

la source

• Sélection par TypeLes sources peuvent être classées par type (annuaire, base documentaire,

base projet …)

Remarque : le choix des valeurs pour les listes des Pays, Thèmes, et Types sont à la discrétion des administrateurs

La sélection par groupe

7 – La Recherche Fédérée

7.3 – La sélection des sources

Page 19: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

La sélection par groupe

7 – La Recherche Fédérée

7.3 – La sélection des sources

Page 20: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Les sources à accès controlé

• Certaines sources peuvent posséder des restriction d’accès (sources commerciales, sources nationales, sources privées mises à disposition d’une certaine communauté de scientifiques ….

• Le SIST dispose d’un mécanisme qui permet de protéger par un mot de passe l’accès à la source

• Une fois ce mot de passe saisi au niveau du moteur de recherche, la ou les sources protégées apparaissent dans le moteur de recherche, le temps de la session de l’utilisateur

Source et mot de passe

7 – La Recherche Fédérée

7.4 – Les sources à accès controlé

Page 21: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Source et mot de passe

7 – La Recherche Fédérée

7.4 – Les sources à accès controlé

Page 22: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Source et mot de passe

7 – La Recherche Fédérée

7.4 – Les sources à accès controlé

Page 23: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Les Sites Web à Indexer

• Le SIST intègre un moteur d’indexation qui peut fonctionner comme les moteur de recherche disponibles sur le Web (Google, yahoo …)

• Cela permet d’intégrer dans les recherches l’analyse des contenus de pages Web accessibles sur des sites Web identifiés

• Il suffit d’indiquer au SIST les URL des sites sélectionnés pour figurer dans le périmètre de la recherche fédérée

• Périodiquement le SIST va parcourir et indexer les pages de ces sites et rendre les index interrogeables par la recherche fédérée

Périmètre d’indexation

7 – La Recherche Fédérée

7.5 – Les sites Web à indexer

Page 24: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Périmètre d’indexation

7 – La Recherche Fédérée

7.5 – Les sites Web à indexer

Page 25: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Le tri par pertinenceOption retenue par le SIST pour la recherche fédérée : aussitôt qu’une

source répond, ses résultats sont immédiatement affichés

Avantages :• Les temps de réponse du SIST ne sont pas calés sur le temps de

réponse de la source la plus lente à répondre• L’utilisateur peut commencer à consulter les premiers résultats en

quelques secondes

Inconvénient :• Les résultats récupérés à la volée ne peuvent pas être triés par

pertinence

Solution :• Un tri par pertinence est possible une fois que tous les résultats sont

arrivés• Il s’agit d’un algorithme classique qui pondère emplacement et fusion

des critères de recherche dans le résultat obtenu

Tri post-recherche

7 – La Recherche Fédérée

7.6 – Le tri par pertinence

Page 26: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

L’exportation des données

• L’utilisateur une fois la recherche terminée à la possibilité de récupérer les résultats sur son poste de travail dans les outils bureautiques

• Les résultats de la recherche sont exportables dans les formats suivants

– Traitement de texte (RTF)– Tableur (CSV)– Abode (PDF)– Actualités Web (RSS)

Récupération des résultats

7 – La Recherche Fédérée

7.7 – L’exportation des données

Page 27: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Récupération des résultats

7 – La Recherche Fédérée

7.7 – L’exportation des données

Page 28: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Avantages du dispositif de recherche fédérée

• Une seule question pour couvrir un large panel de ressources• Rapide « aussitôt répondu, aussitôt affiché »• Croise toutes sortes de formes d’IST • Ne se préoccupe pas des formats de données• Nouvelles sources facilement connectables • Possibilité de créer de nouveaux connecteurs (adaptabilité)• Respecte la propriété des données• Pas d’intervention nécessaire chez le propriétaire de la source

7 – La Recherche Fédérée

Synthèse

Page 29: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Synthèse

Inconvénients

• Pas de tri par pertinence immédiat• Du bruit possible (recherche plein texte)• Doublons possibles (malgré algorithme de dé doublonnage)• Fragilité potentielle des connecteurs « Bases de données en

ligne »

7 – La Recherche Fédérée

inconvénients

Page 30: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Synthèse

Manipulations

• Recherche globale sur la problématique des feux de brousse

• Limiter cette recherche aux contenus des sites Web de nos partenaires

• Recentrer cette recherche uniquement sur les bases de données documentaires

7 – La Recherche Fédérée

inconvénients

Page 31: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

8 – Les archives ouvertes

Page 32: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

Les Archives ouvertes (Open Archives)

• Archives ouvertes (Open Archives) : mouvement lancé en 1999 par l'initiative dite de Budapest en vue de fédérer les banques informatisées d'archives d'articles scienfitiques de façon à ce qu'elles puissent être interrogées en une seule requête quelle que soit leur localisation sur le réseau mondial. Des protocoles d'échanges de données ont été définis quant à la description et à l'interrogation des données.

• Ce mouvement s'est développé en réaction contre l'appropriation par des revues scientifiques prestigieuses de l'information scientifique, essentiellement dans les domaines scientifiques, techniques et biomédicaux. Il est en effet absurde que les universités paient des coûts exorbitants pour avoir accès (licences électroniques) aux publications résultant des recherches qu'elles ont elle-mêmes financées.

• Cependant, l'acceptation d'un article par le comité scientifique de ces revues représente une valeur ajoutée extrêmement importante - ce qu'on appelle la validation par les pairs (peer review) - ainsi que la reconnaissance de la communauté scientifique.

• Il ne s'agit donc pas d'avoir d'un côté des bases d'archives ouvertes complètement libres et gratuites et d'un autre côté des revues scientifiques très prestigieuses et très coûteuses, mais bien plutôt de rééquilibrer et d'harmoniser la diffusion de l'information scientifique en définissant de nouvelles modalités éditoriales, où les responsabilités de chacun soient mieux définies et partagées.

• Cette problématique ne concerne pas seulement la publication de la recherche et sa diffusion, mais aussi sa mise à disposition à long terme (archives pérennes).

Généralités

Page 33: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

Les Archives ouvertes : Quelques exemples

• @chivesic du CNRS http://archivesic.ccsd.cnrs.fr/

• Pubmed central http://www.pubmedcentral.nih.gov/

• Hal SHS http://halshs.ccsd.cnrs.fr/

• Revue.org http://oai.revues.org/

• AJOL http://www.ajol.info/

Exemples

Page 34: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

Les Archives ouvertes et le SIST

• Le SIST encourage l’utilisation ou la mise en place d’Archives ouvertes en Afrique (préconisations à venir)

• Le SIST intègre un moissonneur d’entrepôts à la norme OAI • Les pays déterminent la liste des entrepôts OAI à surveiller• Le moissonneur SIST récupère automatiquement la première fois

l’ensemble des notices (méta données) des entrepôts• Il récupère ensuite périodiquement les nouvelles notices créées dans

les entrepôts • Il propose une interface pour l’interrogation structurée des notices

moissonnées• Il intègre automatiquement l’interrogation « plein texte » des notices

moissonnées dans le moteur de recherche fédérée

OAI et SIST

Page 35: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

La gestion des entrepôts d’archives ouvertes

• Les pays doivent identifier les entrepôts de données à la norme OAI qu’ils souhaitent exploiter dans le SIST

• Il suffit alors de rentrer l’URL de ces entrepôts dans l’interface d’administration du SIST

• Il faut alors lancer le moissonnage des premières notices• Le SIST va surveiller périodiquement les mouvements de

données des entrepôts et tenir automatiquement à jour des index sur les notices OAI

• Chaque Internaute à la possibilité de suggérer une nouvelle archive ouverte à l’administrateur du SIST national

Le choix des entrepôts

Page 36: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

Le choix des entrepôts

Page 37: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

L’interrogation des d’archives ouvertes

• Les archives ouvertes peuvent être interrogées en mode « Recherche simple » (un critère qui sera recherché dans l’ensemble des rubriques)

• Il existe un mode « Recherche avancée » qui permet de combiner plusieurs critères sur les rubriques des notices

• Le moteur de recherche fédérée du SIST opère une « recherche simple » lorsque la source « Archives ouvertes » est sélectionnée dans la liste des sources interrogeables

L’interrogation

Page 38: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

La recherche simple

Page 39: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

La recherche avancée

Page 40: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

La consultation des archives

• Il est possible de consulter la notice du résultat à la norme OAI (lien « Voir la notice »)

• Il est aussi possible de consulter directement sur le site propriétaire la notice originale

(lien « Voir l’original »)

La consultation

Page 41: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

8 – Les archives ouvertes

Consultation de la notice OAI

Page 42: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

9 – L’actualité scientifique en ligne

9 – L’actualité scientifique en ligne

Page 43: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

9 – L’actualité scientifique en ligne

Page 44: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Objectifs :

• Tenir informer régulièrement les scientifiques sur l’actualité propre à des thèmes identifiés

Contraintes :

• Le scientifique a rarement le temps de surfer sur le Web

• Il n’est pas toujours possible de dédier une personne à la recherche d’information

• L’information n’a de valeur que si elle est fraîche

• L’information n’a de valeur que durant une période courte

La réponse du SIST :

• un agrégateur de fils RSS

9 – L’actualité scientifique en ligne

Agrégateur de fils RSS

Page 45: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Fils RSS et syndication• Le terme RSS (Really Simple Syndication)désigne une

convention de structuration des fichiers garantissant qu’ils puissent être diffusés dans un format compréhensible par le plus grand nombre (on parle de "syndication de contenu").

• Il s’agit d’un fichier texte particulier dont le contenu est produit automatiquement (sauf cas exceptionnels) en fonction des mises à jour d’un site Web.

• Ce contenu est laissé au libre choix du producteur du flux, mais très généralement se compose des titres des mises à jour (par exemple : "nouvelle promotion"), des liens hypertextes correspondants, et de descriptions, en quelques lignes, de ces mises à jour (par exemple : "Prix sacrifiés sur la mémoire

pendant trois jours. Profitez-en").

9 – L’actualité scientifique en ligne

La syndication de contenus

Page 46: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

SIST et syndication• Le dispositif SIST est capable de gérer les fils RSS

• Il contrôle périodiquement les mises à jour de ces fichiers et il sait les afficher de manière conviviale

• Il suffit juste d’indiquer au SIST le lien sur le fichier syndiqué

• Pour trouver des sites Web qui fournissent des fils RSS vous pouvez consulter les adresses suivantes :

http://www.lamoooche.fr/http://www.retronimo.com/annuaire-rss.phphttp://www.rssfeeds.com/http://www.syndic8.com/

9 – L’actualité scientifique en ligne

SIST et syndication de contenus

Page 47: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

SIST et syndication• Il faut identifier les thèmes prioritaires en fonction des

besoins du pays où le SIST est implanté.

• Il faut repérer les fils RSS qui peuvent apporter une actualité pertinente sur ces thèmes

• Ces thèmes sont alors mis sous forme de rubriques dans la partie « Poste de travail>S’informer>Actualité scientifique

• Chaque thème devient un agrégateur de fils RSS qui se charge de récolter l’actualité scientifique du jour et de la présenter de manière conviviale

• En général, chaque actualité contient un lien vers l’article complet

9 – L’actualité scientifique en ligne

SIST et syndication

Page 48: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

9 – L’actualité scientifique en ligne

Page 49: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Actualité scientifique

Thème 2 Thème 3

Site Web A

Fils RSS Fils RSS Fils RSS

Thème 1

Site Web A

Site Web ASite Web A

Site Web A

Actualité 1

Actualité 2

Actualité 3

Actualité 1 Actualité 1

Actualité 2

9 – L’actualité scientifique en ligne

SIST et syndication de contenus

Page 50: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

10 – Les bases de données locales

Page 51: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

SIST et MySQL• Le SIST dispose pour ses propres besoins d’un

gestionnaire de bases de données (MySQL)

• Ce gestionnaire peut être utilisé pour créer et gérer n’importe quelle base de donnée structurée

• Le SIST propose une interface qui permet de rendre interrogeable sur le Web les bases de données ainsi crée

• Deux interfaces sont proposées : une recherche simple et une recherche avancée

• Les bases MySQL connectées à cette interface peuvent aussi être prises en compte par les recherches fédérées du moteur SIST au même titre qu’une source classique

10 – Les bases de données locales

Généralités

Page 52: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

SIST et MySQL• En fait toute base de données MySQL accessible via la

réseau peut être rendue interrogeable via le SIST

• Il suffit de préciser une fois :

• Les rubriques à interroger

• Les rubrique à afficher

• Les liens entre les tables si nécessaire

• La correspondance avec le format standard (RSS) utilisé par le SIST pour homogénéiser les résultats des recherches

• Une fois se travail effectué, une interface d’interrogation est créée automatiquement

10 – Les bases de données locales

Connexion d’une source

Page 53: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

10 – Les bases de données locales

Connexion d’une source

Page 54: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

10 – Les bases de données locales

Sélection d’une base MySQL

Page 55: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

10 – Les bases de données locales

Interrogation simple

Page 56: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

10 – Les bases de données locales

Interrogation avancée

Page 57: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

10 – Les bases de données locales

Consultation d’une fiche

Page 58: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

11 – La diffusion sélective d’information

8 – Les forum de discussion

Page 59: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

La Diffusion sélective d’information

Pour diverses raisons, le scientifique n’a parfois plus l’opportunité de se connecter quotidiennement sur le SIST

• Charge de travail ne permettant plus un travail de veille• Qualité des infrastructures de télécommunication ne

permettant pas une connexion permanente ou régulière

Une nouvelle étape : apporter l’information au scientifique

• Mettre en place un premier niveau de veille documentaire• Proposer une solution asynchrone de diffusion d’information

via les réseaux

11 – La diffusion sélective d’information

Problème

Page 60: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

La Diffusion sélective d’information

• Un système d’abonnement qui permet de construire un profil personnalisé

• L’enregistrement d’équations de recherche (couple : critères de recherche + sources à interroger)

• La sélection de sites Web syndiqués (producteurs d’actualités scientifiques)

• Un interrogation automatique du moteur de recherche fédérée et des sites Web sélectionnés à une fréquence choisie par l’abonné

• Les résultats transmis directement dans la boite au lettres de l’abonnée et/ou sous la forme de fils RSS (alimentation de sites Web)

11 – La diffusion sélective d’information

Principe

Page 61: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

11 – La diffusion sélective d’information

L’abonnement

Page 62: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

11 – La diffusion sélective d’information

Le résultat (extrait)

Page 63: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

12 – Les forum de discussions

12 – Les forum de discussion

Page 64: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

12 – Les forum de discussion

Page 65: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Les listes de discussion

Objectifs :

• Offrir des espaces d’expression sur des sujets déterminés• Permettre aux chercheurs d’échanger sur des

thématiques communes

Contraintes :

• Simplicité d’utilisation• Le chercheur veut pouvoir être informé par mail lorsque

une réponse à un sujet est postée• Le chercheur veut pouvoir proposer un nouveau sujet et

créer un nouveau forum

12 – Les forum de discussion

Page 66: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Manipulation

Manipulations :

• Créer un nouveau sujet de forum• Intervention sur un sujet• Répondre à un message

12 – Les forum de discussion

Page 67: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

13 – Les Wiki

13 – Les Wiki

Page 68: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

13 – Les Wiki

Les Wiki

• un des outils en vogue du travail collaboratif

• forme d’outil approprié à la construction de contenus de type encyclopédique (travaux de recherche)

• convient aussi à la rédaction en ligne de mode d’emploi ou de mode opératoire.

•Exemple célèbre de Wiki : WIKIPEDIAhttp://fr.wikipedia.org/

Page 69: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

13 – Les Wiki

Les Wiki

•Un mini site Web ouvert à tous, ou chacun peut venir rajouter sa parcelle d’information

•Chaque page peut être complétée ou modifiée, d’autres pages liées peuvent être créées à loisir par les Internautes

•Il peut être créée autant de Wiki que nécessaire dans le SIST (Wiki thématiques)

•Les Wiki disposent d’une syntaxe propre (deux MaJuscules dans un mot pour créer un lien vers une nouvelle page)

Page 70: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

13 – Les Wiki

Page 71: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

14 – L’espace de travail collaboratif

14 – L’espace de travail collaboratif

Page 72: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

14 – L’espace de travail collaboratif

Page 73: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Objectifs :

• Le partage des compétences au-delà des barrières géographiques devient une priorité pour la Recherche

• Les scientifiques doivent pouvoir bénéficier des NTIC

• L’efficacité et la rapidité des projets ou des réseaux d’expertise passe par l’utilisation d’un espace de travail collaboratif

Contraintes : • Mise en œuvre rapide, peu de temps d’apprentissage, pas de

langage informatique

• Hébergement des sites

• Maintenance et évolution du site le temps du projet

• Besoins vites complexes (tous les outils sont utiles)

14 – L’espace de travail collaboratif

Pourquoi un espace collaboratif

Page 74: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Ce qu’offre le SIST

• Un espace informatique dédié à une équipe projet le temps du projet

• Un générateur de mini-sites Web qui permet la construction de pages HTML élaborées sans aucune connaissance informatique

• Une boite à outil permettant, entre autre, la création de Forum de discussion, les sondages, la publication en ligne d’article, les workflow, la syndication de sites, la recherche fédérée, la création de bibliothèque électronique …

• L’accès à des ressources multiples mises à disposition par les partenaires

14 – L’espace de travail collaboratif

SIST et espace collaboratif

Page 75: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Une plate forme de travail collaboratif personnalisable pour

• Présenter le projet sur Internet

• Afficher sur le Web les travaux et résultats de recherche

• Constituer une bibliothèque électronique du projet

• Constituer un centre de ressources (actualités thématique en ligne, recherche fédérée sur des sources identifiées, forum de discussion, sondages, annuaire d’experts …)

• Gérer le projet (planning, agenda …)

• Échanger (publication en ligne avec workflow de validation)

• Contribuer au SIST (création de bases de données interrogeables par le SIST)

14 – L’espace de travail collaboratif

Plate forme de travail collaboratif

Page 76: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Manipulation :

Dans l’espace de travail collaboratif, chaque formateur va créer un ou plusieurs articles :

• Du texte,

• Des liens,

• Un Forum,

• Etc …

14 – L’espace de travail collaboratif

Manipulations

Page 77: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

15 – Discussion, synthèse et suggestions

15 – Discussion, synthèse

Page 78: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

15 – Discussion, synthèse

Les outils du SIST, récapitulatif

Un méta moteur de recherche fédéréeUn moissonneur d’entrepôt d’archive Ouvertes

InstitutionnellesUn moteur d’indexation de sites Web et de documentsUn requêteur Web de bases de données structurées

Un agrégateur de fils RSS (actualités Web)Un diffuseur sélectif d’information

Des gabarits automatisés pour la création de pages WebDes listes de discussions (Forum)

Des Wiki …

L’accès à une palette très large d’information scientifique et technique

Page 79: 7 – La Recherche Fédérée 7.1 – Objectifs 7.2 – Les connecteurs disponibles

-Projet FSP 2002-70 – SIST Système d’information scientifique et technique

Des questions ?

Des questions ?

Prototype : sist-prototype.sist-sciencesdev.netSite du projet : www.sist-sciencesdev.net

[email protected] [email protected]

[email protected]@cirad.fr