recherche d'information gabriel gallezot université de nice sophia antipolis urfist...

42
Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST [email protected]

Upload: lucette-cardon

Post on 04-Apr-2015

109 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Recherche d'Information

Gabriel GallezotUniversité de Nice Sophia Antipolis

[email protected]

Page 2: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Imaginez la situation suivante :Vous êtes actuellement chercheur dans un labo. En vue de la réalisation d'un

prochain projet, le responsable du labo vous demande :

1. De produire une bibliographie sur de le thème de l'anthropocene

2. De lui fournir sur la base de la bibliographie réalisée une dizaine de documents significatifs afin de mieux cerner ce thème.

3. De surveiller un certain nombre de sites sur ce même thème et d'être attentif à l'image de l'organisme sur le web.

4. De lui proposer un moyen simple de partager des références (liens sur textes ou sites) avec les autres membres du projet de recherche qui travaillent sur d'autres thèmes connexes.

IntroP

ull

Pu

sh

Page 3: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Plan

1. Introduction générale à la recherche d’information

2. Outils de recherche1. En Bu

2. Sur le web

3. Mon environnement de travail

4. Methode Push

Page 4: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

1Introduction générale à la recherche d’information

Page 5: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

« L’écriture nous a permis d’« externaliser » en partie notre mémoire.

L’imprimerie nous a permis de transmettre cette mémoire externe.

La Toile a diminué considérablement les coûts de transmission de l’information. 

Surtout, elle a permis à chacun d’apporter sa contribution personnelle au patrimoine collectif»

ABITEBOUL, Serge. Sciences des données : de la logique du premier ordre à la Toile. Nouvelle édition [en ligne]. Paris : Collège de France, 2012. Disponible sur Internet : <http://books.openedition.org/cdf/506>.

Page 6: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Données, informations, connaissances … et document

Une donnée est une description élémentaire, typiquement numérique pour nous, d’une réalité. C’est par exemple une observation ou une mesure.*

À partir de données collectées, de l’information est obtenue en organisant ces données, en les structurant pour en dégager du sens.*

En comprenant le sens de l’information, nous aboutissons à des connaissances, c’est-à-dire à des « faits » considérés comme vrais dans l’univers d’un locuteur, et à des « lois » (des règles logiques) de cet univers.*

"Toute connaissance mémorisée, stockée sur un support, fixée par l'écriture ou inscrite par un moyen mécanique, physique, chimique, électronique, constitue un document. [...] tant que le document est créé mais n'est pas encore utilisé par un récepteur, il reste un document virtuel. Dès lors qu'il est employé et décodé par un récepteur, le document devient réel : il a trouvé son utilisateur" ** (voir dia  : « la tridimensionnalité du document »)

*ABITEBOUL, Serge. Sciences des données : de la logique du premier ordre à la Toile. Nouvelle édition [en ligne]. Paris : Collège de France, 2012. Disponible sur Internet : <http://books.openedition.org/cdf/5 **ESTIVAL (Robert), MEYRIAT (Jean).- "La dialectique de l'écrit et du document. Un effort de synthèse".- in : Schéma et schématisation, nº14, 2e trim. 1981.- p.82-91.06>.

Page 7: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Tridimensionnalité du document

Signe ou forme

Texte ou contenu

Médium ou relation

Ou repéré

Ou compris

Ou retenu

« document = support + inscription »Document est une promesse

« contrat de lecture »

« document = objet mémoriel »

Le document est « une trace permettant d’interpréter un événement passé à partir d’un contrat de lecture… c’est une « construction sociale », le vu (la trace, l’aspect matériel), le lu (l’interprétation, la dimension intellectuelle) et le su (la dimension mémorielle de l’événement)

Pédauque R-T, Salaün J-M. Le document à la lumière du numérique. C&F Editions; 2006.

Page 8: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

L'accès à l'information

Les "techniques intellectuelles" sont des méthodes et des outils ayant la capacité de repérer et de retrouver l'information ;

Invariant ;-)

Source : C. Fauré

Page 9: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Repérage / indexation de d'information

Référents externes

Liste

Taxinomie

Thésaurus 

Ontologie (graph)

Référents internes

métadonnées

structures

Page 10: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

taxinomie / thésaurus / ontologie

Page 11: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

IndexLe principe de stockage des informations dans l'index

est celui d'un annuaire inversé :

Chaque terme est associé a une liste de documents y contenant une occurrence -> critère de rapidité de recherche

L'index stocke les informations sur les sources dans un format pivot : La richesse de ce format pivot, qui structure l'index, va être garante de la qualité de recherche.

Source : C. Fauré

Page 12: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Répères pour appréhender le Web

1991 (public) Tim Berners-Lee et Robert Cailliau

Système métastable (métaphore du rocher), distribué et ouvert

Pb du web : croissance rapide, création de désorientation du web classique => proposition d'un web sémantique (web de données) en 1994.

Autres solutions en attendant le web de données Les moteurs

Web 2.0

réseaux sociaux

API (Application Programming Interface, web services)

Page 13: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Pourquoi un moteur de recherche est-il si rapide pour chercher dans des milliards de pages ?Réponse : il ne cherche pas !

Il a déjà toutes les réponses aux requêtes qui lui sont formulées.

Source : C. Fauré

Chaque requête est une métadonnée

Page 14: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Moteur de rechercheet texte mining

Texte mining : art de générer automatiquement des métadonnées.=> plusieurs méthodes

- Recherche « plein texte » (occurrences)

- Recherche associative (statistique : les vecteurs)

- Recherche linguistique (tokenisation, lemmatisation, entity extraction)

- Recherche sémantique (structurée) : le moteur s'appuie sur des référentiels (à partir d'un référentiel métier par exemple)

Source : C. Fauré

Page 15: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Principe des moteurs

Pour trouver de l'information, certes. Mais surtout pour :

• trouver rapidement l'information

• trouver de l'information dans des sources diverses et hétérogènes

• rechercher dans des informations peu ou

faiblement structurées

Page 16: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Complémentarité des approches

Source : C. Fauré

Page 17: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Source : Info@vis

Appréhension de l’info

Page 18: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Matching : correspondance des mots-clés d’une requête avec les mots-clés représentant « le(s) document(s) résultat » (système documentaire).

Watching : une « vue » des résultats introduite par une organisation spécifique (ex. page rank, clusterisation, recommandation, etc) (monde des moteurs) et classements affinitaires personnalisés (monde des réseaux sociaux)

>>>>> la question des algorithmes et des « outils de visualisation » de l'information

Page 19: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

http

://w

ww

.dav

idga

liana

.fr/

me

dias

-soc

iaux

/info

grap

hie

-60-

seco

ndes

-sur

-le-

we

b/

Page 20: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Où chercher ?

Web visibleet Web 2.0

(web surfacique)

Web invisible(web profond)

P2P

• Contenu indexable,

• contenu taggé

• bases de données spécialisées

• Contenu dynamique

• Index partiel des sites

• Interdiction d’indexation

• Information contenue sur les ordinateurs individuels

• plusieurs millions d’ordinateurs inter-connectés

•+ 1000 Milliards dePages web ?•Forum de discussion

À partir de source : Eric Boutin

Page 21: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Usages des moteurs

Infographiclabs, 2010, GO-Gulf, 2012, Médiamétrie, 2012

93 %des internautes utilisent les moteurs de recherche pour

trouver et accéder aux sites

21 %du temps passé en

ligne est consacré à la recherche

57 %

des internautes cherchent sur le web

chaque jour

46 %des recherches concernent des

informations sur des produits

ou des services (e-commerce)

50 %du trafic d’un site vient

d’un moteur de recherche (France)

Source : A. Bouchard

Page 24: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

La personnalisation de la recherche

Personnalisation sur Google (étude A. Hannak et al., 2013)

- 12 % des résultats différents- basée surtout sur l’identification au service et sur l’adresse IP (localisation)

« L’algorithme [de Google] utilise plus de 200 paramètres pour affiner une requête. Cela inclut le PageRank du site internet, la localisation géographique de l’internaute, les liens sur lesquels il clique généralement, la façon dont il modifie ses requêtes quand il n’est pas satisfait, ainsi que son historique de recherche » (T. Vanderbilt, 2013, voir également infographie)

Page 25: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Les opérateurs(les booléens et les autres)

OR AND AND NOTFormadoct :http://guides-formadoct.ueb.eu/content.php?pid=111868&sid=842560

( )

link: site:

as_qdr=d15

filetype:

allinurl:

mais surtout de plus en plus d’interfaces à comprendre, à appréhender, à suivre, ... Exemple avec Google =>

Fonctionnalités : http://www.google.fr/intl/fr/help/features.html

Page 26: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

La Galaxie Google

- Google Trends (comparaison de termes, de sites) : http://trends.google.com

Ex : http://www.google.org/flutrends/

- Google Alerte : http://www.google.com/alerts - Google Custom Search :

http://www.google.fr/cse/ - ... http://www.google.fr/intl/fr/options/ Google Knwoledge Graph :

http://insidesearch.blogspot.fr/2012/05/introducing-knowledge-graph-things-not.html

- Attention google and your memory : http://www.onlinecolleges.net/2011/09/19/google-and-your-memory/

Page 27: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

2Les outils de recherche

1. En Bibliothèque (ex de l’UNS)2. Sur le Web

Page 28: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Ressources en BU

Catalogue et ressources électroniques

Page 29: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Exercice avec les outils de la bibliothèque

• je cherche si l'ouvrage : « Nous n'avons jamais été modernes : essai d'anthropologie symétrique » de Latour Bruno …. Est disponible dans une BU de l'université...comment faire ?

• Dans quelle(s) autre(s) BU en France l'ouvrage est-il disponible ? ... comment faire ?

• je souhaite lire l'ouvrage « Sociologie de la traduction : Textes fondateurs, de Latour, Bruno.; Callon, Michel.; Akrich, M. ? » comment faire ? Conseillez-moi.

Page 30: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

• je cherche à savoir ce qu'est le "Dreaming" pour les Aborigènes d’Australie ... comment faire ?

• je cherche un article du Courrier International intitulé : Le livre à l'ère du numérique; Attention, le livre

électronique décolle !... (13 avril 2008) comment faire ?

• savez-vous si je peux consulter les articles (full-text) des revues "Agricultural and Forest Meteorology" et "Journal of Documentation » ? (précisez)

Page 31: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Ressources sur le web

Exemples d’outils(panorama sur le web)

Page 32: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Le Web chercher des références

et les textes associés

• Le « monde de Bibliothèques » (cat. et BN)

• Les Dictionnaires et les encyclopédies (Dico & Co)

• Les Archive Ouvertes et Revues en ligne (AO & Co)

• Les outils du « web2.0 »

• Les Moteurs

• Les outils « embarqués » (extensions navigateur)

• « son » moteur

• La méthode Push (selon déroulement du cours)

Page 33: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Le « monde des bibliothèques »

Catalogues

Dédié aux thèses : http://www.theses.fr/

Worldcat http://worldcat.org/

JournalTOC : http://www.journaltocs.ac.uk/

Ne pas oublier Amazon, chapitre.com, decitre..

Bibliothèques Numérique

Gallica : http://gallica.bnf.fr/

Europeana : http://www.europeana.eu/portal/

Hathi trust : http://www.hathitrust.org/

Wikisource : http://fr.wikisource.org/wiki/Wikisource:Accueil

. Le projet Gutenberg (ebook): http://www.gutenberg.org/wiki/Main_Page

. Internet Archive (le web) : http://www.archive.org/

. Google book : http://books.google.com/

. Liste des Bibliothèques numériques : http://www.science.gouv.fr/fr/bibliotheques-numeriques/ et http://signets.bnf.fr/html/categories/c_011textes_num.html

Page 34: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Dico & Co Wikipedia : http://fr.wikipedia.org/wiki/Accueil

Scholarpedia : http://www.scholarpedia.org/

CNRTL : Centre National de Ressources Textuelles et (Morphologies, Lexicographie, Etymologie, Synonymie, Antonymie, Proxémie, Concordance) http://www.cnrtl.fr/lexicographie/ (accès à TLFI et d'autres dictionnaire)

Dicorama : http://www.dicorama.com/

Page 35: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

OA & Co HAL : http://hal.archives-ouvertes.fr/ Revues.org : http://www.revues.org/

Persee : http://www.persee.fr/web/guest/home/

OAIster (cf. Worldcat) : http://oaister.worldcat.org/

Base : http://www.base-search.net/ ISIDORE : http://www.rechercheisidore.fr/

OpenDOAR : http://www.opendoar.org/

Scientific commons http://www.scientificcommons.org/

DOAJ : http://www.doaj.org/

Page 36: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Le web2.0Recherche « verticale »

Signets : Diigo : http://www.diigo.com/, Delicious

Ref biblio : CiteUlike http://www.citeulike.org/ , LibraryThing : http://www.librarything.com, Mendeley http://www.mendeley.com …

Illustrations : Flickr http://www.flickr.com/ , youtube http://www.youtube.com/ , … :

Présentations : PPT : http://www.slideshare.net

Tweets : search de twitter et Topsy http://topsy.com/

Transversaux (avec choix) : Qwant, socialmention,...

Page 37: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Les outils de recherche du web(quelques exemples)

Moteurs « academics »● Google scholar : http://scholar.google.com ● Microsoft academics search :

http://academic.research.microsoft.com/ (voir aussi http://academic.research.microsoft.com/AcademicMap ) (ex avec UPF)

● Scirus : http://www.scirus.com ● JURN http://www.jurn.org/

...

Cf aussi dia AO & co

Page 38: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Les outils de recherche du web(quelques exemples - suite)

MétaMoteurs

Ixquick http://www.eu.ixquick.com/fra/

Clusty : http://clusty.com/

Interfaçage

SearchCube : http://search-cube.com/

Oamos : http://www.oamos.com/

Moteurs de médias

Vidéos : http://www.blinkx.com/

Images : http://www.picsearch.com/

Sur mobile phone● Google googles● Shazam, Soundhound● ...

« Verticaux » selon plateforme

• choix du « vertical » : http://socialmention.com/

• Selon les droits associés : http://search.creativecommons.org/

Moteurs inversésTineye : http://www.tineye.com/ Midomi : http://www.midomi.com

Moteur collaboratifs : Blekko

Moteur « anomysé » : Duckduckgo Moteur « vocal » : google sur chrome

Recherche dans la vidéo : Voxalead : http://voxaleadnews.labs.exalead.com/

Moteur de réponses : Wolfram|Alpha, https://www.wolframalpha.com

Page 39: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Outils “embarqués” : des extensions FireFox Tous les outils dans un menu déroulant Add to search : https://addons.mozilla.org/en-US/firefox/addon/3682

Ajout de fonctionnalités sur certain outils de recherche.

search Cloudlet : https://addons.mozilla.org/fr/firefox/addon/search-cloudlet-for-google-yah/

...

“Sur mesure” : créer son moteur de recherche (ex : LeMien)

sur google custom search (ex co-op) , équivalent de l’opérateur site: multiplié à souhait : http://www.google.com/coop/cse/

Page 40: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Exercices

1. Je dois me déplacer à l'université de Nouvelle Calédonie, indiquez-moi la(es) références bibliographique(s) des ouvrages de Bruno latour, (postérieur à 2010) que je pourrai consulter sur place.

2. Je souhaite me procurer l'article : Zalasiewicz, J., P.J. Crutzen, et W. Steffen. 2012. « Chapter 32 - The Anthropocene ». In The Geologic Time Scale, Boston: Elsevier, p. 1033-1040. Conseillez moi !

3. Je souhaite me procurer l'article : Slaughter, Richard A. 2012. « Welcome to the anthropocene ». Futures 44(2): 119-126.. Conseillez moi !

4. Sur Google, Je cherche des documents en pdf qui comportent le mot-clé « énergie » sur le site du « ministère de l'environnement ».(rédigez la requête)

5. Sur Google, comment trouver des documents qui comportent le mot clés «anthropocene» et sont datés de 2011 sur le site de l'université de Nice

6. Je cherche des images libre de droits pour illustrer mon cours sur «anthropocene »

7. Je cherche des images similaires à http://grandquebec.com/upl-files/ours_polaire.jpg

8. Quelle est la référence bibliographique originale du document comportant l'extrait suivant : […] La maîtrise de l’énergie mécanique a été le fait d’artisans et de techniciens souvent étrangers aux cercles scientifiques […]

Page 41: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

1. je souhaite lire l'ouvrage « l'origine des espèces » de C. Darwin comment faire ? Conseillez-moi.

2. Je souhaite être averti par mail des nouvelles publications de la revue dont l'ISSN est : 1869-1099 ? Conseillez-moi.

3. Quel est le titre de l’ouvrage dont l’isbn est : 9782343002538

4. Je cherche le document dont le titre est : « Conservation and social-ecological systems in the 21st century of the Anthropocene era ».

5. Je cherche l'article de la revue « Nonprofit and Voluntary Sector Quarterly » de l'éditeur « Sage journals » intitulé « Volunteerism Research A Review Essay », Conseillez-moi.

6. Je veux lire la totalité de l'ouvrage dont le titre est « The Pacific Northwest Research Station's biodiversity initiative [...] ». Conseillez-moi.

7. Je souhaite avoir un aperçu des publications de Stevan Harnad, conseillez-moi

8. Quelle est l'invention notable de Theodore Maiman ? conseillez-moi

Exercices (suite)

Page 42: Recherche d'Information Gabriel Gallezot Université de Nice Sophia Antipolis URFIST gallezot@unice.fr

Vos questions

?