rechercher de l'information sur le web

51
La recherche d'information sur le web Isabelle Motte Licence Creative Commons (by-nc-sa) Dernière mise à jour : 29/10/10

Upload: motte-isabelle

Post on 17-Jan-2015

3.346 views

Category:

Education


3 download

DESCRIPTION

Avez-vous une idée du fonctionnement de Google ou de Wikipédia ? Pouvez-vous évaluer la fiabilité d'un contenu sur le web ? Savez-vous comment citer les ressources web dans un travail ? Autant de questions qui trouveront réponse au cours de ce séminaire animé par Isabelle Motte ...

TRANSCRIPT

Page 1: Rechercher de l'information sur le web

La recherche d'information sur le web

Isabelle Motte

Licence Creative Commons (by-nc-sa)

Dernière mise à jour : 29/10/10

Page 2: Rechercher de l'information sur le web

Quand je dois faire une recherche documentaire,la première chose que je fais, c'est ...

aller à la bibliothèqueJ

faire une recherche sur internetB

discuter du sujet avec un spécialisteV

me procurer des travaux de l'an passéR

(Interaction avec les participants à l'aide de cartons de couleur)

Page 3: Rechercher de l'information sur le web

Pour obtenir des résultats fiables, il vaut mieux utiliser ...

WikipédiaJ

GoogleB

le moteur de recherche de la bibliothèque

V

YahooR

Page 4: Rechercher de l'information sur le web

Je n'ai jamais utilisé les outils suivants :

WikipédiaJ

GoogleB

le moteur de recherche de la BUMPV

YahooR

Page 5: Rechercher de l'information sur le web

Une grande partie du web est dite « invisible » ...

• Les meilleurs moteurs de recherche indexent moins de 20% du web;

• Tous les types de fichiers ne sont pas indexés et les pages dynamiques et les bases de données sont difficilement indexées.

Page 6: Rechercher de l'information sur le web

Les outils de recherche

• Les moteurs : pour une recherche précise• Les annuaires : pour une recherche large• Les métamoteurs : pour dégrossir rapidement• Les encyclopédies : pour des informations

permanentes et sûres• Les bases de données spécialisées : pour des

informations validées dans un domaine précis

Page 7: Rechercher de l'information sur le web

Web Search Strategies in Plain English

Page 8: Rechercher de l'information sur le web

Les moteurs : pour une recherche précise

• Les moteurs de recherche indexent régulièrement des millions de pages web dans une base de données à l’aide de robots qui inventorient et ajoutent les nouvelles pages;

• Chaque robot fonctionne à sa manière et ils peuvent donc produire des résultats très différents selon l’indexation utilisée :

- par mots clés; - par titre; - par le texte (tout ou seulement le début)• Chaque moteur propose un formulaire de recherche

avancée plus puissant;

Page 9: Rechercher de l'information sur le web

• Le moteur recherche l’occurrence du ou des mots dans sa base de données;

• Les résultats sont classés selon un algorithme de pertinence propre (présence du mot dans le titre, dans le texte, dans les balises métas, indice de popularité, …)

• Les résultats sont souvent présentés après clustering, c’est-à-dire qu’ils ne proposent qu’un seul lien pour plusieurs pages sur le même site;

• Tous les moteurs de recherche présentent des options de tri personnalisables (via Options ou Préférences)

• Les plus connus : Google, Yahoo! Search,Bing, Ask, Cuil, ...

Page 10: Rechercher de l'information sur le web

+ beaucoup de types de fichiers référencés;+ le plus vaste;+ le plus complet au niveau des critères de recherche;+ le tri par pertinence avec pondération et clustering

donne d'excellents résultats;- de plus en plus de liens sponsorisés.

Page 11: Rechercher de l'information sur le web

Interview sur Google pour "Tout s'explique" (RTL)

Page 12: Rechercher de l'information sur le web

Le page rank de Google, le secret de son succès ...

Page 13: Rechercher de l'information sur le web

+ nombreux types de fichiers référencés;

+ très vaste;+ très complet au

niveau des critères de recherche;

+ recherche notamment dans Yahoo!

- de plus en plus de liens sponsorisés.

=> le concurrent le plus sérieux de Google !

Page 14: Rechercher de l'information sur le web

Ancien MSN Search et Live Search+ fichiers Microsoft référencés;+ vaste;+ nouveau moteur de recherche dynamique+ jointure avec la BD de Facebook (bientôt « Vos amis ont

visité ce site »)+ de plus en plus populaire.

Page 15: Rechercher de l'information sur le web

+ base de données originale;

- critères de recherche limités;

+ présentation des résultats originale.

- de plus en plus de liens sponsorisés.

Page 16: Rechercher de l'information sur le web

Créé par des anciens collaborateurs Google

+ ne fait pas de suivi des activités des utilisateurs

- critères de recherche limités;

Inquiétant :

un moteur qui n'espionne pas

ses utilisateurs n'est pas viable ...

Page 17: Rechercher de l'information sur le web

Les moteurs de recherche morts

• Alltheweb (BD reprise par Yahoo)• Alta Vista (BD reprise par Yahoo)• Cuil• Openfind • Lycos (BD reprise par Yahoo)• Hotbot (BD reprise par Google)• Deja.com (BD reprise par Google)• Direct Hit (BD reprise par Teoma)• Excite • Go (BD reprise par Google)• Infoseek • NothernLight• Teoma (BD reprise par Ask)

Page 18: Rechercher de l'information sur le web

Les annuaires : pour une recherche large

• Les annuaires recensent des sitesclassés par catégories; le classementest effectué par la main de l’hommeet la pertinence et la qualité des sitessont donc bien meilleures;

• Les responsables construisent une base de données de fiches descriptives des différents sites et la recherche des mots s’effectue sur base de la fiche descriptive et non du site;

• Outre la recherche par catégorie, il est possible de réaliser une recherche par mots clés qui fournira les sites et les différentes catégories pertinentes;

• Les plus connus : Yahoo! et Open Directory;

Page 19: Rechercher de l'information sur le web

- peu de types de fichiers référencés;

+ le plus vaste (car le plus ancien);

- intégré au moteur de recherche Yahoo!

+ très populaire car beaucoup de services et d'aide en ligne;

- de plus en plus de liens sponsorisés.

Page 20: Rechercher de l'information sur le web

- peu de types de fichiers référencés;

+ vaste;

+ très récent;

+ pas de liens sponsorisés.

Page 21: Rechercher de l'information sur le web

Les métamoteurs : pour dégrossir rapidement• Ils permettent d’interroger simultanément plusieurs

moteurs de recherche mais la requête doit donc être simple;

• Exemples :Yippy, ...

Page 22: Rechercher de l'information sur le web

Ancien Clusty,Vivissimo+méta-moteur interrogeant de nombreuses base de données+présentation des résultats par clustering autour de mots-clés

Page 23: Rechercher de l'information sur le web

- base de données limitée;+ originalité : résultats présentés sous forme de carte.

Page 24: Rechercher de l'information sur le web

Les encyclopédies : pour des infos permanentes et sûres

• Elles présentent une source sûre, les informations sont de qualité et permanentes; elles sont parfois payantes;

• Les plus connues : Britannica et Wikipedia

Page 25: Rechercher de l'information sur le web

+ très ancienne et très vaste;+ référencement de diverses ressources évaluées (articles, ...);- il faut payer pour accéder au contenu complet;- beaucoup de pubs et de liens sponsorisés.

Page 26: Rechercher de l'information sur le web
Page 27: Rechercher de l'information sur le web

Les informations de Wikipedia sont fiables parce que

les contenus sont écrits par des spécialistes.

J

B

V

R

les contenus sont révisés par des spécialistes.

les contenus sont révisés par tous les visiteursles contenus sont protégés après une procédure de relecture.

Page 28: Rechercher de l'information sur le web

Wikipédia

• « Wikipédia est est un vaste projet d'encyclopédie collective établie sur Internet, universelle, multilingue et fonctionnant sur le principe du wiki. Wikipédia a pour objectif d'offrir un contenu libre, neutre et vérifiable que chacun peut éditer et améliorer. »Source : Page d'accueil de Wikipédia (http://fr.wikipedia.org/wiki/Wikipédia:A_propos )consultée en septembre 2010

Page 29: Rechercher de l'information sur le web

C'est quoi un wiki ?

• Un wiki permet à un groupe de personnes d'éditer communément un contenu.

• Sur un wiki public, vous pouvez lire ce que la communauté du wiki a écrit. En cliquant sur un bouton "edit" ou "modifier" d'un article, vous pouvez éditer le texte de l'article. Vous pouvez ajouter ou modifier tout ce que vous voulez dans l'article que vous êtes en train de lire.

Page 30: Rechercher de l'information sur le web

Si n'importe qui peut modifier le contenu, est ce fiable ?Comment gère t'on les conflits d'édition ?Que se passe t'il en cas de vandalisme ?

Page 31: Rechercher de l'information sur le web

C'est fiable un wiki ?Le wiki est un outil communautaire qui permet de livrer des informations fiables grâce aux éléments suivants :• Les modifications récentes sont accessibles à tout moment par tout utilisateur;• Chaque page présente un long historique des versions qui permet de récupérer des informations vandalisées;• La rédaction de texte wiki suppose d'utiliser une syntaxe spécifique très légère;• Dans les gros wiki (Wikipedia), chaque auteur peut spécifier une liste de pages à suivre et veiller à leur bonne évolution;• Les articles ébauches sont signalés et le domaine scientifique est un des plus populaire et donc assez fiable.

Page 32: Rechercher de l'information sur le web

Wikipédia, les caractéristiques

• Wikipédia est un projet collaboratif internationalInternet a contribué à rendre le nombre de contributeurs, valideurs très vaste et donc à renforcer la qualité des productions collectives.

• Wikipédia est un pari sur l'honnêteté des utilisateurs N'importe qui peut écrire du contenu mais n'importe qui peut aussi corriger ! Les pages de discussion sont un espace pour discuter des améliorations à apporter à l'article.

• Wikipédia impose la neutralité de point de vue pour éviter les guerres d'éditionsCertains thèmes très controversés peuvent être protégés tant qu'un accord n'aboutit pas au travers de la page de discussion

Page 33: Rechercher de l'information sur le web

• Wikipédia demande une attitude critique du lecteur... comme toute autre ressourceLes articles de Wikipédia sont d'une qualité variable mais les articles sont documentés par références bibliographiques pour garantir la qualité.

• Wikipédia est une encyclopédie en perpétuelle constructionLes contenus ne sont pas figés et peuvent être mis à jour plus rapidement que dans toute autre encyclopédie.

• Wikipédia ne dispose pas (encore) de processus de relectureWikipédia est trop jeune (née en 2002) et ne propose pas encore une couverture suffisamment large et suffisamment homogène des connaissances.

Page 34: Rechercher de l'information sur le web

Les bases de données spécialisées : pour des informations validées dans un domaine précis• Elles présentent une source sûre, les informations sont

de qualité et spécifiques à un domaine; • Testez les bases de données de la BUMP !• Pour les sciences expérimentales, la base de données

PubMed est une référence.

Page 35: Rechercher de l'information sur le web

Le moteur de recherche de la bibliothèque ...

Page 36: Rechercher de l'information sur le web

En résumé ...

Quantitéde ressources

Qualité des ressources

Moteurs Annuaires Encyclopédieset BD spécifiques

Page 37: Rechercher de l'information sur le web

Veillez à avoir quelques favoris avec chacun de ces outils de recherche, vous pourrez ainsi

choisir le meilleur outil pour faire une recherche d’information sur le web.

=> remplissez bien votre boîte à outils

Page 38: Rechercher de l'information sur le web

La tendance actuelle : tout faire !

- Yahoo!, qui était un annuaire à la base, a développé son moteur de recherche en utilisant essentiellement des bases de données existantes (AllTheWeb, AltaVista, Lycos, ...)

- Google, qui était un moteur à la base propose aujourd'hui un onglet « annuaire » qui retourne des recherches provenant de Open Directory;

- Britannica, la grande encyclopédie payante, s'est transformée en un grand annuaire permettant des recherches notamment dans l'encyclopédie mais aussi dans une série de ressources évaluées et cotées très finement;

MAIS quand on veut tout faire, souvent on finit par négligercertaines tâches ! Alors, informez-vous et testez régulièrement !

Page 39: Rechercher de l'information sur le web

Pour une recherche efficace ...

• Préparer sa recherche• Evaluer les ressources• Citer les références web• Zotero : Un outil pour indexer les

références web

Page 40: Rechercher de l'information sur le web

Préparer sa recherche

• Délimiter le sujet et choisir les mots clés;• Choisir le type de document attendu;• Choisir les limites de ma recherche (langue, date de

publication, zone géographique des pages, …);• Fixer le temps de recherche et la quantité d’information

attendue;• Définir au mieux la question que l’on se pose;• Choisir l’outil le mieux approprié pour la recherche

selon les limites choisies;• Utiliser les formulaire de recherche avancée;

Page 41: Rechercher de l'information sur le web

Evaluer les ressources

• Vous savez maintenant comment trouver de l’information sur le web, mais il faut savoir que tous les sites ne proposent pas une information fiable;

• Quelques indices de crédibilité :– l’URL : elle donne le domaine d’activité;– la source du document : il doit être possible

d’obtenir le nom de l’auteur, le nom de l’institution,…

– l’actualité : la date de création et la date de la dernière mise à jour; à relativiser en fonction du sujet;

– les références bibliographiques : si le contenu de la page n’est pas original, les sources originales doivent être indiquées;

Page 42: Rechercher de l'information sur le web

Citer les références web

• Une page ou un site web utilisé pour rédiger un document doit être cité;

• Pour un site web, il faut donner l’auteur, le titre de la page d’accueil, l’adresse URL et la date de la consultation;

• Pour une page web, il faut donner l’auteur, le titre de la page, la ressource plus large à laquelle le document est rattaché, l’adresse URL et la date de consultation;

• Pour un document sur un site ftp, il faut donner l’auteur, le type de support, la date, l’adresse ftp, le répertoire et le fichier;

Page 43: Rechercher de l'information sur le web

Zotero, un outil pour indexer les références web

• Zotero est une extension du navigateur Firefox qui permet d'indexer automatiquement les informations importantes pour citer les références web;

• Cliquez sur le logo « Zotero » dans la barre inférieure pour indexer les informations sur la page en cours ;

• Une fois vos références indexées, vous avez la possibilité de les exporter au format texte;

• Un bel exemple d'utilisation : la liste des références web de ce document ...

Page 44: Rechercher de l'information sur le web

Références

1. “Accueil - Wikipédia,” http://fr.wikipedia.org/wiki/Accueil (accessed October 29, 2010).

2. “AERIS - Aide aux étudiants pour la recherche d'information scientifique,” http://aeris.11vm-serv.net/ (accessed October 29, 2010).

3. “Ask.com France - L'autre moteur de recherche,” http://fr.ask.com/ (accessed Octobre 29, 2010).

4. “Bing “ http://www.bing.com/ (accessed October 29, 2010).5.“Encyclopedia - Britannica Online Encyclopedia,”

http://www.britannica.com/ (accessed October 29, 2010).

Page 45: Rechercher de l'information sur le web

Références

6. “Google Recherche avancée,” http://www.google.be/advanced_search?hl=fr (accessed October 29, 2010).

7. “Infospère “ Aide à la recherche documentaire à l'UCL http://sites.uclouvain.be/infosphere/sciences/index.html

(accessed October 29, 2010).8. “Open Directory - World: Français,”

http://www.dmoz.org/World/Français/ (accessed October 29, 2010).

Page 46: Rechercher de l'information sur le web

Références

9. “Search Engine Showdown: Search Engine Statistics,” http://www.searchengineshowdown.com/statistics/ (accessed October 29, 2010).

10. “SearchEngineWatch: Metacrawlers and Metasearch Engines,” http://searchenginewatch.com/showPage.html?page=2156241 (accessed October 29, 2010).

11. “Yahoo! Search - Moteur de recherche de sites Web, images, vidéos, shopping et actualités,” http://fr.dir.yahoo.com/ (accessed October 29, 2010)

12. “Yahoo! Search - Recherche avancée,” http://fr.search.yahoo.com/web/advanced;_ylt=A0geumW3IUZHy_4A6uFiAQx. (accessed October 29, 2010)

Page 47: Rechercher de l'information sur le web

Droits sur les images

Iceberg : http://www.flickr.com/photos/stargazr/2512500651/sizes/o/

Google Pagerank :http://www.inqbation.com/blog/inqbation%E2%84%A2-achieves-

google-page-rank-pr4-again/

Page 48: Rechercher de l'information sur le web

Avec un moteur de recherche, ...

les pages sont indexées de manière automatisée

J

B les pages sont indexées par un humain

Page 49: Rechercher de l'information sur le web

Un méta-moteur, c'est ...

un moteur de recherche qui a peu de critères de recherche.

J

B

V

R

un outil de recherche qui interroge plusieurs moteurs.

un outil de recherche qui présente les résultats sous forme de carte.

un moteur de recherche qui indexe uniquement les données métas.

Page 50: Rechercher de l'information sur le web

Wikipedia est une encyclopédie qui a la(les) caractéristique(s) suivante(s) :

Tout le monde peut modifier son contenu.

J

B

V

R

Après relecture par des spécialistes, lesles contenus sont protégés.

C'est une ressource fiable.

On garde une trace des différentes versions d'un article.

Page 51: Rechercher de l'information sur le web

Pour citer une référence web, il est nécessaire despécifier :

la date de la dernière mise à jour de la page;

J

B

V

R

la date de consultation de la page;

les mots-clés qui m'ont permis de trouver le site par une recherche web.

le nom de l'auteur;