fiche tpe 4

2
Cayrel Jane Fiche méthode_TPE Évaluer l'information sur Internet Le Web, instable et peu fiable... Le Web est la partie la plus visible et la plus connue d’Internet. Son principe est simple : un auteur crée une ou des pages d'information (appelées pages Web) et place celle(s)-ci sur un ordinateur capable de gérer ce genre de pages (appelé serveur Web). Toute personne possédant une connexion Internet peut alors accéder à cette page Web et naviguer de page en page grâce aux hyperliens. N'importe qui peut créer des pages et en modifier le contenu dans le cas des sites participatifs (notamment ceux utilisant la technologie du wiki). C’est ce qui donne au Web son dynamisme, mais aussi son caractère chaotique. Aucun contrôle éditorial ne s'applique à la source et c'est donc à l'internaute que revient la tâche de vérifier la fiabilité des informations publiées. Les moteurs de recherche Un moteur de recherche se présente sous la forme d’une interface d’interrogation dans laquelle on tape un mot-clé (le sujet de la recherche), un robot parcourt ensuite des millions de pages web à la recherche des documents qui correspondent à la requête (crawl). Chaque moteur de recherche a ses propres algorithmes de calcul dans la recherche et l'affichage des résultats (page ranking) . Il en résulte que, pour une même requête, les résultats ne seront pas les mêmes selon le moteur de recherche utilisé, d'où l'importance de connaître un tant soit peu les « biais » qui infléchissent l'indexation des pages. Google applique notamment un « indice de popularité » en proposant en premier les sites les plus référencés, ce qui n’est pas forcément un gage de fiabilité mais qui explique la prédominance des sites commerciaux. Exalead met en œuvre une technologie qui repose sur l'analyse statistique de la récurrence des termes de la requête. Un affichage de mots-clés et de catégories associés permet d'affiner la recherche. Teoma utilise un indice de popularité différent de celui de Google : il identifie des communautés sur le web puis détermine quels sites font "autorité" à l'intérieur de ces communautés. Sa technologie élabore ainsi des "communautés de contenu" c'est-à-dire des groupes de pages liées au même sujet. Intéressant pour une recherche en langue anglaise. Ixquick est un métamoteur qui interroge les bases de données de plusieurs moteurs de recherche simultanément et affiche une synthèse des résultats. Il garantit à l'internaute le respect de sa vie privée en s'engageant à ne conserver aucune trace des recherches effectuées. Décryptage d'une adresse URL L'adresse URL (Universal Resource Locator) fournit déjà beaucoup d'informations sur le site consulté. La forme la plus courante est la suivante : http://www.droitdunet.fr http signifie Hyper Text Transfert Protocole, c’est- à-dire le protocole utilisé pour naviguer www signifie World Wide Web, c’est un système de publication et de consultation de documents Nom du serveur sur lequel est enregistré le document L’extension renseigne sur l’origine et/ou le type de site dont il s’agit (gouvernemental, institutionnel, commercial)

Upload: cayrel-jane

Post on 12-Mar-2016

212 views

Category:

Documents


0 download

DESCRIPTION

évaluer l'information sur Internet

TRANSCRIPT

Page 1: Fiche TPE 4

Cayrel Jane Fiche méthode_TPE

Évaluer l'information sur Internet

Le Web, instable et peu fiable...Le Web est la partie la plus visible et la plus connue d’Internet. Son principe est simple : un auteur crée une ou des pages d'information (appelées pages Web) et place celle(s)-ci sur un ordinateur capable de gérer ce genre de pages (appelé serveur Web). Toute personne possédant une connexion Internet peut alors accéder à cette page Web et naviguer de page en page grâce aux hyperliens.

N'importe qui peut créer des pages et en modifier le contenu dans le cas des sites participatifs (notamment ceux utilisant la technologie du wiki). C’est ce qui donne au Web son dynamisme, mais aussi son caractère chaotique. Aucun contrôle éditorial ne s'applique à la source et c'est donc à l'internaute que revient la tâche de vérifier la fiabilité des informations publiées.

Les moteurs de rechercheUn moteur de recherche se présente sous la forme d’une interface d’interrogation dans laquelle on tape un mot-clé (le sujet de la recherche), un robot parcourt ensuite des millions de pages web à la recherche des documents qui correspondent à la requête (crawl).

Chaque moteur de recherche a ses propres algorithmes de calcul dans la recherche et l'affichage des résultats (page ranking). Il en résulte que, pour une même requête, les résultats ne seront pas les mêmes selon le moteur de recherche utilisé, d'où l'importance de connaître un tant soit peu les « biais » qui infléchissent l'indexation des pages.

Google applique notamment un « indice de popularité » en proposant en premier les sites les plus référencés, ce qui n’est pas forcément un gage de fiabilité mais qui explique la prédominance des sites commerciaux.

Exalead met en œuvre une technologie qui repose sur l'analyse statistique de la récurrence des termes de la requête. Un affichage de mots-clés et de catégories associés permet d'affiner la recherche.

Teoma utilise un indice de popularité différent de celui de Google : il identifie des communautés sur le web puis détermine quels sites font "autorité" à l'intérieur de ces communautés. Sa technologie élabore ainsi des "communautés de contenu" c'est-à-dire des groupes de pages liées au même sujet. Intéressant pour une recherche en langue anglaise.

Ixquick est un métamoteur qui interroge les bases de données de plusieurs moteurs de recherche simultanément et affiche une synthèse des résultats. Il garantit à l'internaute le respect de sa vie privée en s'engageant à ne conserver aucune trace des recherches effectuées.

Décryptage d'une adresse URLL'adresse URL (Universal Resource Locator) fournit déjà beaucoup d'informations sur le site consulté.

La forme la plus courante est la suivante :http://www.droitdunet.fr

http signifie Hyper Text Transfert Protocole, c’est-à-dire le protocole utilisé pour naviguer www signifie World Wide

Web, c’est un système de publication et de consultation de documents

Nom du serveur sur lequel est enregistré le document

L’extension renseigne sur l’origine et/ou le type de site dont il s’agit (gouvernemental, institutionnel, commercial)

Page 2: Fiche TPE 4

Cayrel Jane Fiche méthode_TPE

Les critères de l'évaluationL’adresse URL n’est pas suffisante pour évaluer la fiabilité d’un site Internet, mais elle doit permettre de rejeter d’emblée un certain nombre de sites, notamment ceux à vocation ouvertement commerciale, et de repérer les blogs et les sites personnels, à manier avec précaution dans le cadre d'une recherche de type universitaire.Une fois ce premier tri effectué, vient le moment d'explorer les sites et de se poser un certain nombre de questions...

Pour conclureAucun moteur de recherche, aucun outil n'est en mesure de valider une information, décider de sa pertinence ultime, ni juger de sa qualité. Face aux info-pollutions de la désinformation, de la médiocrité, du manque de fiabilité de l’information sur Internet, l’évaluation humaine constitue la seule réponse possible.

SITE CONSULTEil est recommandé de remonter à la

page d'accueil du site

Qui ?Qui est l’auteur du site ?- l'auteur du site est-il facilement identifiable ?- quelle est sa formation universitaire, son organisme de rattachement ?- fait-il autorité dans mon domaine de recherche ?

Quoi ?De quoi parle le site ?- le site est-il entièrement consacré au sujet de ma recherche ?- les sources sont-elles référencées?- comporte-t-il des liens vers des sites de référence institutionnels ou universitaires?

Comment ?Comment l’information est-elle présentée ? h

- le plan du site est-il facilement accessible ? - le niveau de langue est-il correct ? - l'accès au contenu du site nécessite-t-il de s'identifier et/ou de créer un compte ?- le site comporte-t-il des liens vers des services commerciaux ?

Quand ?L’information est-elle récente ?- connaît-on la date de création du site ? - la date de sa dernière mise à jour ?

Où ?Qu'indique l’adresse URL du site ?- s’agit-il d’un site institutionnel, personnel, commercial ?