2 ie links recherch info pdf envoyé
DESCRIPTION
veilleTRANSCRIPT
1
Comment rechercher l’information sur Internet ?
Le robot
• programme qui se promène sur le web, repère et visite des pages html
• Il lit le contenu de la page, repère les liens vers d'autres pages
L'indexation
• programme qui stocke les données collectées par le robot, et les données envoyées par les webmasters
L’interface de recherche
• la partie web qui traite les requêtes selon une syntaxe propre à chaque moteur. La requête est adressée à l'index, qui propose des réponses sous forme de liens vers des pages html, en fonction d'un ordre de pertinence.
Principe de fonctionnement des moteurs de recherche
2
Internet, le nouveau régime de vérité
• Internet devient le principal support et la source
privilégiée d’information.
• un seul réflexe : « googliser »
• Enjeu important pour l’éducation :
« laisser le jeune seul face à Internet revient à mettre
une voiture entre les mains d’un ado sans lui avoir appris
le code de la route ni les rudiment de la conduite ».
(Alexandre Serres)
• Enjeu éducatif et sociétal majeur
Internet, le nouveau régime de vérité ?
Enjeu professionnel (au-delà de la maîtrise technique des
outils informatiques les travailleurs du numérique
devront pouvoir : chercher, identifier et évaluer l’info
pertinente dans différents contextes).
3
BIEN GERER L’INFORMATION
Jeudi, 18 janvier 2007
Un enjeu pour les professionnels
ACCENTURE a publié une étude sur la qualité (perçue) de l'information mise à
la disposition des cadres moyens de grandes entreprises américaines et britanniques.
Les résultats sont alarmants en ce sens qu'il apparaît que les informations sur les concurrents sont plus faciles à trouver que celles qui concernent l'entreprise elle-même.
L'étude met en évidence la pauvre qualité des informations dont disposent les cadres:
les managers consacrent 2 heures par jour à la recherche d'information, 50% de l'information obtenue est sans intérêt, 59% des répondants sont persuadés que de l'information intéressante existe
dans l'entreprise mais qu'ils ne parviennent pas à y avoir accès, 57% la nécessité de compiler l'information est un des aspects difficile de leur job. http://newsroom.accenture.com/article_display.cfm?article_id=4484
• Développer ou améliorer des compétences théoriques :
• Quelles sont les principales sources d’informations
sur Internet ?
• Quelles sont les principales méthodes de recherche
d’information ?
• Afin d’être autonome pour effectuer des recherches
précises en appliquant les bonnes méthodes de travail.
OBJECTIFS DU COURS
4
OBJECTIFS DU COURS
Mieux utiliser Google et d’autres moteurs de recherches:
• Découvrir les annuaires,
• Exploiter les répertoires sélectifs,
• Explorer le Web profond,
• Créer vos alertes sur le web,
• Chercher par requêtes,
Quels pré-requis pour faire une recherche efficace ?
5
Adoptez une bonne
Stratégie de recherche
Pré-requis indispensables
Elaborer soigneusement sa stratégie de collecte
d’informations : o prendre le temps de cerner la question de recherche d’info,
o Connaître les principaux outils de recherche proposés.
6
Savoir Chercher avec méthode
Préparer la recherche d’info
• Reformuler le sujet avec les mots qu’il faut
• Cerner les thèmes et sous-thèmes
• Composer avec une liste des mots-clés
• Faire le bilan de vos connaissances en la matière avant de se lancer dans la recherche
7
Elle doit vous conduire de l'analyse de votre besoin d'information à
l'information pertinente.
Votre stratégie doit être la meilleure possible dès le départ sous peine de
perte de temps et d'inefficacité.
L'objectif de ce travail est de vous faire progresser dans votre culture de
l'information et de la communication c'est à dire parvenir à trouver de
l'information et à communiquer de manière claire et critique ce que vous
avez compris.
La démarche de recherche.
Il convient de ne se pas se ruer de suite sur Internet.
N'oubliez pas que le principal outil de base de tout travail
de recherche d'information est votre cerveau.
(source de la photo :http://www2.epfl.ch/coaching/page49073-fr.html)
La recherche que vous devez faire suppose que vous
fassiez le tour de vos connaissances sur le sujet par
rapport à ce que vous ignorez et qu'il vous faut connaître.
Votre besoin d'information ne cessera d'évoluer durant
votre travail. Il vous faudra donc faire le point
régulièrement.
Quels besoins d'information ?
Conversion en mots-clés
Une fois posés quels sont vos besoins d'informations, il
sera plus aisé de trouver les premiers mots, définition ou
mots-clés à utiliser.
8
Choisir les sources d’informations
• Approfondir un sujet : articles scientifiques, thèses, ouvrages
spécialisés, experts, …
• Actualités sur un sujet : article de presse, publications,…
• Synthèse sur un sujet : encyclopédie, « que sais-je ? », …
• Dimension économique : étude de marché et fiches d’entreprise,
brevets, normes, réglementation, …
• Dimension juridique : textes de lois, publications officielles,…
Je sais
Chercher l’information
Pas trouvé
Eureka ! Eureka !
Identifier la source
BBD, REX,KM,…
Je ne
sais pas
reformuler mots
pour la recherche
Evaluer
les résultats
Pas assez
de résultats Trop de
de résultats
Ma question
Définir temps
de recherche
Où puis-je trouver
la réponse?
9
Quelles compétences pour faire une recherche efficace ?
Quels Outils choisir ?
la veille sur internet; comment aller à la pêche
de l’information ?
Web invisible: 400 à 500 fois plus
Volumineux que le Web visible
10
macro-web
sites de médias et
d’institutions
web des
surfaces
web des profondeurs
meso-web
blogs et sites
personnels
micro-web
forums, microblogs,
plate-formes
de partage de
contenus
SIGNAUX
FORTS
SIGNAUX FAIBLES
- - - -
⋁
⋀
la veille sur internet; comment aller à la pêche
de l’information ?
20
SCHOLAR GOOGLE
• Pour vos recherches universitaires, songez à Scholar Google plutôt qu’à Google. http://www.scholar.google.com
• Remarques sur Scholar google : – Indexe des articles issus de périodiques et évalués
par des pairs: thèses, livres, articles en pré-publication et rapports.
– Accède aux documents du web invisible (profond) (indisponible sur Google).
– Très simple d’utilisation.
– Un Blog à lui : http://schoogle.blogspot.com
11
Trouver la réponse…
Que faire lorsque l’information que l’on cherche
se trouve au milieu d’une phrase?
- Imaginez la phrase en question
- Placez cette phrase entre guillemets
et
Remplacez le mot ou le nombre inconnu par *
Ex: « les provinces du sud marocain comptent * habitants
d’origine sahraoui »
TROUVER DES SYNONYMES
• Google Synonymes
C'est un générateur de synonymes. Et
cela fonctionne parfaitement en français.
12
Cherchez des nombres dans
un intervalle précis
• Dans Google, placez … entre deux nombres
pour inclure tous les nombres qui se
trouvent dans cet intervalle.
Ex: statistiques « sinistralité RC auto » 2008…2012
TROUVER UNE ADRESSE A L’AIDE D’UNE CARTE
maps.google.com Contrairement à la plupart des outils de cartes que l’on retrouve habituellement sur Internet, Google Maps permet de : • trouver une adresse même si elle n’est entrée qu’en partie
• obtenir le nom du commerce situé à cette adresse
• de trouver des commerces à proximité du lieu (restaurants, hotels, …)
• obtenir un itinéraire détaillé entre deux adresses
13
Trouvez des sites similaires
• Un site vous intéresse beaucoup, est-ce possible
de trouver d’autres sites semblables?
La recherche de pages similaires sur Google peut
vous aider!
Comment?
Entrez l’adresse du site qui vous intéresse dans la
case « Similaires » dans les fonctions avancées.
Trouvez des sites similaires
14
Pour accéder à cet écran il faut
Indiquer : « google recherche avancée »
Trouvez des sites similaires
Trouvez des pages similaires
Aller dans les
résultats de
recherche :
En cache -
Pages similaires
15
Trouvez des pages similaires
Google livres
• Vous permet d’avoir un aperçu du contenu d’un livre
ou même de pouvoir consulter l’ouvrage en entier.
• Idem pour les magazines.
• Un tri par date pour avoir les plus récents est
possible.
Recherche de livres
16
Google livres
LES ALERTES POUR VOTRE VEILLE
• Utiliser les alertes Google :
Google Alerts se complète en ajoutant les blogs aux sources disponibles.
Plusieurs options sont disponibles: actualité, blogs,
web, newsgroups,...
Les alertes peuvent être envoyées selon l'actualité,
une fois par jour ou une fois
par semaine.
Google Alerts http://www.google.com/alerts
17
LES ALERTES POUR VOTRE VEILLE
FAIRE UNE RECHERCHE DANS LES BLOGS via Google BLOGS
18
FAIRE UNE RECHERCHE DANS LES BLOGS via Google BLOGS
faire une recherche dans les groupes
de discussion via google groupes
19
faire une recherche dans les groupes
de discussion via google groupes
• il est possible de limiter une recherche aux pages provenant de sites
universitaires et contenant les mots demandés.
La syntaxe sera par exemple :
site:edu plasma physics laboratory (laboratoire de physique des plasma)
ATTENTION : jamais d’espace, ni avant ni après les deux points !
• il est évidemment possible d’affiner en demandant par exemple un format
particulier de fichier avec une syntaxe de type :
site:edu filetype:pdf plasma physics laboratory
(qui ramène uniquement des fichiers au format PDF).
RECHERCHER DES PAGES UNIVERSITAIRES
DANS GOOGLE
20
• Le domaine .edu est essentiellement utilisé pour les Etats-Unis.
Au Royaume-Uni, maroc, …on utilise l’extension .ac. Mais le .ac est un sous-
domaine du .uk, et de ma.
• Comment procéder ? En combinant deux syntaxes:
site:ma inurl:ac « actuariat et gestion des risques »
La syntaxe inurl permet de limiter la recherche aux pages ayant un mot
particulier dans leur adresse.
(Dans ce cas-ci, nous avons mis la syntaxe .ac dans l’adresse des pages du
domaine marocain pour limiter notre recherche aux sources académiques
marocaines).
• Les pages mises en ligne par les universités françaises utilisent le sous-
domaine ".univ". Une bonne syntaxe pourrait donc être
site:fr inurl:univ "laboratoire de physique" (sources universitaires françaises)
rechercher des pages universitaires dans google (suite)
rechercher des pages universitaires dans google (suite)
21
rechercher des pages universitaires dans google (suite)
Sélectionner des sites de qualité
• => Un site de qualité renseigne d'autres
sites de qualité. Beaucoup de sites
universitaires américains proposent ce
qu'ils appellent des «Subject Guides»
(guides par sujet).
• Pour les trouver, il suffit d'utiliser un
moteur de recherche avec une syntaxe
de type subject guide history et en
remplaçant "history" par la thématique
recherchée.
22
Sélection de sites de qualité (universités, centre recherche,…)
23
DEBUTER VOTRE
VEILLE SUR GOOGLE
24
• Activité de COLLECTE et d’exploitation continue d’informations concernant
l’ENVIRONNEMENT de l’entreprise, de sa marque, des ses produits voire
de ses dirigeants.
• Un outil de DIAGNOSTIC présentant
le (non)/positionnement de l’entreprise et de ses concurrents.
• Un outil pour faire le BILAN pour les
actions à mettre en place.
Qu’est-ce que l’activité de veille ?
• Vous donnez l’envie de mettre vous-même en place
une veille d’information gratuite, automatique et
individualisée sur Internet.
• Etre alerté en temps réel des informations diffusées sur
Internet et touchant à vos recherches en cours, votre
entreprise, votre marque.
• C’EST L’INFORMATION QUI VIENT A VOUS
OBJECTIFS
25
• Cela vous permettra d'être informé en temps réel de la
parution de nouveaux articles sur les sites que vous aurez
sélectionnés.
En vous abonnant aux flux RSS de ces sites, vous n'avez qu'à
consultez une seule page,
Cela vous fera gagner du temps si vous consultez
régulièrement des sites pour vous informer.
ABONNEMENT AUX FLUX RSS via Google READER
26
Feedly.com
• L’esprit du temps = Zeitgeist.
Ce terme a souvent été utilisé dans la philosophie de
l'histoire par Hegel puis Heidegger.
C’est une façon de décrire le climat intellectuel ou
culturel d'une époque (1 année).
Google ZEITGEIST permet de classer les recherches thématiques sous forme de bilan ou
« événements marquants » ou « retrospectives » d’une
année écoulée dans les différents domaines liés à votre
recherche.
Google ZEITGEIST
27
Google ZEITGEIST
Google ZEITGEIST
28
Google ZEITGEIST
Touchgraph de Google : liens entre sites
• Vous obtenez une image nette du réseau que votre site peut
représenter.
• Il est possible de faire deux types de recherche : par mot clé ou
par url.
• En donnant juste l'adresse d'un site, ce logiciel va chercher
automatiquement les liens pointant vers ce site, et les affichent
sous forme d'un graphe dont les arrêtes sont pondérés par le
nombre de liens.
• Plus un site fait de liens vers le site que vous voulez analyser,
plus les deux noeuds seront proches dans le graphe.
Voila un très bon outil pour analyser les liens entre sites et les
personnes.
29
Touchgraph de Google : liens entre sites
Touchgraph de Google : liens entre sites
30
TouchGraph ou comment visualiser votre notoriété
TouchGraph est un moteur de recherche/logiciel de cartographie
relativement connue des spécialistes de la veille. TouchGraph permet de visualiser les connexions entre différentes sources
du web. Le principe est simple : il suffit d’entrer dans la barre de
recherche le nom de votre organisation et de cliquer sur « graph it ».
Touchgraph de Google: liens entre sites
Touchgraph ou comment visualiser votre notoriété
31
Le résultat est le suivant
Touchgraph ou comment visualiser votre notoriété
Les grands cercles représentent les sites Internet où le terme
recherché est cité les sites source (dans notre exemple le nom
de votre organisation) ou bien encore une vidéo sur Dailymotion
comportant le nom de votre organisation dans son titre.
Les cercles de plus petite circonférence gravitant autours des cercles principaux (et reliés à ceux-ci par des liens graphiques) sont les sources web reliées directement au site principal.
Touchgraph ou comment visualiser votre notoriété
32
L’intérêt ?
- pouvoir déterminer quels est l’étendue de votre notoriété ; - repérer les sites ou ressources web pouvant diffuser un buzz (négatif
ou de votre organisation);
- repérer les relais d’opinion pour votre organisation ou votre marque ;
- pouvoir créer des liens entre des sites qui n’en ont pas encore ; - comme tout moteur de recherche : découvrir des nouvelles sources
de recherche d’informations.
Touchgraph ou comment visualiser votre notoriété
Pour accéder à un site représenté sur la cartographie, un simple clique droit suffit
(« launch website »).
De plus, lorsque vous survolez l’un des cercles représentant une ressource web,
une petite croix apparaît.
Touchgraph ou comment visualiser votre notoriété
33
Touchgraph ou comment visualiser votre notoriété
Cela permet d’agrandir la représentation graphique afin d’avoir une
vision encore plus étendue du réseau web de votre organisation.
Dans notre exemple, la cartographie de base peut rapidement devenir comme
cela :
TouchGraph cartographie ici les résultats trouvés dans Google. Mais il peut aussi rechercher
et cartographier à partir de Facebook et d’Amazone.
Touchgraph ou comment visualiser votre notoriété
TouchGraph et Facebook.
Lorsque l’on parle d’e-réputation, Facebook est considéré comme une
source essentielle à surveiller ou bien comme un outil efficace à utiliser.
L’option Facebook de TouchGraph permet de cartographier votre réseau Facebook, faisant ainsi apparaître vos relations (vos « amis ») ainsi que les relations de vos relations ! Toujours dans le même esprit de surveillance de votre e-réputation, cela permet de visualiser les éléments
à risque (propagation d’une rumeur), les relais d’opinion, etc…
34
Touchgraph ou comment visualiser votre notoriété
Voici un exemple d’un réseau Facebook cartographié par TouchGraph :
Et enfin, une dernière nouveauté de TouchGraph, la cartographie selon Amazone.
Cette recherche sur Amazone permet de cartographier les ressources par
thématique, et de représenter ainsi les livres, albums de musiques et films en
rapport avec la thématique.
Ici l’exemple avec la thématique « web 2.0 » :
TouchGraph un outil simple et facile d’accès pour vous donner un aperçus
graphique de votre notoriété. Bien entendu, il n'y a en ligne qu'une version de
démonstration (une version trial de 60 jours est également téléchargeable), pour
plus de renseignements contacter la société TouchGraph pour un devis.
Touchgraph ou comment visualiser votre notoriété
35
Contrairement aux moteurs de recherche classiques,
Cluuz affiche les relations entre les termes plutôt que
de dresser des listes de résultats.
Très prometteur il augure d’une profonde mutation de la
recherche d’information et de veille dans l’avenir (1 model
nouvelle génération est en cours de conception)
CLUUZ.COM
clic
36
clic
clic
37
clic
38
Wikio est un moteur de recherche spécialisé
puisant ses informations dans les sites de presse
et les blogs.
Chacun peut proposer des articles pour lesquels
les utilisateurs seront ensuite invités à voter.
(http://www.wikio.fr/) version française
(http://www.wikio.com/) version anglaise
WIKIO, moteur d’actualité
Wikio propose une compilation des actualités publiées
sur le Web (en provenance de sites de presse, blogs,
etc.). Il est possible de partager ces actualités sur les
réseaux sociaux, les commenter et de voter pour celles-ci.
Le site Wikio est d'ailleurs réputé pour son classement
des blogs qui s'effectue en fonction de la taille de leur
communauté, du nombre de rétro-liens, du nombre de
tweets et de retweets (voir la fiche Twitter).
Lancé en 2006 par le créateur du comparateur de prix
Kelkoo, le site français Wikio s’est ouvert à l’international
avec des versions en anglais, espagnol, allemand, et en
italien. En 2010, Wikio fusionne avec OverBlog et
ebuzzing pour former le group WikioGroup.
WIKIO, moteur d’actualité
39
WIKIO, moteur d’actualité
WIKIO, moteur d’actualité
Intelligence
40
Moteur Cartographique
• Kartoo.com :
Le moteur de recherche Kartoo fournit une représentation cartographique des résultats de la recherche. Il restitue les informations dans leur contexte de façon à permettre de se rappocher spatialement de ce que l'on cherche, ainsi que des graphes sémantiques (non visibles sur la figure, qui apparaissent lorsque le pointeur s'approche d'un sujet). (wikipédia, nov.2006)
Ce moteur permet souvent d’identifier très rapidement les acteurs en présence lors de la mise en place d’une veille.
Quelques autres moteurs récents A9.com
41
Quintura, recherche et nuage
Quintura est un moteur de recherche qui affiche dans la
partie supérieure de l'écran un "nuage" de mots relatifs
à la recherche et permettant de l'affiner, et dans la
partie inférieure, les pages trouvées.
Quintura http://www.quintura.com/ Langue: anglais
QUINTURA OU UNE VISION COUPLEE
Quintura Search est un moteur de recherche d’un
nouveau genre. En effet déjà pour la présentation des
résultats, il les affiche sous forme de liste. Ses
particularités repose sur une approche sémantique
permettant d'interroger au choix les autres moteurs de
recherche Google, Yahoo, SearchGoogle,...
Quintura Search possède une interface graphique
innovante avec la présentation des résultats sur deux
volets : à droite sont les résultats dans sa forme
classique et à gauche les clusters d'information
générée à partir des pages de résultats sous forme
d'une cartographie.
QUINTURA OU UNE VISION COUPLEE
42
Exemple de Quintura couplé à la vidéo
43
VideoRonk, moteur de recherche de vidéos
VideoRonk utilise les plus grandes plates-
formes de partage de vidéo: Youtube,
Dailymotion, Google Video, Metacafe,...
VideoRonk
http://www.videoronk.com/
TROUVER DES VIDEOS
18 millions d’heures de vidéos, permet de
faire des recherches en texte sur le contenu
même des vidéos.
Blinkx.com
44
Les astuces pour une
meilleure recherche
Dictionnaire des synonymes qui, grâce à l'informatique, donne vie au
langage et vous permet de le manipuler de manière organique.
Entrez un mot et regardez surgir antonymes, synonymes, mots
apparentés, etc., tous accompagnés de définitions et d'explications.
Cliquez sur l'un de ces mots, et la carte entière se réorganise autour
de lui, tandis que d'autres termes associés s'y rajoutent.
Modifiez la fonction de recherche et vous pourrez obtenir les
traductions des mots en français, hollandais, allemand, espagnol et
italien. (devenu payant : +/-3$/mois)
VISUALTHESAURUS.com
45
VISUALTHESAURUS.com
VISUALTHESAURUS.com
46
VISUALTHESAURUS.com
VISUALTHESAURUS.com
47
Les Bibliothèques et
magazines en ligne
Apport des bibliothèques numériques
• Olivier Ertzscheid, du blog affordance.info identifie les bibliothèques numériques, celles à partir desquelles il est possible de télécharger gratuitement du contenu numérique.
• Bibliothèques numériques http://affordance.typepad.com/mon_weblog/2006/09/bibliothques_nu.html
48
Apport des bibliothèques numériques
49
Catégories
Sites web
Catégories
Sites web
50
Des magazines gratuits en ligne
• Jan Szczepanski, bibliothécaire de l'Université de
Göteborg (Suède) a rassemblé plus de 4500 revues et
magazines en accès libre sur Internet. Il y en a pour
tous les goûts, dans tous les domaines du savoir.
Jan Szczepanski's list of OA-journals http://www.his.se/templates/vanligwebbsida1.aspx?id=20709
Les archives américaines
• Les archives de la presse US
• Ce site vous donne accès à 60.000.000 pages de la presse US. La base de documents couvre 650 villes, 239 années, 2.493 titres de journaux. Certainement une base de données à consulter pour un grand nombre de travaux de recherches. Newspaper Archive http://www.newspaperarchive.com Langue: anglais Accès: payant
51
http://www.newspaperarchive.com
Les ANNUAIRES propres
à une discipline
52
Les moteurs de recherche conviennent parfaitement pour trouver
des mots sur les pages du web (indexation par les spiders) =>
Mais ils ne sont pas indiqués pour trouver des sites (ex: sport,
études universitaires, …)
Dans ce cas, il faut s'adresser à un annuaire, sorte de répertoire
thématique conçu par des bibliothécaires. Liste de sites classés
par rubriques.
Il existe des annuaires généralistes tels que:
1) (http://dir.yahoo.com)
2) l'Open Directory Project (http://www.dmoz.com).
Pour trouver des annuaires spécialisés :
L'annuaire des annuaires http://www.lesannuaires.com/
Les ANNUAIRES
Annuaire DMOZ
53
Annuaire DMOZ
54
Répertoires établis à partir d'une indexation des ressources faite par des
êtres humains, par opposition au moteurs de recherche.
The Internet Public Library : bibliothèque publique de ressources
électroniques, expérimentation initiée par la School of Information, University
of Michigan.
WoYaa! : annuaire de sites africains
Reinet : annuaire de sites Web sur l'environnement et le développement durable
Indexa : annuaire internet des sites professionnels
Social Science Information Gateway : portail anglais spécialisé en sciences
sociales axé sur les contenus non référencés par les moteurs de recherche
Infomine : collections de ressources universitaires non référencées par les
moteurs de recherche
Les Annuaires de recherche
Commerce international
Annuaire de sites économiques • VIBES (Virtual International Business & Economic Sources)
rassemble plus de 3000 sites consacrés au commerce international. On y trouve également des articles et des données statistiques Une ressource exceptionnelle !
VIBES http://www.learnwebskills.com/company/intern02.html Langue: anglais
55
Les MOTEURS spécialisés pour
la recherche académique
Google SCHOLAR (http://scholar.google.be/)
Isidore (http://www.rechercheisidore.fr)
Archives Ouvertes HaL (http://hal.archives- ouvertes.fr/)
Social Science Research Network http://ssrn.com/
L’édition électronique ouverte :http://leo.hypotheses.org/
Autres pistes que Google
56
Google SCHOLAR (http://scholar.google.be/)
Autres pistes que Google
57
Google SCHOLAR (http://scholar.google.be/)
Isidore (http://www.rechercheisidore.fr)
Autres pistes que Google
58
résumé
Google SCHOLAR (http://scholar.google.be/)
Isidore (http://www.rechercheisidore.fr)
Archives Ouvertes HaL (http://hal.archives-ouvertes.fr/)
Autres pistes que Google
59
L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion
d'articles scientifiques de niveau recherche, publiés ou non, et de thèses, émanant
des établissements d'enseignement et de recherche français ou étrangers, des
laboratoires publics ou privés
Google SCHOLAR (http://scholar.google.be/)
Isidore (http://www.rechercheisidore.fr)
Archives Ouvertes HaL (http://hal.archives-ouvertes.fr/)
Social Science Research Network http://ssrn.com/
Autres pistes que Google
60
Google SCHOLAR (http://scholar.google.be/)
Isidore (http://www.rechercheisidore.fr)
Archives Ouvertes HaL (http://hal.archives-ouvertes.fr/)
Social Science Research Network http://ssrn.com/
L’édition électronique ouverte :http://leo.hypotheses.org/
Autres pistes que Google
61
METAMOTEURS
62
Les Métamoteurs de recherche
• Qu’est-ce que c’est? Les métamoteurs sont des
outils de recherche; qui, pour une même requête,
interrogent plusieurs moteurs de façon simultanée,
rapatrient les résultats, les synthétisent et vous
proposent un récapitulatif des réponses données.
Voici les 10 meta-moteurs les plus populaires :
InfoSpace
Info.com
dogpile
excite
search.com
WebCrawler.com
ixquick.com
mamma.com
yippy.com (Clusty auparavant)
MetaCrawler.com
…
Vous verrez que vous obtiendrez des résultats souvent
différents de ce que vous pouvez trouver avec votre moteur de
recherche habituel.
LES PRINCIPAUX META MOTEURS
63
64
65
COMPARATEURS de Moteurs
66
Tableau comparateur de moteurs très complet:
http://www.infopeople.org/search/chart.html
Tableau comparateur de moteurs très complet:
http://www.infopeople.org/search/chart.html
67
Tableau comparateur de moteurs très complet:
http://www.infopeople.org/search/chart.html
MOTEURS qui accèdent
au Web profond
68
macro-web
sites de médias et
d’institutions
web de
surface
web des profondeurs
meso-web
blogs et sites
personnels
micro-web
forums, microblogs,
plate-formes
de partage de
contenus
SIGNAUX
FORTS
SIGNAUX
FAIBLES
- - - -
⋁
⋀
la veille sur internet; comment aller à la pêche
de l’information ?
136
la veille sur internet; comment aller à la pêche
de l’information ?
Web invisible: 400 à 500 fois plus
Volumineux que le Web visible
69
Qu’est-ce que le WEB profond?
• Il s’agit de la partie du Web correspondant à
l’ensemble des documents (pages) Web qui ne
sont pas ou ne peuvent pas être indexés par
les outils de recherches traditionnels…les
moteurs ne « voient » pas les pages et ne
peuvent donc pas en indexer le contenu.
Intérêt du Web profond (invisible)
– Le Web profond contient des documents issus de banques de données publiques (banques, institutions de recherche, universités,…),
– Environ 95% du web invisible est accessible gratuitement,
– Le contenu émane de professionnels, il est d’une qualité généralement supérieure au Web visible.
– Les informations du web profond sont plus récentes.
• Pour plus d’infos :
http://www.educnet.education.fr/ecogest/ega/17/eureka/default.htm
Google Scholar donne accès au web profond.
70
REPERTOIRES SELECTIFS qui
accèdent au WEB PROFOND
• Ils recensent des ressources internet professionnelles
sélectionnées sur des critères qualitatifs.
Les sites sont choisis par des professionnels de l'information afin
de couvrir les domaines de l'université et de la recherche.
• Les ressources recensées sont de plusieurs types :
sites web de référence,
bases de données inaccéssibles aux moteurs généralistes
Ouvrages et journaux électroniques,
articles de qualité et études d'universitaires,
…
Les répertoires sélectifs
71
• Complete Planet: Portail de recherche par mots-clés (annuaire
thématique) sur plus de 70 000 bases de données ou moteurs de
recherche spécialisés.
Interface et graphisme très agréable,
possibilité de sauvegarder vos recherches,
moteur de recherche puissant.
Réalisé par la société BrightPlanet.
Completeplanet.com: un répertoire sélectif
72
Outils de Recherche sélective dans le Web Profond
• Les répertoires sélectifs: Completeplanet,
Directsearch
…
• Les portails verticaux (vortails) : Enfin.com,
Trade Worlds,
Indexa,
…
73
Moteurs de recherche
en temps réel
•Social Mention est l'un des moteurs de recherche en temps réel les
plus aboutis.
Il propose un filtre de recherche par types de sources (blogs, sites
web, images et vidéos, sites de bookmarking, réseaux sociaux,…).
Il est également doté d'un sélecteur, qui permet de personnaliser
votre recherche grâce à une liste à cocher recensant une
cinquantaine de sites sociaux: Facebook,
Twitter,
Linkedin,
Wikio,
Stumbleupon,
Wordpress,
Youtube,
Netvibes,
Blogpulse,
Slideshare, ...
SOCIALMENTION.Com
74
SOCIALMENTION.Com
• Ce moteur permet d'identifier les sujets les plus populaires
partagés sur Twitter par thèmes (sciences, technologies,
divertissements, etc.) sur une chronologie donnée
(dernières 24 heures, semaine écoulée).
Il permet d'identifier les sources les plus pertinentes, en
s'appuyant sur le nombre de RT (retweets) dont elles
bénéficient sur Twitter.
• ICEROCKET
Ce moteur est connecté aux flux de Twitter, Facebook:
En plus d'offrir une recherche par mots-clés sur les blogs, Il
permet d'écouter en temps réel les conversations liées à un
mot-clé, qui apparaissent dans un flux chronologique.
TWEETMEME
75
TWEETMEME
Outils de veille sur le web
76
La veille: vous avez appris à trouver de l’information de manière
ponctuelle, en fonction de vos besoins du moment.
Il est également intéressant de rester automatiquement au
courant de tout ce qui se passe dans un domaine précis.
Dans la vie privée, ce seront les résultats des matchs de foot,
l’évolution de la bourse, le prix de l’essence, les promotions
dans votre magasin habituel,…
Dans la vie professionnelle, chacun essaiera de rester au
courant des nouveautés dans sa profession (médecin,
comptable, agent immobilier,…). Et les chefs d’entreprises
voudront savoir tout ce qui se dit à propos de leurs produits et
services.
Découvrons quelques techniques de veille.
Les newsletters :
Beaucoup de sites vous proposent une newsletter qui
vous sera envoyée périodiquement par mail.
En principe, une newsletter ne peut être envoyée
qu’aux personnes qui en ont fait expressément la
demande. De plus, chaque newsletter doit comporter
des consignes pour se désabonner facilement.
77
Les flux RSS :
Les flux ou fils RSS utilisent une autre technique pour
diffuser l’information.
Les sites qui utilisent cette technique mettent toutes leurs
nouvelles informations à disposition du public, dans un
fichier immédiatement mis à jour.
Vous pouvez vous abonner à plusieurs fils RSS pour vous
tenir au courant des nouveautés.
Moteur de Flux RSS
Really Simple Syndication
RSS feed
Flux RSS
78
Un moteur de veille :
Nous avons vu que les newsletters et les flux RSS permettent
de recevoir très facilement les informations qui paraissent sur
vos sites et blogs préférés.
D’autres techniques de veille permettent d’aller encore plus
loin !
Vous voulez savoir tout ce qui se dit sur Internet à propos de
votre entreprise, de vos concurrents, de vos produits et
services ou… de vous-même ?
Dans ce cas, utilisez un moteur de veille, comme Wikio.
Recherche classique ou veille : Contrairement à Google qui essaie d’afficher tout d’abord les
résultats les plus intéressants, Wikio propose les documents qui
paraissent sur le Net dès leur mise en ligne.
Google explore l’ensemble du Web, tandis que Wikio se concentre
essentiellement sur les sites d’actualités et les blogs dont le contenu
change beaucoup plus souvent.
Les deux systèmes présentent bien sûr un intérêt. Google pour une
recherche ponctuelle, Wikio pour de la veille.
Grâce aux différentes techniques que nous venons de voir,
newsletters, flux RSS et moteurs de veille, … vous êtes maintenant
parés pour suivre l’actualité de près sur tous les sujets.
79
Nombreux « white-papers » sur la veille à télécharger librement :
http://www.digimind.fr/actus/actu/publications/white-papers
Australis Intelligence
http://www.australisintelligence.com/
Le cabinet de conseil en WebMarketing, Australis, a réalisé ce
véritable portail sur la veille et l’intelligence économique :
actualités, outils, méthodologies, guides pratiques,…
Outils de veille et d’alerte
http://www.msh-alpes.prd.fr/veille/
Outils de veille et d'alerte accessibles gratuitement sur internet
: guide pratique et méthodologique. Le but de ces pages est de
permettre une prise en main rapide d'outils de veille et d'alerte
accessibles gratuitement sur Internet.
EchosDoc : Veille
http://www.echosdoc.net/news.php?cat=1
Ce portail vous tient informé de toutes les nouveautés dans le
domaine de la veille : publications, nouveaux outils,
méthodologies,…
80
Alertes Google : Veille quotidienne par mail
http://www.linternaute.com/hightech/internet/google_astuces/servic
e/9.shtml
Un article qui présente le service Google Alertes dans le cadre de la
veille.
Assurez une veille professionnelle avec Google
http://www.commentcamarche.net/faq/sujet-14175-assurez-une-
veille-professionnelle-avec-google
Pour rester concurrentiel, il est indispensable d'être la pointe de l'actualité de son secteur professionnel. Pour vous faciliter cette veille professionnelle, Google dispose d'outils spécifiques : Google News, Google Alertes, iGoogle,…. On vous explique pourquoi et comment les utiliser dans le cadre de votre entreprise.
Info-clipper
http://www.info-clipper.com/
Un nouvel outil de veille vient de faire son apparition sur le net
avec info-clipper qui donne un accès à la recherche d'informations
légales et financières sur plus de 100 millions de sociétés
étrangères.
Les infostratèges
http://www.les-infostrateges.com/article/0606231/dossier-special-
veille
Un blog de qualité sur le thème de la maîtrise de l’information. Ce
blog a également publié plusieurs dossiers, dont un sur
la « Veille ».
81
Les informations que l’on trouve sur Internet sont-elles complètes et
fiables?
Selon le type de site que vous consultez (site d’entreprise, site
d’information, site officiel, site personnel,…), la quantité, la qualité
et la fiabilité des informations seront très variables.
Comment reconnaître un site d’information de qualité?
Google ne fait pas la distinction entre les différents types de sites. A
vous de vérifier si l’éditeur du site est bien un organisme ou une
personne de confiance et non une firme commerciale.
On appelle « sites de référence », les sites des services publics ou de
certains organismes qui mettent une information extrêmement
détaillée et complète à disposition du public.
Qu’appelle-t-on « site de référence »?
On appelle « sites de référence », les sites des services publics
ou de certains organismes qui mettent une information
détaillée et fiable à disposition du public.
Les blogs et sites personnels sont-ils fiables?
On trouve des blogs et sites personnels de grande qualité,
réalisés par des experts, mais aussi de véritables arnaques.
82
Je trouve une page qui n’existe pas, est-ce normal ?
Le Web évolue très vite, la page que vous cherchiez a peut-
être disparu ou déménagé. Dans ce cas vous obtiendrez une
page comme celle-ci http://www.coca-cola.fr/error404.html.
Faut-il croire toutes les informations qui circulent sur
Internet ?
De nombreuses rumeurs et canulars circulent sur Internet.
Si une information vous semble « bizarre » ou « exagérée »,
vérifiez sur un site tel que http://www.hoaxbuster.com.
83
• Digimind est la solution de veille stratégique leader sur le marché. Elle permet
à ses utilisateurs de maximiser la connaissance de leur environnement.
• Digimind est destinée autant à ceux qui font et organisent la veille
(documentalistes, responsables de la veille) qu’à ceux qui utilisent ses résultats
(comités de direction, responsables marketing, commerciaux, chercheurs, etc).
• Digimind aide ses utilisateurs à répondre aux questions suivantes
– Comment évoluent les offres tarifaires de mes principaux concurrents ?
– Que pensent les consommateurs de mon produit ?
– Quelles sont les sociétés qui travaillent sur cette nouvelle technologie ?
– Quelles fusions/acquisitions ont eu lieu sur ce secteur ?
– Comment risque d’évoluer la réglementation dans mon domaine?
– Quels sont les leaders d’opinion réellement influents dans cette région?
…
Outils : digimind v.9
http://www.digimind.fr/produits/digimind-evolution)
84
Outils : digimind v.9
http://www.digimind.fr/produits/digimind-evolution)
La société Digimind
propose aux
entreprises des outils
(payants) pour
effectuer une veille
stratégique.
On trouve également
sur leur site des
explications claires et
détaillées ainsi que
des dossiers complets
sur les différents
types de veille et leur
utilité dans différents
secteurs.
Sélection d’outils à télécharger – source : http://www.cybervigie.com/agents_veille.php3
85
MOZBOT . COM : découvrez qui est derrière le site…
MOZBOT . COM : découvrez qui est derrière le site…
171
86
• Vous pouvez aussi accéder à l’historique du site : les pages en
cache et aux dates de modifications du site
MOZBOT . COM : découvrez qui est derrière le site… (suite)
172
SURVEILLER et SUIVRE LES CHANGEMENTS
• Suivre les modifications de pages web (follow that page) :
Follow that Page :
Permet de surveiller les modifications apportées à une page Web.
Outre sa gratuité, l'outil est disponible en ligne et ne permet donc pas d'identifier celui qui surveille la page. Follow that Page http://www.followthatpage.com/
173
87
ORGANISER LA RECOLTE D’INFORMATIONS
• Servez-vous des « favoris » ou « bookmark » en créant des fichiers thématiques de recherche,
• Abonnez-vous aux newsletters gratuites, à un blog spécialisé,…
• Vous abonnez à : bulletins-electroniques.com - Veille Technologique Internationale:
http://emailix.bulletins-electroniques.com
• Si vous vous intéressez à un domaine en pleine mutation, pensez aux fils RSS (really simple syndication).
174
• RSS sur n'importe quelle page
• Page2RSS est un moyen tout simple et immédiat pour surveiller n'importe quelle page n'offrant pas de fil RSS. Il suffit de coller l'adresse URL de la page à surveiller et de cliquer sur "to RSS". Et pour encore plus de simplicité, Page2RSS propose un bouton à ajouter à la barre de son navigateur. Page2RSS http://page2rss.com/ Langue: anglais Accès: gratuit
ORGANISER LA RECOLTE D’INFORMATIONS
175
88
EXEMPLE
176
Un site pour vous aider…et pour personnaliser vos pages (http://www.netvibes.com/docvibes)
177
89
Créer une base de données documentaire gratuite
• Avec Google Mail (Gmail), il est très simple de se créer une base de données documentaire gratuite.
• Première étape, créer une nouvelle adresse Gmail (http://mail.google.com/) en choisissant un nom caractéristique. Cette nouvelle adresse sera consacrée exclusivement à alimenter la base de données. Chaque fois qu'un article ou une partie de document mérite d‘être conservée, sélectionner ce qui vous intéresse et le coller dans un message en y ajoutant la source et l'adresse de la page. Indiquer dans le champ "subject" l'information nécessaire, et envoyer le tout à l'adresse créée. Gmail permet de classer les documents acquis grâce à des libellés. Leur emploi est très bien expliqué dans l'aide (https://mail.google.com/support/bin/topic.py?topic=12845). Ensuite, utiliser la puissance de recherche de Google pour chercher dans la base de données ainsi créée.
(source : Brainsfeed.com) 178
VIBES
90
Murrey Atkins Library
• un annuaire de ressources électroniques,
• domaine du commerce.
• Certaines sources sont payantes,
J. Murrey Atkins Library :
http://library.uncc.edu/electronic/
91
recherches sur l’information
• Hyperthèque, des ressources pour chercheurs
collection de liens sur l'information mise en ligne par l'Institut des Sciences de l'Homme.
On y trouve des listes de moteurs et d'annuaires, des dictionnaires, des bases de données, des liens vers des sites de droit lié à l'information, etc. Hyperthèque http://sid.ish-lyon.cnrs.fr/hypertheque/hypertheque.php
Les sciences humaines : In-Extenso
• In-Extenso est un remarquable moteur de recherche en sciences humaines et sociales.
• Les moteurs de recherche généralistes sont très mal adaptés à des recherches sectorielles précises.
• In-Extenso http://www.in-extenso.org/ Langue: français
92
Marketing
• Annuaire de blogs en marketing
Cet annuaire regroupe plus de 100 blogs consacrés au marketing, répartis dans 313 catégories. Blog Business http://www.iblogbusiness.com/ Langue: anglais
Pour aller plus loin dans la veille… http://www.netvibes.com/docvibes
185
93
MANTA: bases de données professionnelles
• Manta permet de chercher de l'information sur les entreprises dans plusieurs bases de données (Dun & Bradstreet, Datamonitor, ICON et Snapdata).
• Après avoir tapé le nom d'une entreprise et choisi la base de données dans laquelle on souhaite chercher, l'écran affiche un certain nombre de résultats et le prix de chaque document trouvé. Manta http://www.manta.com/ Langue: anglais Accès: payant
Les agents intélligets
94
Les agents intelligents
• « Objet utilisant les techniques de l'intelligence artificielle : il adapte son comportement à son environnement et en mémorisant ses expériences, se comporte comme un sous-système capable d'apprentissage
• il enrichit le système qui l'utilise en ajoutant, au cours du temps, des fonctions automatiques de traitement, de contrôle, de mémorisation ou de transfert d'information ».
L'association française de normalisation (AFNOR)
Les Agents Intelligents
• Ils sont capables de remplir et d’automatiser des tâches à la place de l'utilisateur. Ils suivent à la lettre la définition du terme agent : « entité agissant pour le compte de quelqu'un ».
Spécificités des agents intelligents
En théorie, un agent intelligent contient les éléments suivants :
• Une base de connaissance dynamique
• Un moteur d'inférence, lui permettant de prendre des décisions
• Un système d'acquisition de nouvelles connaissances
• Un mécanisme d'apprentissage.
site http://www.agentland.com/
C’est un portail d’agents intelligents comportant plus de 450 agents référencés et évalués. Ils sont pour la plupart téléchargeables depuis le site.
95
Les Agents Intelligents : Copernic Agent
Devon Agent
• DEVON agent :
Cet outil de recherche sur Internet voit ses
fonctionnalités enrichies par le concept « d’espace
de travail », ce dernier permettant par exemple la
mémorisation de l’ensemble des pages web
ouvertes.
• DEVON agent [2.2 – 5.9 Mo - UB - FR] est vendu
49,95 euros mais une version de démonstration
est téléchargeable gratuitement (valable 60h).