quels outils pour quelles recherches ? panorama des outils du web
DESCRIPTION
Mise à jour du support du stage de l'URFIST de Rennes, animé par Marie-Laure Malingre et Alexandre Serres, le 13 mars 2012.TRANSCRIPT
Quels outils pour quelles recherches ?
Panorama des outils de recherche du web
Stage URFIST de Rennes13 mars 2012
Marie-Laure Malingre Alexandre Serres
URFIST de Rennes, 2012 2
PLAN 1/ Introduction : diversité et typologies des
moteurs de recherche 2/ Recherche de blogs 3/ Recherche d’actualités 4/ Chercher dans Twitter 5/ Moteurs en temps réel 6/ Recherche de livres 7/ Recherches multimédias : images, vidéos, sons,
fichiers… 8/ Recherche de signets 9/ Recherche sur des personnes 10/ Personnaliser son moteur 11/ Pour aller plus loin : comment s’informer sur
les outils de recherche
1. Introduction : enjeux, diversité et typologies des moteurs de recherche
Evolution des moteurs de recherche Algorithme vs graphe social
« Ils suscitent de vives interrogations, notamment dans leur capacité à rendre indexables des informations relevant indistinctement des sphères publiques , privées et intimes des contenus disponibles en ligne » (O. Ertzscheid)
Nouveaux usages, nouveaux processus Développement des réseaux sociaux Confusion des pratiques informationnelles Recherche universelle Données dans les nuages Personnalisation, communautarisation, recommandation
URFIST de Rennes, 2012 3
URFIST de Rennes, 2012 4
Source image : O. Ertzscheid
- Espaces relevant du privé rendus indexables- Perméabilité et communication croissante entre les espaces
URFIST de Rennes, 2012 5
1. Introduction : enjeux, diversité et typologies des moteurs de recherche
Comment les distinguer ? > type de ressources collectées
Distinction principale : Moteurs généralistes : G., Yahoo, Exalead, Ask, Bing
caractéristique historique des grands moteurs : collecte et indexation de tous les types de ressources
Moteurs spécialisés : Modules spécialisés à l’intérieur des moteurs
généralistes Infinité des types de spécialisations Multiplicité des outils
URFIST de Rennes, 2012 6
1. Introduction : enjeux, diversité et typologies des moteurs de recherche
Typologie des spécialisations : Selon les ressources internet :
Moteurs de blogs, de tweets, de réseaux sociaux… Selon la nature du contenu :
Moteurs d’actualité, de livres, de personnes… Selon la nature du média :
Moteurs d’images, de vidéos, de podcasts, de photos…
Autres critères possibles : langue, géographie, domaine thématique…et maintenant
dimension temporelle, accès au contenu
Critère retenu pour l’exploration : l’usage La recherche des actualités, de l’information « fraîche » La recherche de livres, d’images… (selon le support) La recherche de personnes
URFIST de Rennes, 2012 7
2. Recherche sur les blogs
Méthodologie de recherche : Exploiter la structure des blogs :
Recherche instantanée : derniers billets Recherche temporelle : accès aux archives Recherche « mots-clés » : moteur de recherche Recherche « catégorielle » : consultation des
catégories Exploration de la blogroll
Exploiter les moteurs de recherche : Affiner sur Google, Exalead…
URFIST de Rennes, 2012 8
2. Recherche sur les blogs
Combiner diverses méthodes de recherche : Navigation :
Dans les blogrolls Dans les annuaires Dans les catégories
Affinement : sur un moteur de recherche
Requête : sur un outil spécialisé
A noter : fin de Wikio et BlogPulse
URFIST de Rennes, 2012 9
2. Trouver des blogs
La navigation : dans la blogroll d'un blog :
UrfistInfo dans un annuaire généraliste :
Open Directory dans des listes de blogs :
Blogs scientifiques : Academic blogs in French
Blogs de journalisme : Voir 50 Best Blogs for Journalism Students
dans une plateforme de blogs : Hypothèses
Une diversité d'usages et de situations
• carnet de chercheur : culture et politique arabeso http://cpa.hypotheses.org/
• carnet de revue : vertigoo http://vertigo.hypotheses.org/
• carnet méthodologique : quantio http://quanti.hypotheses.org/
• carnet de séminaire : midaso http://midas.hypotheses.org/
• carnet de fouilles : champs libreso http://champslibres.hypotheses.org/
• carnet de projet de recherche : cinémarchiveso http://cinemarchives.hypotheses.org/
• carnet de doctorants : polit'bistroo http://politbistro.hypotheses.org/
• carnet de phonothécaire : les carnets de la phonothèqueo http://phonotheque.hypotheses.org/
• carnet d'archives : le carnet d’images de l’Ifpoo http://ifpoimages.hypotheses.org/
2. Trouver des blogs : les annuaires de blogs
BlogTrafic : Annuaire de blogs francophones Créé en 2005 Moteur interne Orienté grand-public
URFIST de Rennes, 2012
URFIST de Rennes, 2012 12
2. Trouver des billets de blogs
Affinement sur les moteurs de recherche : Après une requête
: sur Google,
l’option Blogs Sur Exalead,
l’option Type de site :
URFIST de Rennes, 2012 13
2. Recherche sur les blogs
Utiliser des moteurs spécialisés : Technorati
Premier moteur de recherche de blogs Recherche dans les blogs ou dans les posts Recherche dans l’annuaire Recherche par tags Mises à jour sur Facebook, Twitter, via le mail ou le
fil RSS Indicateur d’influence du blog (“authority”) Tendances de la blogosphère “Top 100” des blogs
URFIST de Rennes, 2012 14
2. Recherche sur les blogs BlogSearch
Lancé en sept. 2005 Indexation en temps réel Fonctionnalités de recherche :
Les mêmes que la recherche avancée de Google Régression à signaler :
Fin des fonctionnalités de recherche sur le titre du blog, l’adresse, le titre d’un billet, l’auteur, les dates
Affinement possible par les Options de recherche Intérêt des périodes
Conservation des anciens billets : Recherche possible sur les anciens billets en
précisant la date
2. Recherche sur les blogs :Yippy Blogs
Module spécialisé du métamoteur Yippy Yippy : a succédé en 2010 à Clusty,
développé par Vivisimo Fonctionnalités intéressantes :
Clustérisation : catégorisation des résultats dans des rubriques thématiques
Possibilités d’affinement Aperçu graphique
URFIST de Rennes, 2012
URFIST de Rennes, 2012 16
3. Recherche d’actualités :moteurs d’actualités
Modules ou services proposés par les outils de recherche
Agrégation de multiples sources d’actualité : Presse, blogs, sites web… Revues de presse automatisées
Services gratuits : alertes…
Nombreux moteurs d’actualité : Précurseur : Google News Modules spécialisés : Yahoo News,
Concurrence aiguë, enjeux économiques importants Problèmes et conflits juridiques
URFIST de Rennes, 2012 17
3. Recherche d’actualités :moteurs d’actualités
Google News (Actualités) : Créé à la suite du 11/09/01 Lancé en mars 2002 Diffusion en continu d’infos sur l’actualité Sélection de 25 000 sources d’information (avec les
archives) + de 500 sources sur version française
Plus de 40 versions nationales de Google News Automatisation complète Collecte et analyse de chaque source par un robot spécial Classement automatique des informations dans des
rubriques prédéfinies Nombreux conflits :
Avec les agences de presse, les journaux...
3. Recherche d’actualités :moteurs d’actualités
Google News : 10 critères principaux de pertinence Source : Actualités du site Abondance ( + 10 critères négatifs)
1. L'autorité d'un site sur un sujet précis.2. La présence des mots clés demandés dans le titre de la
page.3. L'autorité du nom de domaine en termes SEO.4. Les partages sociaux.5. Le fait d'être parmi les premiers à publier un article sur le
sujet.6. Le nombre de citations par d'autres sites.7. Le fait que l'article soit unique et original.8. Le taux de clics dans les résultats de Google News.9. La qualité du contenu.10. L'utilisation d'un Sitemap spécifique de Google NewsURFIST de Rennes, 2012
3. Recherche d’actualités :Google News
Les fonctionnalités : La personnalisation
: Choix dans l’affichage
des rubriques Création de rubriques
personnelles Recherches
d’informations locales
La veille : Syndication de fils RSS Abonnement gratuit aux
alertes : par thèmes...
URFIST de Rennes, 2012
3. Recherche d’actualités :Google News
La recherche sur les archives : Sur Google News :
Archives de presse : http://news.google.com/newspapers
Lancé en 2006, généralisé en 2008 Recherche dans 200 ans d’archives de
journaux Mais 2011 : arrêt du projet de numérisation
des archives Actuellement, restent disponibles : 3,5 millions
de publications issus de plus de 2000 journaux dans le monde, remontant jusqu’à 1752
URFIST de Rennes, 2012
URFIST de Rennes, 2012 21
3. Recherche d’actualités :recherche avancée sur Google Actualités
Menu déroulant pour la recherche avancée depuis la fenêtre de saisiede la recherche simple
URFIST de Rennes, 2012 22
3. Recherche d’actualités : recherche avancée sur Google Actualités
Syntaxe de recherche : intitle: et allintitle: : dans le titre des articles intext: et allintext: : dans le texte des articles inurl: : dans un site particulier source: : sur une source précise
Source:Libération location: : dans un pays précis
Location:Algérie + date d’ajout dans Google Actualités
Option prédéfinie, archives ou intervalle personnalisé
URFIST de Rennes, 2012 23
3. Recherche d’actualités :moteurs d’actualités Anglophones : Yahoo News Rocket News Digg Topix : 2004, agrégateur
d’actualités localisées
Européens : Eufeeds / European
Journalism Centre Pickanews, moteur
plurimedia sur 50 000 sources d’information en Europe (sur un nom, une marque, une société)
Francophones : Yahoo France Actualit
és
Outils de visualisation :
Nuages de tags à partir de Google News, sur les termes de l'actualité :
Google News Cloud
Pearltree « Médias France » Exemple : Webplanete news, l’actualité en temps réel sur 811 sources d’information francophones
URFIST de Rennes, 2012 24
3. Outils d’analyse de l’actualité : Europe Media Monitor
Europe Media Monitor : portails d’information du Joint Research Center (JRC) de la Commission Européenne
Collecte, analyse, cartographie… de très nombreuses sources d’information, en 43 langues
Trois portails complémentaires : NewsBrief : actualité en temps réel NewsExplorer : analyse de l’information MediSys : information médicale + EMM-Labs
URFIST de Rennes, 2012 25
3. Outils d’analyse de l’actualité : Europe Media Monitor
NewsBrief : l’information en temps réel Collecte sur + 4000 sites :
1600 portails d’information, 20 flux d’actualités commerciales, sites spécialisés ; en 43 langues
Surveillance quotidienne : Mises à jour toutes les 10 mns
Classement des informations Graphique des 10 derniers événements marquants Clusterisation : par thèmes, par Directions Générales de
l’UE Possibilité d’abonnements RSS, mais pas par rubriques
URFIST de Rennes, 2012 26
3. Outils d’analyse de l’actualité : Europe Media Monitor
NewsExplorer : analyse multilingue Analyse de l’information une fois par jour
Résumé des 20 faits marquants 19 langues
Nombreuses fonctionnalités : Carte des lieux de l’actualité Analyse des actualités : tous les articles sur un sujet… Chronologie des événements Fiches sur personnalités Visualisation des relations entre personnes Recherche rétrospective sur les événements majeurs
d’un pays
3. Outils d’analyse de l’actualité : Silobreaker
Silobreaker : Outil d’analyse en temps réel de l’actualité Possibilité de requêtes avancées Analyse des relations (Network) entre des
entités nommées (personnes, pays, villes…) : Cartographie des relations de co-occurrence entre
entités Analyse du volume de contenus
Analyse de tendances (Trends) : Nombre d’articles sur un sujet, une entité…
Analyse des points chauds (Hot Spots)
Voir article de C. DeschampsURFIST de Rennes, 2012
3. Recherches d’actualités : Annuaires de la presse et des médias
Guide Presse : annuaire de la presse francophone en ligne
Giga-Presse : Annuaire francophone de la presse en ligne
664 journaux Journalism UK :
répertoire de liens utiles aux journalistes britanniques
Newspapermap.com : annuaire cartographique de la presse
mondiale Plus de 10 000 journaux géolocalisés
URFIST de Rennes, 2012
3. Recherches d’actualités : portails spécialisés sur la presse
Categorynet.com (portail de la presse et des médias) : Créé en 1998 par Greg Manset ; entreprise de
presse et réseau de journalistes Comprend un annuaire de liens
PQR : Portail du Syndicat de la PQR Toutes les informations sur la PQR
Info.presse.fr : Portail commercial tous publics Vente d’abonnements Plus de 1000 titres de presse
URFIST de Rennes, 2012
URFIST de Rennes, 2012 30
4. Recherche sur Twitter Quelques données
Source: D. Bourque
4. Twitter : Explosion du phénomène
En février 2012, d’après une étude de Infographic Labs :
Plus de 465 millions d’utilisateurs actifs chaque mois
11 comptes crées chaque seconde, 1 million de comptes ajoutés chaque jour
175 millions de tweets par jour 64% des utilisateurs qui y accèdent par l’interface
web, 16% par l’application mobile et 10% par un client tiers 69% des personnes qui décident de suivre d’autres
personnes à la suite de suggestion d’amis (d’après Geeks and Com)
URFIST de Rennes, 2012
URFIST de Rennes, 2012 32
4. Recherche sur Twitter Quelques données
Twitter comme nouveau réseau d’information et de veille
Changement du paysage de la recherche d’information : en juillet 2010 : 800 millions de requêtes
quotidiennes, 24 milliards par mois Twitter 2ème moteur de recherche mondial
derrière Google ! (source : Abondance)
URFIST de Rennes, 2012 33
4. Recherche sur Twitter
Méthodes de recherche des tweets :
Moteur de Twitter : Twitter Search Affinement sur les moteurs
généralistes Moteurs de recherche spécialisés, en
temps réel
34
4. Recherche sur Twitter : Twitter Search
Moteur de Twitter, racheté en 2008
Nombreuses fonctionnalités :
Interface de recherche booléenne
Recherche sur les hashtags
Recherche sur un utilisateur
Recherche géographique
Recherche sur les smileys
URFIST de Rennes, 2012
URFIST de Rennes, 2012 35
4. Recherche sur Twitter :Topsy
Recherches booléennes
Recherche sur un site, un utilisateur
Classement par pertinence, par date
Recherche sur anciens tweets
URFIST de Rennes, 2012 36
4. Recherche sur Twitter :Topsy
Plusieurs possibilités de filtrage des résultats : Par périodes de
publication Par types de
supports Par « Experts » :
utilisateurs ayant le plus cité le mot-clé
URFIST de Rennes, 2012 37
4. Recherche sur Twitter et le microblogging
Indexation des tweets par les moteurs classiques : Mais fin du partenariat entre Twitter et
Google (en juillet 2011) Partenariat avec Bing (version américaine)
En France, indexation des tweets par Yahoo, mais seulement sur certains sujets :
38URFIST de Rennes, 2012 38
4. Recherche sur Twitter et le microblogging
Autres outils de recherche spécialisés :
TwitterPowerSearch :Moteur de recherche en temps réel :
Derniers tweets postés Présentation des résultats
de recherche en widgets Outil de veille
TweetGrid : Tableau de recherche de
tweets avec nombreuses fonctionnalités
Recherches possibles sur 9 critères
Recherche avancée Affichage personnalisé en
colonnes Outil en temps réel Sauvegarde de la veille
Stickytter : outil de veille en temps
réel
URFIST de Rennes, 2012 39
5. Moteurs en temps réel : caractéristiques
Collecte, indexation, ou recherche en temps réel ?
Distinguer par ex. de la recherche instantanée : Google Instant, Yahoo / Réactualisation très rapide de l’index
Essor des moteurs en temps réel, avec : Syndication de contenus, News des médias, Réseaux
sociaux, Twitter et micro-blogging
Nombreux moteurs autonomes, intervention des géants Google, Yahoo, Bing
Demande d’instantanéité : Mais effets pervers du temps réel
URFIST de Rennes, 2012 40
5. Moteurs en temps réel : caractéristiques
Principaux critères, selon Comparatif de 14 moteurs, de C. Deschamps :
Nombre et type de sources collectées (« multimoteurs »)
Représentation graphique des données : Graphiques de tendances…
Possibilité d’abonnement aux flux RSS par requêtes Défilement de l’information en temps réel
URFIST de Rennes, 2012 41
5. Moteurs en temps réel :intérêt
Suivi de l’actualité en temps réel : Exemple sur SocialMention, Samepoint, 48ers…
Suivi d’un thème sur Twitter, les réseaux sociaux…
Nouveaux outils de veille sur un sujet, une personne…
Voir Stickytter : outil de veille en temps réel
Analyse, représentation de l’information
URFIST de Rennes, 2012 42
5. Moteurs en temps réel : exemple de Social Mention Search
Moteur social de recherche en temps réel, veille sur les réseaux sociaux
Diversité et nombre de sources indexées : Blogs Microblogging Commentaires de blogs Plateformes de partage de signets Sites de news généralistes Sites d’événements Images / Vidéos / Audio Questions-réponses Réseaux sociaux
URFIST de Rennes, 2012 43
5. Moteurs en temps réel : exemple de Social Mention Search
Interface de recherche Interface de recherche simple
Filtrage possible par les catégories de sources
Filtrage par les sources elles-mêmes
URFIST de Rennes, 2011 44
5. Moteurs en temps réel : exemple de Social Mention Search
Interface de recherche Interface de recherche avancée
Affichée à la suite d’une première requête
URFIST de Rennes, 2012 45
5. Moteurs en temps réel : exemple de Social Mention Search
Analyse des résultats (Mervet’s blog)
Strength / Force = « échelle qui définit la probabilité que l’on parle de la marque. Cette échelle est calculée selon le nombre des mentions qui ont été faites, divisé par le nombre de mentions possibles totales. »
Sentiment : Opinion positive / négative / neutralité =
« la proportion des mentions qui sont généralement positives par rapport à celles qui sont généralement négatives »
Passion = « C’est la probabilité pour que les individus parlant de votre marque le fassent à plusieurs reprises »
Reach = la portée, mesure de l’influence
« le nombre d’auteurs uniques faisant référence à votre marque divisée par le nombre total de mentions »
URFIST de Rennes, 2012 46
5. Moteurs en temps réel : exemple de Social Mention Search
Statistiques Top keywords
Top Users
Top hashtags
Sources
URFIST de Rennes, 2012 47
5. Moteurs en temps réel : exemple de Social Mention Search
Services complémentaires
Alerte / daily social media alert / Email Alert / Flux RSS
Export Excel
Boîte de recherche / navigateur
Real time buzz widget Feedback
URFIST de Rennes, 2012 48
5. Moteurs en temps réel : exemple de Samepoint
Recherche dans :
Sites d’actualités, News Avis négatifs des
utilisateurs (« Negative Comment Search »)
Comptes rendus Instances officielles (USA) Profils (?) Instances militaires Pages des sites de réseaux
sociaux Blogs Vidéos Microblogging
Robot : Recherche avec Bing
« Social Tone »
Flux RSS de la requête, Tweet
Related Terms
5. Recherche sur les réseaux sociaux
Open Status Search : (ex-Open Facebook Search) Recherche dans les conversations publiques
sur Facebook Pas de compte Facebook nécessaire
URFIST de Rennes, 2012
6. Recherche de livres
Une multitude d’outils dédiés aux livres Recherche de références de livres Recherche dans le texte intégral de
livres Comparateur de prix de livres Recherche spécialisée
Livres anciens / rares Livres audios Ebooks … URFIST de Rennes, 2012
6. Recherche de livres
Google Livres Projet de bibliothèque
numérique démarré en 2004
Projet éditeurs Projets bibliothèques
Processus OCR pour recherche dans le texte intégral
Combien de livres ? Pas de statistique Google Estimations fin 2009 (voir
Workshop Google Livres) : Environ 10 millions de livres, dont 20% libres de droits
Algorithme de recherche de Google Livres
Différent du Page Rank de Google Web / spécificité du corpus et des profils de recherche diversifiés
Prise en compte d’une centaine de « signaux » :
Fréquence des recherches
Ventes de livres récentes Nombre de bibliothèques
qui détiennent le titre Combien de fois un livre
ancien a été réimprimé
Lancement de Google Play Store
URFIST de Rennes, 2012
URFIST de Rennes, 2011 52
6. Recherche de livres
Google Livres Recherche avancée
avec possibilité de filtrage des résultats
URFIST de Rennes, 2012 53
6. Recherche de livres
Consultation des livres en ligne Selon les droits attachés, accès à un aperçu du livre, à des
extraits ou au texte intégral
Pour des ouvrages du domaine public, plusieurs possibilités :
Afficher la publication en entier / Télécharger le pdf ou le textebrut / Lire le livre avec GooglePlay
Informations complémentaires “A propos de ce livre” : résumé, aperçu, avis des
internautes, livres sur des sujets connexes, pages sélectionnées, table des matières, autres éditions, expressions et termes fréquents, fréquemment cités, informations bibliographiques et possibilités d’export
Accès au livre Bibliothèque ou librairie
URFIST de Rennes, 2012 54
6. Recherche de livres
Affichage du livre en entier
(Source Google Livres)
6. Recherche de livres
URFIST de Rennes, 2012 55
Affichage d’extraits
Source Google Livres
URFIST de Rennes, 2012 56
6. Recherche de livres
Exploiter le document et gérer sa bibliothèque à partir du compte personnel Google
Ajouter à sa bibliothèque (« Mes livres sur Google Play »)
Visibilité publique ou privée Afficher sa bibliothèque, créer une étagère, rechercher
dans sa bibliothèque Naviguer dans l’ouvrage Evaluer et commenter les ouvrages Créer un lien dans un message instantané ou un email Consulter les infos sur l’ouvrage Se procurer l’ouvrage Rechercher dans l’ouvrage
URFIST de Rennes, 2012 57
6. Recherche de livres Les questions autour de Google
Livres
Google Livres et les éditeurs La question de l’accès au texte et des
droits Le problème de fiabilité et de rigueur
de la description bibliographique Les erreurs de Google Livres recensées
sur le Nouvel Observateur La stratégie commerciale
URFIST de Rennes, 2012 58
6. Recherche de livres
Quelques autres bibliothèque numériques permettant la recherche de livres et dans les livres : Gallica Internet Archive Hathitrust Europeana
Spécialisées : par ex. IntraText Digital Library (avec fonctions d’analyse lexicométrique)
URFIST de Rennes, 2012 5959
6. Recherche de livres
LibraryThing : Bibliothèque partagée, créée par Tim Spalding
(ingénieur web) Utilisation d’Amazon et de catalogues de
bibliothèques en libre accès Plate-forme de partage et de recommandations
de lectures : accès aux références des ouvrages Exemple : UrfistRennes
Autres exemples de plateformes : Babelio, Libfly
URFIST de Rennes, 2012 6060
6. Recherche de livres
Autres ressources pour la recherche de livres : Des portails commerciaux de
signalement et vente de livres Librairie en ligne Amazon pour les livres anciens, rares : AbeBooks
Des portails participatifs Open Library (dont ebooks)
Des moteurs / plateformes de recherche d’ebooks ou de livres audio
Neotake, Ebibli.fr Audiocite
Recherche par ISBN OpenISBN, isbnlib
URFIST de Rennes, 2012 6161
7. Recherche multimédia7.1 Recherche d’images
Les modules images des moteurs généralistes :
Exalead Images, Yahoo Images, Google Images Les moteurs et plateformes spécialisés
Picsearch Flickr :
recherche d’images sous CC, recherche de screencasts
Critères de filtrage
Options avancées : taille de l’imageL’exemple d’EXALED
7. Recherche multimédia7.1 Recherche d’images similaires
Fonctions : retrouver des images proches,
différentes versions d’une image, toutes les pages ayant publié une image, repérer les plagiats, identifier des lieux, des objets, etc.
Principes de recherche : par l’URL d’une image sur l’image elle-même, par
téléchargement du fichier Moteurs de recherche d’images
inversée : TinEye :
A noter : comparaison d’images
7. Recherche multimédia7.1 Recherche d’images similaires
Sur Google Images, depuis juin 2011
Cliquer sur :
URFIST de Rennes, 2012
Recherche par URLOu sur l’image elle-même
URFIST de Rennes, 2012 6464
7. Recherche multimédia 7.2 Recherche de vidéos, screencasts
Modules vidéos issus ou dérivés des moteurs généralistes : Exalead Videos, Voxalead News
Recherche dans YouTube
Recherche dans Flickr : filtrage dans la recherche avancée sur les vidéos, screencasts
Recherche dans Blinkx Recherche en texte intégral sur des émissions de télé
et de radio grâce à un système de reconnaissance vocale
URFIST de Rennes, 2012 65
7. Recherche multimédia 7.3 Recherche de musiques, de sons, de podcasts… Recherche de musiques :
Midomi, MuMa, des Labs d’Exalead
Recherche de sons : FindSounds, Freesound.org
Recherche de podcasts : Répertoire de podcasts francophones : Podcasters.fr Autres : Digital Podcast, Podcast Directory.com
Recherche de média audio sur Internet Archive
Un annuaire d’outils de recherche : Liens Utiles. Musique.Recherche de fichiers podcasts
URFIST de Rennes, 2012 66
7.4 Recherche de fichiers : diapositives, PDF, doc…
Recherche tous types de fichiers : FindFiles.net
Plus de 378 millions de fichiers Affinement par types de fichiers :
Recherche de diapositives : SlideFinder SlideShare
Recherche de fichiers PDF : PDFGeni.com
8. Recherche de signets
Les folksonomies comme alternative aux moteurs de recherche / à la googlisation ? Indexation de ressources par les
usagers Tags
Marque-pages sociaux Recherche sociale
URFIST de Rennes, 2011 68
8. Recherche de signets
Moteurs de recherche des plateformes de signets
Un bookmark
Des tags
Recherche dans les bookmarks et dans les tags
Ex : Recherche de signetsdans Diigo
URFIST de Rennes, 2011 69
8. Recherche de signets
Recherche de signets dans Delicious
Un signet
Des tags
Chercher dans les signets
Tags proches
Recherche par tag
URFIST de Rennes, 2012 70
8. Recherche de signets
Blekko : « Slashtag the web » Plateforme de partage et moteur participatif
qui permet de créer des bouquets de sites web thématiques appelés slashtags
Déclaration des droits de recherche sur le web
Sur le site de Blekko En français…
Concurrence de Google ? Yandex investit 30 millions de $ dans Blekko
URFIST de Rennes, 2012 71
9. Recherche sur des personnes
Explosion des recherches sur les personnes : En 2007,
30 % des requêtes sur le web ! Surveillance de la e-réputation Recherches sur les « people » ou
n’importe qui Recherches pour les recrutements Vérification d’un auteur
URFIST de Rennes, 2012 72
9. Recherche sur des personnes
Méthodologies : Recherche classique par mots-clés sur
un moteur généraliste Requête « Nom prénom » Pour les personnes connues, associer biographie
OR biography Recherche sur les réseaux sociaux :
Facebook, LinkedIn Recherche sur des métamoteurs
spécialisés
URFIST de Rennes, 2012 73
9. Recherche sur des personnes
Moteurs et outils spécialisés :
Principe : agrégation de nombreuses sources (moteurs,
blogs, annuaires, réseaux sociaux…) contenant des traces sur ou laissées par une personne
Nombreux outils : Liste de Denis Szalkowski :
Moteurs de recherche de personnes Liste de Mathieu Denel :
Outils de recherche et d’identification de personnes
Des extensions Firefox : Who is this person ?
URFIST de Rennes, 2012 74
9. Recherche sur des personnes : 123People
Lancé en 2008 ; moteur d’origine autrichienne, racheté par PagesJaunes en mars 2010
Disponible en 11 langues Agrégation des données publiques d’un individu Classement par types d’informations :
Images, Adresses, n° de téléphone, Blogs, Liens, Biographies, Documents, Vidéos, Nuage de tags, Personnes liées, Actualités…
Problème de l’utilisation des données personnelles :
Agrégation intrusive de données personnelles Beaucoup de « bruit » documentaire Problèmes pour l’effacement de ses données
URFIST de Rennes, 2012 75
9. Recherche sur des
personnes : Pipl
Disponible seulement en anglais
Possibilité de recherche sur un pays précis
Classement des résultats en catégories lisibles
URFIST de Rennes, 2012 76
9. Recherche sur des personnes : WebMii
Lancé en 2009 Moteur très puissant sur la présence numérique
Agrège beaucoup d’informations disponibles sur une personne donnée
Recherche dans plusieurs sources : Google, Yahoo, Bing, LinkedIn, Copains d’Avant,
Viadéo… Disponible en trois langues : français, anglais,
espagnol Possibilité de recherche sur un pays précis Classement des résultats en catégories lisibles
9. Recherche sur des personnes : WebMii
Résultats : Les mots-clés associés à la personne Les photos
Google Images Les sites web :
> Bing Les billets de blogs :
> Google Blogs Les profils de réseaux sociaux
URFIST de Rennes, 2012
9. Recherche sur des personnes : WebMii
Spécificité : Le « classement » de notoriété sur le web :
Le « WebMii Score », « coefficient de présence sur Internet » !!
Calculé sur 10 ; mais calculs peu clairs ; Recherches sur les entreprises, sur des réseaux de
personnes
Problèmes : Pas d’élimination des homonymes, beaucoup de bruit
dans les résultats mots-clés de filtrage peu efficaces
Pas d’indications claires des périodes concernées Vision purement quantitative et narcissique de la
présence numériqueURFIST de Rennes, 2012
9. Recherche sur des personnes : Yasni
Voir article sur Outils FroidsURFIST de Rennes, 2012
9. Recherche sur la visibilité : YouSeeMii
Moteur de recherche sur la visibilité des organisations et des individus Créé en France en 2009 Mesure « l’indice de visibilité » sur le web, les
réseaux sociaux, les réseaux professionnels et les médias
Pas de stockage des données personnelles Création de profil individuel Présentation claire des résultats Nombreuses fonctionnalités
URFIST de Rennes, 2012
URFIST de Rennes, 2012 81
10. Moteurs personnalisables
Des moteurs “sur mesure” / recherche verticale
Choix par l’internaute du périmètre des recherches : ensemble donné de sites web, thématique précise, type d’informations
Compte gratuit Système de veille
Des plateformes ouvertes / API de recherche
Création de moteurs à la demande Personnalisation dans la page de résultats (ajouts,
tri, présentation)
URFIST de Rennes, 2012 8282
10. Moteurs personnalisables
Un outil dominant : Google
Pour les internautes : Google CSE, Google Custom Search Engine
Exemple d’application : Jurn
D’autres acteurs :
Créer son moteur personnalisé avec : Les Swickis d’Eurekster :
http://www.eurekster.com/
URFIST de Rennes, 2012 83
10. Moteurs personnalisables : Google Custom Search Engine
Lancé en octobre 2006 Base du moteur : index de Google Pas de limite au nombre de sites Possibilité d’intégrer le moteur sur un site
privé, un portail Netvibes... Ex. : Réseau Urfist
Intérêt comme moteur de recherche interne sur un site
URFIST de Rennes, 2012 84
10. Moteurs personnalisables : Google Custom Search Engine
Démarche : Avoir un compte Google
et aller sur Google Recherche Personnalisée
Cliquer sur
Trois étapes : Configurer le moteur de
recherche Tester Obtenir le code
URFIST de Rennes, 2012 85
10. Moteurs personnalisables : Google CSE : démarche. Configuration
Indiquer les URL des sites
Décrire le moteur
URFIST de Rennes, 2012 86
10. Moteurs personnalisables : Google CSE : démarche. Personnalisation du style
URFIST de Rennes, 2012 87
10. Moteurs personnalisables : Google CSE : démarche. Récupération du code
Copier-coller le code HTML du moteur pourimplanter le moteur sur une page de votre site
Voir exemple sur le Portail Netvibes de l’URFIST de Rennes
URFIST de Rennes, 2012 88
11. Des ressources pour se former et s’informer
Difficultés de la veille sur les outils de recherche :
Rapidité des innovations Surabondance des sources
Remèdes dans les outils eux-mêmes : Fils RSS, portail Netvibes, blogs, Twitter…
Ressources de l’URFIST de Rennes : Liste Diigo « Outils de recherche spécialisés » Sélection de ressources sur les outils de recherche Le portail Netvibes de l’URFIST de Rennes : onglet
Recherche d’information