l’internet des sciences humaines et sociales. recherches - perspectives

Post on 24-Jan-2015

2.230 Views

Category:

Education

8 Downloads

Preview:

Click to see full reader

DESCRIPTION

Cours à la demande du GeFem [Genre, Femmes, Méditerranée], le 17 novembre 2011, MMSH.

TRANSCRIPT

1

L’internet des sciences humaines

et socialesRecherches - Perspectives

Véronique Ginouvès http://phonotheque.hypotheses.org

2

Internet et les SHS, 3 questions

1. Comment mettre en place une stratégie de recherche sur internet ?

2. Comment mettre en place une stratégie d’ego référencement ?

3. Comment citer et être cité correctement sur le web ?

Mettre en place une stratégie de recherche sur le Web pour les SHS

Différencier les moteurs, des banques de données ou des répertoires – le libre accès des bases payantes ;

Connaître la syntaxe des équations de recherche : elle est différente selon les moteurs mais aussi les catalogues de bibliothèque ;

3

Mettre en place une stratégie de recherche sur le Web pour les SHS

Comprendre l’architecture d’une base de données pour une exploitation optimum (ex : index, thésaurus, RAMEAU... ) ;

Savoir que ne pas avoir de résultat ne signifie pas qu’il n’existe pas ou évaluer la part du web invisible ;

Connaître les outils de veille (alertes, réseaux sociaux, blogs, syndication de contenu).

4

5

Des repères pour s’adapter

Distinguer au moment de la recherche -les univers fermés (les catalogues de bibliothèque, les sites spécialisés…)-les univers infinis (web, courriel, forums…)Revenir aux sources documentaires classiques car tout ne se trouve pas sur la toile…

6

La loi de Mooers

"Un système d’information ne sera pas utilisé tant qu'il apparaîtra à l'utilisateur plus pénible d’obtenir l'information grâce à ce système que de ne pas l'avoir." Mooers ajoutera "Il est de mon opinion que beaucoup d'utilisateurs pourraient ne pas vouloir d'information et qu'ils éviterons d'utiliser un système précisément parce qu'il leur donne de l'information... Obtenir de l'information est douloureux et troublant." Référence : Peter Morville, Ambient findability (O'Reilly Media, Inc., 2005), http://oreilly.com/catalog/9780596007652 p. 44

7

Vous êtes des êtres sociaux, il en va de même pour l'information

« Derrière la plupart des sites Web, intranet et produits interactifs ratés, se cache une compréhension ratée des utilisateurs et de leur comportement dans la recherche d'information. Les utilisateurs sont complexes. L'utilisateur est un être social, l'information est aussi de nature sociale »

Référence : Peter Morville, Ambient findability (O'Reilly Media, Inc., 2005), http://oreilly.com/catalog/9780596007652 p. 45

Une astuce : interroger ce que l’on connait

Interrogation du catalogue de la bibliothèque de la médiathèque de la MMSH :http://mediabase.mmsh.univ-aix.fr

8

9

Les moteurs

Un moteur visite périodiquement une partie des fichiers statiques accessibles sur Internet et met à jour un index comprenant tout ou partie des mots des fichiers visités. Le résultat est une liste de pages web. Un moteur donne une image du Web déjà obsolète car il peut y avoir parfois des décalages importants entre ce que le moteur a « aspiré » et la forme actuelle du site.

10

11

12

La pertinence des résultats : un algorithme nommé Panda

Le nombre de liens qui pointent vers la page ;La qualité du code en particulier la balise html <title>Titre de la page</title> ;Les mots clés contenu dans l’URL ex : www.femmes-emploi.fr ;La fréquence de mise à jour du site (35% des requêtes prend en compte ce critère) ;Détection automatique de sites dits « officiels » ;Le nombre de requêtes faites à travers le moteur ;

La pertinence des résultats : un algorithme nommé Panda

Il y en a d’autres moins faciles à percevoir comme la traduction automatique des résultats lorsqu'une requête est demandée dans une langue et renvoie à trop peu de résultats ;

Et d’autres encore, …c’est le mariage de tous ces critères qui permet le calcul de pertinence de Google, véritable secret industriel, constamment modifié (jusqu’à 500 fois par) pour lutter contre le spamindexing.

13

14

Prédominance de Google

Google représente 91,6 % du trafic généré par les moteurs de recherche francophones

AT Internet Institute, mars 2011

Plus de la moitié des recherches Google proviennent de pays autres que les États-Unis.(Données internes à Google)

Carte du monde de l'utilisation de Google

15

Relativiser les modes de recherche

Sur Google 34% des internautes se contentent de requêtes en un mot,

30% en 2 mots, 18% en 3 mots

Source : http://www.journaldunet.com/chiffres-cles.shtml (Journal du net, décembre 2010)

16

Relativiser les modes de recherche

42% des utilisateurs cliquent uniquement sur le premier résultat de la recherche.

8% cliquent ensuite sur le deuxième résultat.

Source : http://www.useit.com/alertbox/defaults.html

17

Relativiser l’emploi des langues sur l’internet

18

Les moteurs spécialisés

Google Scholar, depuis novembre 2004

Scirus - For scientific information, depuis 2001

Isidore - Accès aux données numériques des SHS, depuis 2010

In-Extenso créé en 2002, arrêté en 2009

OAIster créé 2002, devenu le moteur d'OCLC en octobre 2009

19

Google Scholar

Moteur de recherche spécialisé dans la littérature universitaire lancé fin 2004, encore en version beta en septembre 2011.

Base de données pluridisciplinaire

http://scholar.google.com/

20

Qu’interroger sur Google Scholar ?

La couverture de Google Scholar ne peut pas être définie avec précision. L’objectif est de retrouver les documents du monde scientifique. La base de données est multidisciplinaire avec une prépondérance des ressources en sciences exactes et médicales.

21

Dans Google Scholar vous y trouvez …

- Des fichiers en texte intégral à accès libre et payants en format HTML et PDF : éditeurs scientifiques, sociétés savantes,

répertoires de pre-prints, serveurs universitaires... - Des articles avec évaluation par les

pairs (peer reviewed), des thèses, des livres, des articles en pré-publication, des rapports…

Google Scholar ne fournit aucune liste des éditeurs commerciaux ni de liste des serveurs d’archives qu’il indexe.

22

Vous ne savez rien sur…

La période couverte par ces documentsLe volume des documents présents sur Google ScholarLes langues représentées même si l’anglais est prédominant.La mise à jour des informations.

23

Scirus

• Scirus est un moteur de recherche scientifique pluridisciplinaire développé par l’éditeur scientifique Elsevier

• Son « Advisory board » est composé de chercheurs et de professionnels de l’information

• Scirus annonce l’indexation de plus de 410 millions de pages issues du web scientifiques (Septembre 2011)

http://www.scirus.com

24

Scirus vous explique son fonctionnement

Scirus indexe le texte intégral des pages Web qu’il visite.

• Les ressources obtenues suites à vos interrogations sont toutes accessibles depuis le Web, mais un certain nombre seront d’accès payant (Lexis Nexis, Science Direct d’Elsevier... )

• Vous interrogez dans Scirus aussi bien le texte intégral d’articles de recherches que le texte de sites d’informations institutionnels (plaquettes de laboratoire en ligne, sites d’universités)

25

Scirus vous explique son fonctionnement, mais :

• La politique d’indexation et sa fréquence sont clairement annoncées

• La nature commerciale du moteur tend à mettre en avant les ressources issues des portails payants

• Malgré la volonté annoncée de créer un moteur scientifique vous y trouvez un certain nombre de pages non scientifiques (pages de sites personnels ou commerciaux).

26

Isidore - Accès aux données numériques en SHS

Isidore est une plateforme de recherche qui s'appuie sur les principes du web de données et donne accès à des données en accès libre (open access).

En septembre 2011 Isidore donnait accès à 1151 sources de données numériques, regroupées en 49 collections.

http://www.rechercheisidore.fr

27

Le « Web de données » comment ça marche ?

Moissonnage ciblé des métadonnées et données scientifiques structurées ;

Indexation des données (non structurées et structurées ;

Normalisation et enrichissement des métadonnées à partir de référentiels reconnus dans la communauté ;

Interface graphique de recherche ;Mise à disposition des métadonnées

enrichies par le moteur.

28

Des outils spécialisés : blogs et annuaires

Aldébaranhttp://aldebaran.revues.org

Internet per gli umanisti http://biblio.lett.unitn.it

La boîte à outil des historienshttp://www.boiteaoutils.info/

Les aspects concrets de la thèsehttp://act.hypotheses.org/

29

Les bases de données - 1

Chaque base donne des informations en fonction de son principe de fonctionnement

Le catalogue SUDOC fournit :- Des notices bibliographiques (9 millions) ;- La localisation des ouvrages sur 2000 établissements ; - Le PEB avec les bibliothèques adhérentes au réseau.

30

Les bases de données - 2

Le catalogue Worldcat, est l'une des bases de données de l'OCLC (Online Computer Library Center) créé en 1971 : vous accédez aux catalogues de plus de 10 000 bibliothèques à travers le monde proposant 1,5 milliards de documents en 31 langues (chiffres 2011). http://www.worldcat.org

31

Les bases de données - 3

Les points forts de Worldcat :- La création de bibliographies, publiques ou non, exportables vers des logiciels (EndNote, Refworks, Zotero) ;- L'intégration du portail OAISTER en octobre 2009 pour accéder à des documents numériques ;- L'accès à un index auteur original : Worldcat indentities.

32

Les bases de données - 4

Deux bases à accès réservé :

Université de Provence : ENTenvironnement numérique de travailhttp://entu1.phocean.fr/uPortal/

render.userLayoutRootNode.uP

Biblio SHS http://biblioshs.inist.fr/

33

Le libre accès, qu'est-ce que c'est ?- Visibilité et accessibilité à la

recherche- Mise à disposition gratuite des

publications scientifiques- Des dispositifs techniques de

stockage et de partage des informations

- Un mouvement international structuré - Le libre accès ne concerne pas

seulement la recherche (ex : Data.gov http://www.data.gov).

34

OAI

L’Open Archive Initiative, créée par la convention de Santa Fé (Nouveau Mexique) en 1999, pour : - développer et de promouvoir des standards interopérables pour les bases d’articles scientifiques ; - définir un ensemble de protocoles techniques pour la description des données et leur interrogation ; - oeuvrer pour que la constitution d’archives électroniques devienne un processus établi dans la communication scientifique.

35

Le dépôt dans HAL-SHS

L'auteur peut déposer la version "manuscrite" de son document :AVANT publication : il est détenteur des droits sur son texteAPRES publication SOUS contrat :- Sauf interdiction explicitement précisée dans le contrat, l’auteur a le droit de diffuser son document dans une archive institutionnelle électronique. - En cas de clause explicite autorisant l’exploitation électronique du document par l’éditeur : l’auteur doit demander l’autorisation de dépôt à l’éditeur. APRES publication SANS contrat L’auteur a le droit de diffuser son document (version preprint).Les questions de droits des images contenues dans le texte doivent être réglées par l’auteur

36

Accès aux articles en SHS

- Revues.org : http://www.revues.org

- Persée : http://www.persee.fr- Cairn : http://www.cairn.info- Erudit :

http://www.erudit.org/revue- HAL SHS :

http://halshs.ccsd.cnrs.fr

37

Le web invisible

38

Les 4 types de web invisible

-The Opaque Web : les pages qui pourraient être indexées par les moteurs mais qui ne le sont pas (limitation d'indexation du nombre de pages d'un site, fréquence d'indexation, liens absents vers des pages, limite décidée par le moteur…)- The Private Web : les pages web volontairement exclues par les webmasters.- The Proprietary web : pages seulement accessibles pour les personnes qui s'identifient. Le robot ne peut pas toujours y accéder.- The Truly Invisible Web : contenu qui ne peut être indexé pour des raisons techniques, comme un format inconnu par le moteur (même si Google reconnaît la majorité des formats) et surtout de nombreuses des bases de données.

Source : Chris Sherman et Gary Price, The Invisible Web : Finding Hidden Internet Resources Search Engines Can't See

L’egoréférencement ou de la nécessité de maîtriser son identité numérique*

1. Faites le choix du libre accès

2. Entrez dans l’économie de l’attention

3. Entrez dans la conversation scientifique

4. Ne laissez personne définir pour vous votre identité numérique

* Repris de Marin Dacos, source : Blogonumericus.

39

Faites le choix du libre accès

Les revues en accès restreint font partie du web invisible. Elles ne contribuent pas à votre identité numérique. Par ailleurs, elles contribuent bien faiblement à la marche de la science, parce qu’elles misent sur l’invisibilité en lieu et place de la mise en public. Or, la publication est bien la mise en visibilité, pas la mise au secret

40

Entrez dans l’économie de l’attention

Prenez conscience que vous entrez dans une économie de l’attention, sous le sceau de la prolifération documentaire.

Nous avons quitté le paradigme de la rareté. Autrefois, les lecteurs cherchaient les articles. Aujourd’hui, les articles cherchent les lecteurs. Il y a plus de documents en ligne que d’habitants sur cette planète.

41

Entrez dans la conversation scientifique

La science moderne est née grâce à la correspondance entre savants. Ces correspondances ont donné les revues. La science moderne est aussi faite de disputatio, le débat entre chercheurs, qui a donné le séminaire. Aujourd’hui, le numérique introduit la notion de séminaire virtuel permanent. Il s’agit d’une conversation scientifique qui se joue des contraintes de temps et d’espace.

42

Hypotheses.org ou la nouvelle conversation scientifiqueFemmes au travail, question de genrehttp://fht.hypotheses.org/1797

Devenir historien-nehttp://devhist.hypotheses.org/

Efigies, Etudes Féministes, Genre et Sexualité

http://efigies-ateliers.hypotheses.org

43

Ne laissez personne définir pour vous votre identité numérique

Utilisez des outils qui vous permettent de regrouper dynamiquement l’ensemble des informations, vous concernant, que vous souhaitez agréger autour de votre identité numérique :- vos articles sur HAL SHS- vos billets sur Hypotheses.org- votre bibliographie sur Zotero- vos images sur MediHal- vos cours sur Slideshare- vos colloques sur Calenda…

44

45

Les nouvelles lois de la citabilité

Le DOI qu’est-ce que c’est ?http://www.doi.org/

Citer une référence électroniquehttp://aldebaran.revues.org/69

Utiliser Zoterohttp://phonotheque.hypotheses.org/5341

46

Bonnes recherches...

N'hésitez pas à contacter les professionnels de la bibliothèque à la médiathèque de la MMSHmediatheque@mmsh.univ-aix.fr

Mon courriel : ginouves@mmsh.univ-aix.fr

top related