mémoire de master 2 (celsa) sur le data-journalisme

116
UNIVERSITE DE PARIS IV – SORBONNE CELSA Ecole des hautes études en sciences de l’information et de la communication MASTER 2ème année Mention : Information et Communication Spécialité : Médias et Communication « Data-Hari » : le journalisme sacrifié sur l’autel des données ? Préparé sous la direction du Professeur Véronique RICHARD Nom, Prénom : Alexis Chailloux Promotion : 2011-2012 Option : MISC (Médias Informatisés et Stratégies de Communication) Soutenu le : 22 octobre 2012 Note du mémoire : Mention :

Upload: alexischailloux

Post on 04-Aug-2015

697 views

Category:

Documents


2 download

DESCRIPTION

Le « data-journalisme » charrie des promesses faramineuses : pour Eric Mettout de L'Express, ce serait même « l’avenir en marche ». Pourtant, aucun grand titre français ne dispose aujourd’hui d’une rédaction de « data-journalistes ». Comment l’expliquer ? Ce mémoire tente d’apporter une réponse en analysant l’articulation – donc la compatibilité – entre imaginaires du journalisme professionnel et discours d’escorte du data-journalisme. En véhiculant la métaphore du déluge et du gisement, ces derniers renforcent la figure du journaliste comme médiateur, emportant ainsi le soutien de journalistes professionnels. Mais le « data-journalisme » est aussi un projet politique de rénovation du journalisme, qui pose questions à certains repères jusqu’ici bien ancrés (journaliste comme défenseur du bien public, fonctionnement corporatiste, etc.).

TRANSCRIPT

Page 1: Mémoire de master 2 (CELSA) sur le data-journalisme

UNIVERSITE DE PARIS IV – SORBONNE

CELSA

Ecole des hautes études en sciences de l’information et de la communication

MASTER 2ème année

Mention : Information et Communication Spécialité : Médias et Communication

« Data-Hari » : le journalisme sacrifié sur l’autel des données ?

Préparé sous la direction du Professeur Véronique RICHARD

Nom, Prénom : Alexis Chailloux Promotion : 2011-2012 Option : MISC (Médias Informatisés et Stratégies de Communication) Soutenu le : 22 octobre 2012 Note du mémoire : Mention :

Page 2: Mémoire de master 2 (CELSA) sur le data-journalisme
Page 3: Mémoire de master 2 (CELSA) sur le data-journalisme

2

Remerciements

Je voudrais remercier avant toute chose mon rapporteur universitaire, Étienne Candel,

ainsi que mon rapporteur professionnel, Anthony Hamelle, pour les nombreuses pistes ouvertes et

l’intérêt consacré à mon travail.

Je remercie les personnes ayant pris de leur temps personnel pour s’entretenir avec moi :

Caroline Goulard, à la passion contagieuse, Pierre Romera, un « ami pour la vie » grâce à

Twitter, et Jean-Christophe Féraud, pour sa ferveur du journalisme « avec un grand J ». J’espère

les recroiser très vite et poursuivre nos discussions.

J’adresse un immense merci à ma grand-mère, ange-gardienne bienveillante et

attentionnée durant toute la période de rédaction, sans qui ce mémoire n’aurait jamais pu voir le

jour dans les délais impartis. À l’heure d’écrire ces lignes, j’ai une pensée particulière pour elle.

Je n’oublie pas mes deux parents, relecteurs d’une rare réactivité, pour leurs

commentaires parfois fantasques, souvent rigoureux, toujours utiles. Leur investissement

quotidien à mes côtés fut d’une aide précieuse.

Merci encore à Marion, Claire et Alix, qui ont participé à la fastidieuse mais nécessaire

tâche de relecture.

Merci enfin à toute la promotion des MISC 2012, pour les rires, les pleurs, les joies, les

déprimes et les encouragements au moment, si redouté, de rédiger le mémoire. Sans ce salutaire

espace de décompression, la tâche aurait été plus périlleuse encore.

Page 4: Mémoire de master 2 (CELSA) sur le data-journalisme

3

Introduction

En 1989, Bill Dedman reçoit le prix Pulitzer du journalisme d’investigation pour son

enquête « The Color of Money », publiée dans The Atlanta Journal1. En croisant des bases de

données ethno-démographiques et bancaires, il démontre, cartes à l’appui, que l’appartenance

ethnique est, toutes choses égales par ailleurs, un facteur de discrimination au moment d’attribuer

un prêt immobilier.

En 2012, Michal J. Berens et Ken Amstrong reçoivent le prix Pulitzer du journalisme

d’investigation pour leur enquête « Methadone and the politics of pain », publiée dans The Seattle

Times2. En croisant des bases de données de certificats de décès, d’hospitalisations et de pauvreté,

ils démontrent, cartes à l’appui, que la méthadone, analgésique réputé pour sa dangerosité, est

systématiquement prescrite par Medicaid, l’assurance-santé publique destinée aux plus démunis,

à des fins d’économie budgétaire3.

La première enquête relève simplement du journalisme d’investigation, quand la seconde

est considérée comme une récompense pour le « journalisme de données »4. Comment expliquer

une telle différence de traitement ?

1 FANEN, Sophian, « Les Américains défricheurs du déchiffrage », Ecrans, [disponible en ligne], 4 janvier 2012 (lorsqu’un article a été consulté en ligne, la mention « disponible en ligne » sera faite, l’URL complète et la date de consultation étant indiquées en bibliographie). 2 « Seattle Times methadone investigation wins Pulitzer Prize », The Seattle Times, [disponible en ligne], 16 avril 2012. 3 BERENS, Michael. J., « How we linked methadone to powerty », The Seattle Times, [disponible en ligne], 10 décembre 2011. 4 « Le journalisme de données récompensé », Courrier International, [disponible en ligne], 28 juin 2012.

Page 5: Mémoire de master 2 (CELSA) sur le data-journalisme

4

Contextualisation

Une première réponse est apportée par le concept d’ « intermédialité », défini par André

Gauderault et Philippe Marion pour décrire la genèse du cinéma. Dans ce cadre théorique, un

« média naît toujours deux fois5» : une « naissance intégrative » (ou « fausse naissance »), puis

une « naissance différentielle » (ou « autonomisation identitaire »). La « naissance intégrative »

correspond au moment où une nouvelle technique de traitement de l’information apparaît. À ce

moment, le média est encore dépendant d’autres formes médiatiques : « dépourvu de réelle

épaisseur paradigmatique (…) son identité lui échappe encore6 ». La « naissance différentielle »

intervient lorsque le média s’affirme dans sa singularité, en développant des spécificités

identitaires (mode de communication, esthétique, champ sémantique, etc.). Elle coïncide

généralement avec une reconnaissance institutionnelle, et se traduit par une augmentation

sensible des ressources économiques qui lui sont allouées.

À croire Sylvain Parasie, sociologue à l’Université Paris-Est Marne-la-Vallée, la

« naissance intégrative » du data-journalisme7 daterait de la fin des années 1960, lorsque « l’idée

d’utiliser des bases de données comme support à la production d’information apparaît en

Amérique du nord8 ». Philip Meyer révèle ainsi en 1967 dans le Detroit Free Press, que les

jeunes étudiants Noirs ont autant participé aux émeutes de la ville que les jeunes Noirs sans

qualification, contrairement à une théorie « populaire chez les éditorialistes9 ». Mû par l’idée

d’exploiter les outils statistiques des sciences sociales à des fins d’investigation, et séduit par les

promesses du développement de l’informatique, il rédige même un manuel, The New Precision

Journalism10. Cette technique, qui prend finalement le nom de CAR - Computer Assisted

5 GAUDERAULT, André, MARION, Philippe, « Un média naît toujours deux fois ... », Sociétés et représentations, n° 9, 2000, pp. 21-36. 6 Ibid., p. 21. Appliqué à l’objet de leur recherche, deux auteurs montrent ainsi que le cinéma des premiers temps n’était pas considéré comme tel – le début d’un nouveau genre médiatique - mais comme un moyen parmi d’autres de réaliser des disciplines bien établis (fééries, mystères, etc.). 7 Tout au long de ce mémoire, les terminologies « data-journalisme » et « journalisme de données » seront utilisées sans guillemets et indifféremment pour désigner l’objet de recherche. Lorsqu’il s’agira de souligner une orthographe particulière, des guillemets seront systématiquement ajoutés. 8 Cité dans : INIZAN, Maël, « Chicago : de la prohibition au data-journalisme », Sillicon Maniacs, [disponible en ligne], 24 mars 2011. 9 [« Popular with editorial writers »] in MEYER, Philip, The New Precision Journalism, 4e Éd (1973), Rowman & Littlefield Publishers, 2002, p. 14. 10 Ibid., 304 p.

Page 6: Mémoire de master 2 (CELSA) sur le data-journalisme

5

Reporting11 -, fait quelques émules dans les années 1980 où plusieurs prix Pulitzer sont récoltés.

Elle ne jouira cependant jamais d’une reconnaissance institutionnelle propre, les journalistes qui

l’utilisent étant systématiquement rattachés au journalisme d’investigation, genre déjà bien établi.

La « naissance différentielle » intervient dans les années 2000, lorsque des acteurs issus

du mouvement du logiciel libre, intéressés par les problématiques d’information, investissement

le champ journalistique à la faveur du mouvement d’ « open data »12. La figure emblématique de

ce phénomène est Adrian Holovaty. Développeur et journaliste, il se fait connaître au Washington

Post en lançant en 2005 Chicagocrime.org, carte localisant les crimes et délits à partir des fichiers

de police. Il écrit l’année suivante un court texte13, présenté aujourd’hui par les commentateurs

comme le « manifeste du data journalisme14 ». Le succès rencontré par ces acteurs amène les

grands titres de presse américains – New York Times, Washington Post, Chicago Tribune, Los

Angeles Times - à constituer des équipes dédiées et à les intégrer dans les rédactions, établissant

ainsi le data-journalisme comme une pratique légitime, dotée d’une reconnaissance

institutionnelle.

Construction de l’objet de recherche

Le « journalisme de données » mobilise deux termes polysémiques : « journalisme » et

« données ». Il convient de définir quelles significations de chacun de ces deux mots sont

mobilisées lorsque l’expression est employée.

11 « Journalisme Assisté par Ordinateur » 12 Aussi dénommé « mouvement de libération des données publiques », ce mouvement enjoint les administrations publiques à mettre à disposition des données librement réutilisables. 13 HOLOVATY, Adrian, « A fundamental way newspapers need to change », [disponible en ligne], 6 septembre 2006. 14 GUILLAUD, Hubert, « Les données pour comprendre le monde », InternetActu, [disponible en ligne], 19 juillet 2011.

Page 7: Mémoire de master 2 (CELSA) sur le data-journalisme

6

La donnée comme production humaine

Le Trésor de la Langue Française Informatisé (TLFI) apporte, à l’entrée « donnée », au

moins deux significations intéressantes dans le cadre de ce travail. (i) « Quantité connue dans

l’énoncé d’un problème », la donnée est avant tout un élément quantifiable, que l’on peut

mesurer, manipuler, calculer. (ii) « Ensemble des indications enregistrées en machine pour

permettre l’analyse et/ou la recherche automatique d’informations », la donnée se veut

également manipulable par les outils informatiques. L’entrée « statistiques » - « recueil de

données numériques concernant des faits économiques et sociaux », - permet de discerner une

troisième acception du terme « donnée » : une production humaine ayant pour objectif

d’appréhender le social. Dans ce sens, la donnée est le fruit d’un processus, d’une médiation, elle

n’est donc paradoxalement pas « donnée ». En résumé, la donnée est quantifiable, informatisée,

mais également le fruit d’un processus du recueil. Cette dernière approche est développée par le

sociologue Olivier Martin.

Dans un débat sur « la vérité des chiffres15 », il présente les trois éléments qui, selon lui,

composent un chiffre. C’est d’abord une notion, c’est-à-dire ce que l’on veut mesurer, plus ou

moins latente selon les cas : si le statut matrimonial d’un individu est objectivable, ne serait-ce

que par le droit, il semble plus périlleux d'exprimer l’intelligence. C’est ensuite un process, soit le

dispositif humain d’enregistrement et les méthodes statistiques appliquées aux résultats ; la

donnée est bien le résultat d’une médiation humaine. C’est enfin une institution, qui réalise la

mesure dans un objectif défini : la recherche (laboratoire universitaire), le pilotage de l’action

publique (Etat), l’information (média), le commerce (institut de sondage), la dénonciation

(association), etc. Autrement dit, le chiffre statistique n’est pas simplement un nombre, mais la

représentation d’un dispositif de mesure conçu par des humains, et commandité par une

institution dans un but précis.

Lorsqu’il est utilisé dans le cadre des médias informatisés, le terme de « donnée » a

cependant tendance « à “avaler” [son] environnement, à jeter dans l’ombre des concepts

15 MARTIN, Olivier, « La vérité des chiffres : une illusion ? Débat entre entre Alain Blum, démographe, et Olivier Martin, sociologue. », La Vie des idées, [disponible en ligne], 12 novembre 2009.

Page 8: Mémoire de master 2 (CELSA) sur le data-journalisme

7

connexes16 ». Selon Valérie Peugeot, il est utilisé à la fois pour désigner les métadonnées - les

éléments qui qualifient et donnent un sens à un document -, les données – au sens de chiffres

statistiques – et les documents numérisés – simples photographies de documents papier. La

majorité des réalisations estampillées « data-journalisme » concernent le second sens, mais il

existe des cas utilisant des métadonnées – une cartographie des auteurs de Wikipédia par

exemple17 -, ou se servant de documents numérisés – l’enquête sur les notes de frais des députés

britanniques notamment18. Au détour d’une phrase, Pierre Romera utilise ainsi clairement le mot

« donnée » pour signifier un document papier : « tu sais quand on parle de Wikileaks comme

révolution c’est complètement faux. Depuis toujours les journalistes utilisent des données, ou

qu’ils ont volées ou alors qu’ils ont trouvées, oubliées sur une photocopieuse.19 ».

Pour une dé-ontologie du journalisme

Tenter de donner une définition transnationale et atemporelle du journalisme serait, pour

reprendre les mots d’Erik Neveu, retomber dans « l’illusion essentialiste20 ». En premier lieu,

parce que le journalisme est ancré dans des histoires nationales propres, où les rapports aux

champs littéraires, économiques et politiques ne sont pas les mêmes. Jean Chalaby a ainsi pointé

les différences entre un modèle anglo-américain, devenu la norme internationale par son souci

d’indépendance, et un modèle français, marqué par sa plus lente autonomisation vis-à-vis du

pouvoir politique et du monde littéraire21. Ces deux pôles sont complétés par toute une série de

modèles intermédiaires, à l’instar du journalisme brésilien22. En second lieu, même au sein d’un

pays donné, les frontières de la profession de journaliste se révèlent « flou[es]23 ». Dans ces

16 PEUGEOT, Valérie, « Web des données, données ouvertes », France Telecom R&D, [disponible en ligne], Janvier 2010, p. 25. 17 http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/ (consulté le 31 août 2012), cité in: « Les data en forme », OWNI, [disponible en ligne], 17 avril 2012. 18 LEON, Yann et ORMAN, Évelyne, « La ronde des chiffres du journalisme de données », La Croix, [disponible en ligne], 22 octobre 2010. 19 Entretien avec Pierre Romera (annexe 2) 20 NEVEU, Erik, « News without journalists : real threat or horror show », Brazilian Journalism Research, Vol. 6/1, 2010, p. 31. 21 CHALABY, Jean, The invention of journalism, Palgrave Mc Millan, 1998, 224 p. 22 MARQUES de MELO (José), 2009, « Journalistic Thinking. Brasil’s Modern Tradition », Journalism, Vol 10/1, pp. 9-27. 23 RUELLAN, Denis, Le professionnalisme du flou, Presses Universitaires de Grenoble, 1993, 232 p.

Page 9: Mémoire de master 2 (CELSA) sur le data-journalisme

8

conditions, il semble nécessaire de réaliser une « dé-ontologie24 » du journalisme, et accepter que

le terme ne renvoie pas à une réalité univoque. Ce qui ne doit pas nous empêcher pour autant de

définir les grands registres de sens mobilisés lorsque le terme est employé.

À l’entrée « journalisme », le Trésor de la Langue Française Informatisé en indique au

moins trois. C’est avant tout la « profession de ceux ou celles qui exercent le métier de

journaliste », une corporation avec ses rivalités, son éthique, ses contraintes économiques. C’est

également « une manière de présenter les faits et les événements sous un éclairage propre », une

technique permettant le recueil, l’assemblage, la vérification d’informations afin de les rendre

intelligibles à un public. « Ensemble des journaux », le journalisme représente enfin une force

« comme moyen d’action ou de pression » : c’est un pouvoir, une autorité, une respectabilité.

Yves Jeanneret et Emmanuel Souchier proposent un triptyque comparable pour appréhender le

métier de journaliste. Il se composerait de trois éléments : « un marché », « une écriture », « une

responsabilité »25.

Erik Neveu décrit lui quatre « repères ou imaginaires professionnels26 » permettant de lier

les différentes pratiques du journalisme. Premièrement, un certain « ordre du discours » au sens

foucaldien27, entendu comme ce qui est pensable et dicible en société. Le journalisme se

caractérise par une manière de s’exprimer identifiée comme journalistique, qui se distingue des

paroles politiques, littéraires ou publicitaires. Deuxièmement, une pratique de recueil et de

transformation de l’information qui lui permet de ne pas répéter docilement celle produite par les

sources, en particulier les plus puissantes, le pouvoir économique et politique. Troisièmement,

une autorité : par la prétention à une certaine fidélité aux faits, le journaliste acquiert une parole

respectée, et une réputation de confiance. Enfin, la prégnance d’un certain nombre de mythes

fondateurs de la profession28 : la noblesse du métier, le service rendu au public ou l’idée de

bouclier de protection de la démocratie. C’est cette approche en termes d’imaginaires

professionnels qui sera utilisée ici.

24 RASTIER, François, « Ontologie(s) », Revue des sciences et technologies de l’information, Vol. 18/1, 2004, pp. 15-40. 25 JEANNERET, Yves et SOUCHIER, Emmanuel, « Introduction. Internet vu du journalisme », Communication et langages, n° 129, 3e trimestre 2001, p. 36. 26 NEVEU, Art. cit., p. 32. 27 FOUCAULT, Michel, L’ordre du discours, Gallimard, 1971, 81 p. 28 LE BOHEC, Jacques, 2000, Les mythes professionnels des journalistes, L’Harmattan, 395 p.

Page 10: Mémoire de master 2 (CELSA) sur le data-journalisme

9

Problématique

Le développement du data-journalisme est porteur d’une promesse forte de transparence.

« Faculté de mettre en lumière29 » selon Thierry Libaert, le terme prend ici deux significations30.

Il peut s’agir de révéler des « vérités » masquées dans les chiffres par le croisement avisé de jeux

statistiques, comme l’enquête de Philippe Meyer sur les émeutes de Détroit en 1967. Dans ce cas,

la « libération » de données publiques à l’œuvre depuis quelques années n’est-elle pas une

aubaine pour ce type de travail journalistique ? La transparence peut également s’entendre

comme la prétention à « dévoiler » les coulisses du pouvoir, ses secrets inavouables et

comportements amoraux. C’est la figure installée du journaliste d’investigation, qui pose ses

yeux là où les puissants ne veulent pas. Ce dernier n’a-t-il pas tout à gagner de la numérisation

des documents politiques, rendant leur accessibilité et leur transmission bien plus aisées31 ? Tim

Berners-Lee, l’inventeur du web, et Eric Mettout, rédacteur en chef de Lexpress.fr, ne s’y

trompent pas : pour le premier, « data journalism is the future32 », pour le second c’est « l’avenir

en marche33 ».

Pourtant, force est de constater que le data-journalisme est encore peu présent dans les

organisations médiatiques « traditionnelles ». Confiné à l’étranger dans des grands titres de

presse, autour de figures tutélaires – Simon Rogers au Guardian, Aaron Pilhofer au New York

Times, Brian Boyer au Chicago Tribune -, le journalisme de données est même absent des

principaux titres français. Et lorsqu’un grand quotidien comme Le Monde lance un blog sur le

29 LIBAERT, Thierry, La transparence en trompe-l’œil, Descartes & Cie, coll. « Gouvernance et démocratie », 2003, p. 13. 30 CARDON, Dominique, « Zoomer ou dézoomer ? Les enjeux politiques des données ouvertes », OWNI, [disponible en ligne], 21 février 2011. 31 Olivier Tesquet, ancien d’OWNI passé chez Télérama, explique ainsi le péhnomène Wikileaks par cette relative facilité pour obtenir de l’information confidentielle : « C’est beaucoup plus facile de pirater des données confidentielles comme des mémos diplomatiques aujourd’hui qu’il y a 20 ans. 850 000 personnes ont accès à des documents top secret sur Intellipédia, (un wiki classifié des renseignements américain) », voir INIZAN, Maël, « L’open data appliqué au journalisme », Sillicon Maniacs, [disponible en ligne], 23 octobre 2011. 32 ARTHUR, Charles, « Analysing data is the future, says Time Berners-Lee », The Guardian, [disponible en ligne], 22 novembre 2010. 33 METTOUT, Eric, « Pourquoi le data-journalisme c’est l’avenir en marche », L’Express, [disponible en ligne], 7 avril 2010.

Page 11: Mémoire de master 2 (CELSA) sur le data-journalisme

10

modèle du Guardian 34 , celui-ci ferme au bout de deux articles. Les seules expériences

revendiquées en France se trouvent à OWNI35, autrement dit à la marge des rédactions36.

Comment dès lors expliquer ce paradoxe entre des promesses faramineuses et une

institutionnalisation encore faible dans le secteur du journalisme ? Au-delà des arguments

économiques - une presse en crise -, ou historiques – une tradition inégale de CAR, « Computer

Assisted Reporting -, n’y a-t-il pas des raisons « communicationnelles » qui justifient cet écart ?

Un deuxième type de promesses du data-journalisme, que l’on nommera « objectivistes »,

pourrait abonder dans ce sens. Dans un des premiers articles sur le sujet en France, Nicolas

Vambremeersch utilise à plusieurs reprises l’expression de « données objectives37 » pour justifier

son propos. Pourtant, selon Jean-Christophe Féraud, journaliste « technologies » à Libération,

« la subjectivité ne se met pas en données, or le journalisme est un genre subjectif38 ». Il pointe

ainsi ce qu’il perçoit comme « une tendance à vouloir objectiviser à outrance la réalité39 ». Il

ajoute un second grief, estimant que le data-journalisme porte le risque d’une automatisation

néfaste du métier de journaliste : « à tous les zélotes du “data journalism”, qui sont [les] mêmes

que les partisans du “robot-journalisme”, je dis : “nous ne sommes pas des numéros !”. » Il

défend au contraire une « Information avec un grand “I”, de la chair, du sang et de l’histoire

dedans40 », où le journaliste se renseigne en profondeur sur un terrain, et restitue au lecteur

l’information mise en perspective grâce à la « puissance narrative de l’écrit41 ».

Cette opinion tranchée permet de distinguer des points de tension entre la perception du

data-journalisme et certains imaginaires du journalisme, tels que définis plus haut. Ainsi, à

écouter Jean-Christophe Féraud, « l’ordre du discours » journalistique est sérieusement remis en

34 Le blog « Données moi ! », avait ainsi pour signature « le blog data d’un data journaliste du Monde », et comme URL http://datablog.blog.lemonde.fr/ (consulté le 31 août 2012), clin d’œil explicite au datablog du Guardian, qui recueille toutes les réalisation du journal en matière de data-journalisme. 35 OWNI se présente comme « un média d’enquête, de reportage et de data-journalism, dédié aux cultures numériques ainsi qu’aux nouveaux enjeux de société ». 36 Pour preuve, ce n’est que très récemment qu’un journaliste de formation - Guillaume Dasquié - a remplacé Nicolas Voisin, entrepreneur, comme directeur de la publication. Voir : RICHÉ, Pascal, « OWNI se déchire (en deux) pour mieux redémarrer », Rue89, [disponible en ligne], 25 mai 2012. 37 VAMBREMEERSH, Nicolas, « Pour un journalisme de données », Slate, [disponible en ligne], 30 juillet 2009. 38 Entretien avec Jean-Christophe Féraud (Annexe 3) 39 FERAUD, Jean-Christophe, « Le “data journalism” contre Albert Londres », Sur mon écran radar, [disponible en ligne], 9 février 2010. 40 Entretien avec Jean-Christophe Féraud (Annexe 3) 41 Ibid.

Page 12: Mémoire de master 2 (CELSA) sur le data-journalisme

11

cause par le journalisme de données : « le métier de journaliste c'est d'abord raconter les ressorts

d'une actualité en répondant le mieux possible aux fameux "5W42" (…). Or les chiffres à eux seuls

sont bien incapables de répondre à ce questionnement43 ».

Alors que le terme de « data-journalisme » suggère une inscription naturelle dans le

champ journalistique, cette citation pose la question de l’effectivité de ces liens : le data-

journalisme est-il « du journalisme » ? L’existence de deux signifiants suggère le contraire.

Avons-nous plutôt affaire à un genre journalistique, au même titre que l’enquête, le reportage ou

l’interview ? Si tel est le cas, pourquoi certains journalistes se revendiquent-ils du data-

journalisme, tandis que d’autres le rejettent ? Par quels mécanismes ?

Finalement, et ce sera le fil directeur de ce mémoire, il s’agira de se demander comment

les promesses du data-journalisme s’articulent avec les repères et imaginaires du

journalisme professionnel.

Méthodologie

Le choix d’une méthodologie suit logiquement la phase de problématisation, entendu que

toutes les méthodes ne conviennent pas à tous les questionnements. Une telle affirmation s’inscrit

en porte-à-faux avec des remises en cause récentes de la valeur scientifique de l’entretien semi-

directif, en particulier dans le cadre de mémoires étudiants44. Or, comme le notent Gilles Pinson

et Valérie Sala Pala, en réponse à l’article précité, « les spécificités de chaque recherche devront

être prises en compte pour déterminer quelle combinaison méthodologique saura le mieux rendre

compte de l’objet de recherche 45 ». En ce sens, ce mémoire proposera trois approches

complémentaires : l’analyse de discours, l’analyse sémiotique, ainsi que des entretiens semi-

directifs, qui permettent une approche compréhensive des discours des acteurs. 42 Les cinq « W » correspondent aux adverbes interrogatifs anglais « Who », « What », « When », « Where », « Why », auxquels une production journalistique se devrait de répondre. 43 FERAUD, Art. cit. 44 BONGRAND, Philippe et LABORIER, Pascale, « L’entretien dans l’analyse des politiques publiques : un impensé méthodologique ? », Revue française de science politique, Vol. 55, 2005, pp. 73-111. 45 PINSON, Gilles et SALA PALA, Valérie. « Peut-on vraiment se passer de l'entretien en sociologie de l'action publique ? », Revue française de science politique, Vol. 57, 2007, p. 596.

Page 13: Mémoire de master 2 (CELSA) sur le data-journalisme

12

L’analyse de discours

L’ « analyse de discours » est à distinguer de l’ « analyse de contenus ». Cette dernière

permet d’analyser un corpus extrêmement large de textes, d’y repérer des occurrences et sortir

des statistiques. La première préfère une approche qualitative, se fondant davantage sur l’analyse

de la rhétorique employée (champs lexicaux, syntaxe, etc.), à une approche quantitative. Nous

nous intéresserons dans ce cadre aux discours des promoteurs du data-journalisme, ainsi qu’à

ceux portés par les médias. Le corpus principal a été constitué de manière partiellement

automatisée, par la mise en place d’alertes mails quotidiennes sur les termes « journalisme +

données », ainsi que « data + journalisme », faisant remonter les articles en français. Des

recherches régulières sur le web ont permis de compléter le corpus, en ciblant les articles français

utilisant une orthographe distincte (« datajournalism » par exemple), ainsi que les articles en

anglais particulièrement cités.

Une sémiologie graphique et linguistique

Pour Ferdinand de Saussure, la sémiologie est la « science qui étudie la vie des signes au

sein de la vie sociale46 ». En linguistique, un signe se compose d’un signifié (le sens, abstrait,

mental) et d’un signifiant (la forme, concrète, visible). Nous utiliserons l’analyse sémiologique

dans cette dimension linguistique, à travers l’étude des connotations des signifiants, tel le préfixe

« data » dans l’expression « datajournalisme ». Elle sera également mobilisée pour analyser les

connotations des signes graphiques, qu’ils soient plastiques – pouvant être examinés du point de

vue de la forme, des couleurs, de la texture, etc. -, ou iconiques – qui renvoient aux objets du

monde. Nous appliquerons cette « rhétorique de l’image47 » aux logos de certaines institutions,

ainsi qu’aux dispositifs se revendiquant du data-journalisme, dans une approche plus techno-

sémiotique. Ces deux dimensions - linguistique et graphique – sont cependant intimement liées,

et seront donc articulées dans l’analyse.

46 SAUSSURE (DE), Ferdinand, Cours de linguistique générale, Payot, édition 1973 (1916), p. 33. 47 BARTHES, Roland, « Rhétorique de l’image », Communications, Vol. 4/4, pp. 40-51.

Page 14: Mémoire de master 2 (CELSA) sur le data-journalisme

13

Des entretiens semi-directifs dans une démarche compréhensive

Enfin, des entretiens semi-directifs se révèlent ici intéressants en raison de l’approche

compréhensive de ce travail. Or comme le notent Gilles Pinson et Valérie Sala Pala :

Dans la démarche compréhensive, l’objectif du chercheur n’est pas – tout du moins dans une

première phase de l’enquête – de rechercher la vérité des pratiques et représentations, de chercher à savoir si les acteurs disent la vérité ou pas, mais de comprendre pourquoi ce qu’ils disent est vérité48.

En effet, selon Jean-Claude Kaufmann, « la compréhension de la personne n’est qu’un

instrument : le but est l’explication compréhensive du social49 ». C’est bien dans cette approche

que s’inscrit notre recherche : comprendre la vérité des principaux promoteurs du data-

journalisme afin d’en discerner les promesses. Mais il s’agit aussi de reconnaître les limites d’une

telle méthode, en particulier le caractère un peu artificiel de l’information recueillie,

nécessairement « provoquée » par l’enquêteur. La stratégie adoptée a été de reprendre dès que

possible le vocabulaire des acteurs dans la formulation des questions, afin de limiter le

« conditionnement » des réponses. Une certaine honnêteté intellectuelle force cependant à

confesser que l’exercice n’est pas aisé : il est souvent tentant de faire dire à l’enquêté ce que l’on

souhaite qu’il dise, que cela soit - parfois - conscient, ou – souvent - inconscient. C’est la raison

pour laquelle, la méthode de l’entretien semi-directif a été articulée avec les précédentes.

Trois entretiens ont été réalisés par nos soins. Le premier avec Caroline Goulard, 25 ans,

diplômée en management des médias (IEP Rennes), formée au management des nouvelles

technologies (HEC / Telecom), co-fondatrice de la start-up de « visualisation interactive de

données » Dataveyes, et figure clé du data-journalisme en France50. Le deuxième avec Pierre

Romera, 23 ans, développeur, hacker, passé au pôle data-journalisme d’OWNI, fondateur de la

start-up Journalism++ avec son collègue Nicolas Kayser-Bril, et intervenant dans les écoles de

journalisme (ESJ Lille, CFPJ, IEP Paris). Le troisième, téléphonique, avec Jean-Christophe

48 PINSON, SALA PALA, Art. cit. 49 KAUFMANN, Jean-Claude, L’entretien compréhensif, Paris, Nathan, 1996, p. 16. 50 « LA spécialiste française » même, aux dires d’Eric Mettout. Voir : METTOUT, Art. cit.

Page 15: Mémoire de master 2 (CELSA) sur le data-journalisme

14

Féraud, journaliste économique et technologique, passé par La Tribune, l’Expansion et les Echos,

aujourd’hui à Libération. « Journaliste gonzo, Twitter Addict, blogueur erratique, digitalien,

Punk avec un futur51 » selon ses propres termes, il s’est fait remarquer par un billet remonté à

l’encontre du data-journalisme52.

Trois autres entretiens ont été mobilisés occasionnellement afin de dresser un tableau

complet du data-journalisme en France. Deux sont tirés du mémoire de 4e année de Marlène

Quintard53, étudiante en journalisme au CELSA. Il s’agit de Karen Bastien, ancienne journaliste à

Libération, fondatrice de la start-up de visualisation de données We Do Data ; ainsi que Johan

Hufnagel, journaliste web à Libération, Marianne et 20 Minutes, aujourd’hui co-fondateur et

rédacteur en chef de Slate.fr. Enfin, un dernier réalisé par Yannick Estienne, chercheur en SIC à

l’ESJ Lille, en la personne de Jean-Marc Manach54. Hacker, journaliste d’investigation passé au

Monde Diplomatique, au Canard Enchaîné, à France Inter, France 5 et Internet Actu, il est

aujourd’hui blogueur pour Le Monde et journaliste à OWNI, intervenant dans les écoles de

journalisme (ESJ Lille, CFPJ, IEP Paris).

Manque à ce panel un entretien avec Nicolas Kayser-Bril. Âgé de 25 ans, formé en

économie des médias (IEP Lille), directeur du « pôle datajournalisme » à OWNI avant de fonder

Journalism++, c’est la deuxième figure clé du data-journalisme en France55. Deux explications à

ce manque : le fait qu’il réside désormais à Berlin, et le risque de faire redondance avec son

collègue Pierre Romera, avec qui il travaille depuis plus de deux ans. À défaut d’entretien

compréhensif, nous nous contenterons donc de ses nombreuses prises de parole dans les médias.

51 Présentation de Jean-Christophe Féraud sur : http://monecranradar.blogspot.fr/ (consulté le 31 août 2012) 52 FERAUD, Opcit. 53 QUINTARD, Marlène, Le datajournalisme, un nouveau genre journalistique. Ou comment rendre accessible une base de données complexe, Mémoire de master 1 en Journalisme, CELSA, 2012. 54 ESTIENNE, Yannick, « Evolution des pratiques journalistiques sur Internet : journalisme “augmenté”, data journalism et journalisme hacker (entretien avec Jean-Marc Manach) », Les Cahiers du journalisme, Vol. 22/23, Automne 2011, pp. 134-143. 55 « un des grands spécialistes » pour Flavien Chantrel, fondateur du Blog du Modérateur. Voir : CHANTREL, Flavien, « Le data-journalisme, enjeux et perspectives : interview de Nicolas Kayser-Bril », Le blog du modérateur, [disponible en ligne], 18 mars 2011.

Page 16: Mémoire de master 2 (CELSA) sur le data-journalisme

15

Hypothèses et annonce du plan

Rappelons notre problématique : comment les promesses du data-journalisme s’articulent-

elles avec les repères et imaginaires du journalisme professionnel ? La réponse se fera en trois

mouvements.

Le premier tente de caractériser le data-journalisme. Il s’inscrit pour cela sous l’égide de la

catégorie descriptive de « trivialité56 », développée par Yves Jeanneret. L’hypothèse est que

l’expression a été principalement « réquisitionnée57 » par des acteurs extérieurs au journalisme

(hackers, acteurs économiques). Si les pratiques journalistiques auxquelles ils se réfèrent

(traitement automatisé de données, visualisation de statistiques, récit non linéaire) ne sont pas

nouvelles, le choix des signifiants – en particulier le terme « data » - leur confèrent une forte

connotation, autour de l’idée de richesse des données (métaphore du gisement) et d’une nécessité

à agir (une bannière « data » à rejoindre). Ce caractère injonctif est confirmé par l’analyse des

discours de ces mêmes acteurs. À ce stade de la réflexion, l’origine des principaux acteurs du

data-journalisme soulève un premier point de tension entre data-journalisme et imaginaires du

journalisme professionnel.

Le deuxième mouvement poursuit cette idée, en s’efforçant d’évaluer l’effectivité des

critiques adressées par certains journalistes à un journalisme centré sur le traitement de données

chiffrées (prétention objectiviste, robotisation de la profession). Il y est démontré que malgré

certaines tentations objectivistes indéniables, véhiculées par un amalgame fait / donnée, les

promoteurs du data-journalisme sont conscients de la subjectivité de l’élaboration des données,

La médiation humaine est revendiquée, afin que le traitement et la narration des données soient

faits par un professionnel maîtrisant la statistique et le récit journalistique : le data-journaliste.

Les imaginaires liés à « l’ordre du discours » et aux pratiques journalistiques sont donc réalisés

dans ces discours d’escorte. La conclusion de ce mouvement porterait à considérer le data-

journalisme se renforce d’une proximité avec les imaginaires du journalisme professionnel. 56 JEANNERET, Yves, Penser la trivialité. Volume 1 : La vie triviale des êtres culturels, Hermès-Lavoisier, coll. « Communication, médiation et construits sociaux », 2008, 266 p. 57 LABELLE, Sarah, « “La société de l’information” : Formule, récit et réquisition », in CHOUTEAU, Marianne et NGUYEN, Céline (dir.), Mises en récit de la technique, Éditions des Archives Contemporaines, 2011, pp. 33-44

Page 17: Mémoire de master 2 (CELSA) sur le data-journalisme

16

Le troisième temps, centré sur le projet politique de « rénovation » du journalisme porté par

les tenants du data-journalisme, mettra en exergue les altérités entre ces deux blocs théoriques. Si

certaines convergences se font autour de l’actualisation de la figure démocratique du « journaliste

justicier58 », les autres propositions mettent à mal les repères du journalisme professionnel. Dans

le rôle social du journalisme d’abord : par l’individualisation de l’interprétation des réalisations

journalistiques, les dispositifs de data-journalisme favorisent la figure de l’ « individu rationnel »,

maximisant ses intérêts au détriment du reste de la collectivité. Dans l’autorité de la figure du

journaliste ensuite : en militant pour une mythique organisation horizontale de la société, les

promoteurs du data-journalisme veulent faire du journaliste un chef de projet, maillon parmi

d’autres, et comme les autres, dans la production de l’information.

58 LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du journalisme justicier dans la France contemporaine », Quaderni, n° 45, 2001, pp. 53-68.

Page 18: Mémoire de master 2 (CELSA) sur le data-journalisme

17

I. Le data-journalisme comme action collective

« The only new thing in the world is the history you don’t know59. »

Harry S. Truman

La « trivialité » selon Yves Jeanneret ne doit pas s’entendre au sens courant –

« commun », « rebattu », « facile » -, mais au sens étymologique, du latin trivium, « carrefour de

quatre voies60 ». C’est un endroit de circulation, où l’on choisit le chemin à suivre. Appliqué à

l’étude du social, le terme devient concept, et désigne un monde en mouvement, où « les objets

culturels circulent et sont réinvestis en permanence par les acteurs qui les utilisent61 ».

Lorsque l’on veut caractériser le data-journalisme, l’idée de trivialité éclaire les limites

d’une approche essentialiste (A), qui décrit des objets stables, universels, atemporels. Le concept

est également d’une aide précieuse pour se concentrer sur les acteurs – non journalistes la plupart

- qui utilisent l’expression « data-journalisme » et l’investissent de sens (B). Enfin, il permet

d’étudier les connotations du signifiant « data », faux synonyme de « donnée » aux riches

promesses, utilisé comme bannière par des acteurs économiques émergents (C).

59 MILLER, Merle, Plain speaking : an oral biography of Harry S. Truman, Berkeley Publishing Corporation, 1974, p. 26. 60 JEANNERET, Yves, « Figures politiques de la trivialité : le symbolique, le populaire, et le public », in Économie politique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 11 octobre 2011. 61 JEANNERET, Yves, Penser la trivialité, Op. cit., p. 16.

Page 19: Mémoire de master 2 (CELSA) sur le data-journalisme

18

A. Des signifiés multiples : l’impossible approche essentialiste

Les entretiens conduits et l’analyse de discours ont permis de recueillir une grande variété

de définitions du data-journalisme. Nous les avons regroupées en deux catégories : les approches

« disciplinaires » (1) et les approches « culinaires » (2). Devant cette diversité de définitions,

parfois contradictoires, il semble impossible de trouver un référent au data-journalisme. Tout

juste peut-on construire un idéal-type, par définition insatisfaisant (3).

1. Les approches « disciplinaires »

Ces approches situent le journalisme en relation – d’assimilation, d’inclusion ou

d’exclusion – avec des disciplines supposées clairement identifiées, insistant ainsi sur la

continuité avec des pratiques antérieures. Selon Pierre Romera, le data-journalisme recouvre

« toutes les manières de faire du journalisme innovant62 » ; définition confirmée lorsqu’il évoque

sa « start-up » : « j’ai fondé Journalism++, société spécialisée dans le data-journalisme (…)

mais au sens large. On parle vraiment d’aider les médias à innover63 ». Pour son collègue

Nicolas Kayser-Bril, ce serait plutôt un synonyme de « journalisme digital64 », soit toutes les

possibilités pour faire du journalisme en ligne :

C’est la réponse technologique à [l’arrivée d’internet] en disant : on a un nouveau canal, des nouveaux outils, des nouveaux métiers qui apparaissent, on va les utiliser pour faire du journalisme aussi. (…). On peut faire ça avec de la donnée, la dimension masse de données est extrêmement importante, mais on peut faire ça aussi avec d’autres moyens65.

D’autres vont définir le terme par le regroupement de plusieurs disciplines. Les « data

journalism awards »66 présentent ainsi trois catégories de prix : « data-driven investigations »,

« data visualisation and storytelling », « data driven applications », signifiant par là qu’il s’agit

62 Entretien avec Pierre Romera (annexe 2) 63 Ibid. 64 C’est d’ailleurs le reproche que fait Caroline Goulard à cette définition quelques minutes plus tard. 65 Intervention dans : PORTE (DE LA), Xavier, « Le “data-journalisme” ou comment faire du journalisme avec les données », France Culture, Place de la Toile, [disponible en ligne], diffusée le 14 novembre 2010. 66 Lancés cette année par le GEN (Global Editor Network), en partenariat avec l’EJC (European Journalism Center) et Google, ils récompensent les réalisations de data-journalisme les plus réussies. Voir : http://datajournalismawards.org/ (consulté le 31 août 2012)

Page 20: Mémoire de master 2 (CELSA) sur le data-journalisme

19

de sous-catégories du data-journalisme. Dans un commentaire à son propre article, Caroline

Goulard le situe « dans des courants comme le web sémantique, l’ouverture des données

publiques, la visualisation de la complexité, la structuration de données67 ». Pierre Romera a un

raisonnement similaire lorsque, plus tard dans l’entretien, il affine sa définition :

Si tu veux, moi j’ai tendance à prendre le data-journalisme, et à mettre dedans : “journalisme hacker”, qui est une discipline à part entière ; “visualisation de données”, parce que c’est aussi quelque chose qui a ses codes, ses règles, avec des méthodos très particulières ; “crowdsourcing68”, c’est l’exemple que je t’ai donné avec le Guardian et les notes de frais ; et il y en a un quatrième… (silence) Oui voilà c’est tout ce dont je te parle, tout ce qui a trait à la “sécurité”, à la maîtrise de l’outil informatique69.

Enfin, certains vont avoir des définitions restrictives, situant le data-journalisme au

croisement de plusieurs pratiques. Aux dires de Sylvain Parasie, le data-journaliste serait ainsi un

profil hybride entre journaliste et développeur. C’est le sens de ses articles sur la construction de

la figure du « journaliste-programmeur » ou « journaliste “hacker” »70. Pour Caroline Goulard et

Benoît Vidal, instigateurs du projet étudiant ActuVisu sur le data-journalisme, puis de la « start-

up » Dataveyes, l’essence de data-journalisme serait plutôt à trouver au croisement de trois

disciplines - le développement, le journalisme et le design -, comme en témoigne ce visuel.

Figure 1 : Image tirée de la présentation d’ActuVisu le 1e juillet 2010, lors du « Café Data » organisé par le Social Media Club France à la Cantine, sur le thème du « Datajournalism ».

67 En commentaire de : GOULARD, Caroline, « Ce qu’aurait pu être le Sarkomètre du Nouvel Obs », OWNI, [disponible en ligne], 10 février 2010. 68 Le « crowdsourcing », « approvisionnement par la foule » en français, désigne le phénomène d’externalisation d’une tâche à un grand nombre de personnes. 69 Entretien avec Pierre Romera (annexe 2) 70 DAGIRAL, Eric et PARASIE, Sylvain, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Les Cahiers du Journalisme, n° 22/23, 2011, pp. 144-155.

Page 21: Mémoire de master 2 (CELSA) sur le data-journalisme

20

2. Les approches « culinaires »

Ces approches ont été nommées ainsi car, pour filer la métaphore culinaire, elles

définissent le data-journalisme à partir de sa « cuisine », c’est-à-dire le travail de transformation

d’une matière première – « les ingrédients » – en un produit fini – « le mets » - , après avoir suivi

un processus de traitement– « la cuisine ». En décrivant un processus singulier, ces approches

insistent sur la nouveauté du data-journalisme.

Beaucoup d’acteurs partent ainsi de « l’ingrédient principal », en l’occurrence la donnée,

pour caractériser le data-journalisme. Selon Karen Bastien, co-fondatrice de la « start-up » de

visualisation de données We do data, « [la] matière première, au lieu d’être des heures de rushs

de bandes son, des interviews ou du reportage terrain, va être de la “data”71 ». Et Jean-Marc

Manach de confirmer : « au lieu de faire de l’investigation avec des témoins, des sources, des

“gorges profondes”, on va faire de l’investigation avec les données72 ». Pour pouvoir être

traitées, ces données doivent être structurées et permettre une lecture automatisée73. Elles

nécessitent même, de l’avis de Caroline Goulard, une certaine complexité pour « mériter »

l’appellation « data-journalisme » :

Quand on fait une carte interactive où tu peux cliquer sur les régions et il y a une petite info-bulle, avec un texte, une photo et une mini vidéo, ok… La base de données derrière elle doit faire vingt lignes à tout casser : c’est pas vraiment ce que j’appelle du data-journalisme74.

Certains prennent la position opposée et définissent le journalisme de données à partir du

« mets ». Olivier Tredan, doctorant en SIC, estime ainsi que le data-journalisme « se singularise

avant tout par la médiation d’une interface web75 ». Karen Bastien ajoute que la réalisation de

data-journalisme répond d’une esthétique propre : « il faut mettre une couche de design et

d’interface qui vont faire que l’objet chiffré va devenir intéressant, ludique. C’est 71 Entretien avec Karen Bastien (annexe 4) 72 Entretien avec Jean-Marc Manach (annexe 6), in ESTIENNE, Art. cit., p. 135 73 KAYSER-BRIL, Nicolas, « On l’a pas en format ordinateur », ActuVisu, [disponible en ligne], 15 décembre 2009. 74 Entretien avec Caroline Goulard (annexe 1) 75 C’est peut-être là la principale différence entre les deux exemples introductifs de ce mémoire. Voir : TREDAN, Olivier, « Quand le journalisme se saisit du web : l’exemple du datajournalism », in 1e colloque international – Les Mutations structurelles du journalisme, [disponible en ligne], Organisé par l’Université de Brasilia, Brasilia, 25-28 avril 2011, p. 2.

Page 22: Mémoire de master 2 (CELSA) sur le data-journalisme

21

indispensable.76 ». On perçoit dans cette approche l’idée d’ « interactivité » : pour Alain Joannès

« une visualisation labellisée data journalism doit être interactive77 ». Ce terme est entendu

comme récit non-linéaire, faisant croire à l’utilisateur que c’est lui qui suscite les contenus78. Pour

Johan Hufnagel, une telle personnalisation de la navigation serait parée de vertus pédagogiques :

En bâtissant des interfaces graphiques pour accéder aux bases de données, le journalisme de données (...) offre aussi à l’usager la possibilité d’interroger n’importe quelle partie de cette base de données, de la rendre accessible et compréhensible instantanément : choix du zoom, délimitation de la zone géographique, sélection des dimensions comparées, personnalisation des critères de visualisation.79

Finalement, d’autres acteurs préfèrent une approche par la « cuisine », le processus de

transformation en quelque sorte. Aux dires du même Johan Hufnagel, le data-journalisme se

caractériserait par « du recueil et de la vérification de données, du récit, de la mise en forme80 » ;

et de poursuivre « tout cela fait partie du travail journalistique81 ». Le propre de ce genre serait à

trouver entre « l’ingrédient » et « le mets », dans l’angle donné au sujet : « on n’est pas dans la

production d’objet où l’on ferait juste des interfaces pour des bases de données, on raconte autre

chose82 ». Dans cette approche, comme dans celle par l’« ingrédient », le « mets » importe peu :

Le journalisme hacker, ce sont des processus plus ou moins automatisés et du bricolage, pour aller récupérer de la donnée. Après ce [que Jean-Marc Manach] en fait ça ne va pas forcément être un graphique interactif, ça pas forcément être une “app”, ça va être tout simplement un article, où il exploite ces données, et ça il peut le faire aussi bien sur papier que sur le web. Et pourtant ça c’est du data-journalisme83.

On se trouve dans une situation marquée par une multiplicité de définitions, certaines

étant même contradictoires, sur l’importance du rendu final notamment. Cela rend difficile

l’établissement d’un idéal-type satisfaisant.

76 Entretien avec Karen Bastien (annexe 4) 77 JOANNÈS, Alain, Data journalism. Bases de données et visualisation de l’information, Éditions du CFPJ, Décembre 2010, p. 90. 78 MITROPOULOU, Eléni, Médias, multimédia et interactivité : jeux de rôle et enjeux sémiotiques. Thèse de doctorat en sémiotique, Université de Limoges, 2007. 79 GOULARD, Caroline, « Journalisme de données », Art. cit. 80 Entretien avec Johan Hufnagel (annexe 5) 81 Ibid. 82 Entretien avec Karen Bastien (annexe 4) 83 Entretien avec Pierre Romera (annexe 2)

Page 23: Mémoire de master 2 (CELSA) sur le data-journalisme

22

3. Des idéaux-types insatisfaisants

Ces deux grands types d’approche résultent d’un travail de typologie, mais on pourrait

encore multiplier les définitions. Dans une démarche de transparence, le blog militant Uppecult

définit « le data-journalisme [comme] le fait de contredire (ou d’approuver) les croyances ou les

discours en s’appuyant sur des faits chiffrés.84 ». Dans une approche plus managériale, Caroline

Goulard estime que « le journalisme de données, c’est avant tout une transformation de

l’organisation85 ». Finalement, il semble impossible d’arriver à une définition satisfaisante dans

le « système référentiel » (ce à quoi réfère un terme) de l’approche ontologique. La confession de

Pierre Romera est sur ce point éclairante :

Nicolas c’est mon associé aujourd’hui et toutes les trois semaines on essaie de trouver la bonne “baseline” pour notre boîte. En gros on cherche une nouvelle définition au data-journalisme, un truc qui corresponde vraiment à ce qu’on fait, et qui soit pérenne, qui survive un peu au “buzzword”86.

Une solution consiste cependant à rechercher un idéal-type, au sens wébérien. Se fondant

sur le hiatus irrationalis, ou postulat d’incomplétude, Weber affirme que « la réalité est

irréductible au concept 87 », qu’elle est si complexe qu’aucune théorie ne peut l’épuiser.

Cependant, cela n’empêche pas de définir des concepts hypothétiques – des idéaux-types –, à

comparer avec la réalité du phénomène social étudié. Transporté à la linguistique, ce concept

s’avère fécond : si aucun terme ne peut englober l’intégralité d’une idée, il est possible construire

des modèles, relativement exhaustifs, se rapprochant de la vision que les acteurs s’en font.

Trois travaux de recherche, entendue au sens large, peuvent être mobilisés en ce sens.

Celui d’ActuVisu d’abord, projet étudiant au long-cours, dont les conclusions sont symbolisées

par l’image présentée plus haut : une discipline au croisement du journalisme, du développement

et du design. En entretien, Caroline Goulard précise que la « data visualisation » implique de

« mobiliser de l’infographie interactive88 ». Celui de Marlène Quintard ensuite, qui, dans son

mémoire, donne cinq éléments de définition : « un travail journalistique », « un travail

84 BADOUARD, Thibault, « Introduction au data-journalisme », Uppercult, [disponible en ligne], 27 février 2012. 85 Entretien avec Caroline Goulard (annexe 1) 86 Entretien avec Pierre Romera (annexe 2) 87 GONTHIER, Frédéric, « Weber et la notion de « compréhension », Cahiers internationaux de sociologie, n°116, 2004, pp. 35-54. 88 Entretien avec Caroline Goulard (annexe 1)

Page 24: Mémoire de master 2 (CELSA) sur le data-journalisme

23

collectif », « des références », « la donnée comme matière première », « la visualisation et

l’interactivité »89. Enfin, celui d’Olivier Tredan, qui caractérise le journalisme de données comme

« une pratique fondée sur le recueil, l'analyse statistique, la visualisation de données sur Internet

et leur traitement journalistique90 ». Dans chacune de ces définitions, les trois éléments des

« approches culinaires » reviennent en filigrane : les bases des données comme matières

premières (« l’ingrédient principal »), une pratique journalistique (« la cuisine ») et une interface

web de visualisation des données, non linéaire (« le mets »), formant ainsi un idéal-type du data-

journalisme.

Cette multiplicité de définitions du data-journalisme, et la difficulté à élaborer un idéal-

type satisfaisant montrent bien les limites d’une approche essentialiste. Comme le suggère le

cadre descriptif de la trivialité, il semble plus pertinent de tenir une démarche socio-historique, et

s’intéresser au type d’acteurs qui investissent l’expression de sens.

B. Une expression investie et promue par des acteurs extérieurs au journalisme

Il est marquant d’observer qu’à quelques exceptions près – Simon Rogers en Grande-

Bretagne ou Aaron Pilhofer aux Etats-Unis - les principaux promoteurs du journalisme de

données n’ont pas reçu de formation en journalisme. Effectivement, la « naissance différentielle »

du data-journalisme s’est faite aux Etats-Unis sous l’impulsion de « programmeurs autodidactes,

entrepreneurs du web, gestionnaires de projets web, programmeurs engagés dans les

communautés du logiciel libre ou militants de l’open data 91 », mais rarement journalistes

professionnels.

Dans le cas français, le constat est comparable, mais les acteurs diffèrent : le terme a été

« réquisitionné » principalement par des entrepreneurs du web, et non des développeurs (1). Ce

concept de « réquisition » permet d’ailleurs d’observer deux traits caractéristiques du data-

journalisme : une prétention abusive à la nouveauté (2) ainsi qu’une injonction à agir (3). 89 QUINTARD, Marlène, Op. cit., pp. 14-15. 90 TREDAN, Olivier, Art. cit., p. 1. 91 PARASIE, Art. cit., p. 3.

Page 25: Mémoire de master 2 (CELSA) sur le data-journalisme

24

1. En France, une « réquisition » par des entrepreneurs web

Sur le web français, le tout premier article92 traitant du journalisme de données est

pourtant le fait d’un journaliste professionnel : Fabrice Gonthier - formé à l’IJBA, journaliste

local, et intervenant « multimédia » en écoles de journalisme (ESJ Lille puis CFPJ) -, qui

s’entretient sur son blog93 avec Nicolas Kayser-Bril. Les terminologies utilisées sont alors

« database journalism » et sa traduction française littérale « journalisme de base de données ». Le

post est repris dans l’article de veille hebdomadaire du site InternetActu94, sous la catégorie

« données publiques », signe que le data-journalisme ne jouit pas encore d’une existence propre

en France. Deux autres exemples soutiennent cette thèse. En mars 2008, Jean-Marc Manach

évoque la campagne « free our data » lancée par le Guardian, sans évoquer aucun des signifiants

utilisés pour caractériser le data-journalisme. Dans son mémoire de recherche de master 1, rédigé

durant l’été 2009, Caroline Goulard n’utilise aucune des terminologies non plus, alors qu’un

passage fait explicitement référence aux bases de données :

Internet abolit les longueurs imposées par les maquettes de la presse papier, incite à écrire des articles plus courts mais autorise en revanche la publication des textes intégraux d’interviews, d’infographies interactives, de bases de données ou de documents de travail.95.

En juillet 2009 toujours, un second article – intitulé « Pour un journalisme de données » -,

est publié sur le tout jeune magazine en ligne, Slate96. Il est l’œuvre de Nicolas Vambremeersh,

ancien blogueur politique, et dirigeant d’une agence de communication digitale, Spintank.

Jusqu’en mars 2010 pourtant, la terminologie est hésitante entre « database journalism » et « data

journalism » ; en témoignent le blog lancé par Caroline Goulard97 ou l’utilisation des mots-clés

92 Pour déterminer les premiers articles traitant du sujet, il a été utilisé la requête « daterange: » du moteur de recherche Google, qui permet de chercher des contenus publiés entre deux dates précises. Il est néanmoins possible que des articles antérieurs aient été dé-publiés ou soient inaccessibles, comme le blog de Nicolas Kayser-Bril, « Window on the Media ». 93 GONTIER, Fabrice, « Database journalism : “un renversement de perspective” (itw) », Esprit Blog, [disponible en ligne], 4 juillet 2009. 94 « A lire ailleurs du 22 juin au 9 juillet », InternetActu, [disponible en ligne], 10 juillet 2009. 95 GOULARD, Caroline. Mutations des entreprises de presse liées au développement de leurs activités numériques. Mémoire de master 1 en Management des organisations, Sciences Po Rennes, 2009, p. 49. 96 VAMBREMEERSH, Art. cit. 97 http://databasejournalism.wordpress.com/, lancé le 1 novembre 2009, consulté le 31 août 2012.

Page 26: Mémoire de master 2 (CELSA) sur le data-journalisme

25

dans les articles d’OWNI98. Le mouvement se développe alors autour de deux pôles : ActuVisu,

projet de visualisation de l’information porté par des étudiants de l’IEP de Rennes et de l’HETIC,

lancé en avril 2010, et représenté par Caroline Goulard ; et OWNI, qui commence à publier des

articles sur le sujet. Une convergence se fait même au sein d’OWNI entre mars et août 2010, à la

faveur du lancement du « pôle datajournalisme », dirigé par Nicolas Kayser-Brill99 ; avant

qu’ActuVisu ne quitte définitivement OWNI au moment du lancement de Dataveyes,. Nicolas

Kayser-Brill partira lui aussi en octobre 2011, pour fonder Journalism++ avec Pierre Romera. Il

semblerait que ce soit durant ce court moment de convergence que la terminologie se stabilise sur

« data journalism » - malgré quelques hésitations orthographiques persistantes (cf. infra) -, et son

pendant français de « journalisme de données ». Ce sont en tout cas ces deux expressions reprises

par les médias pour décrire le phénomène100.

Les recherches de Sarah Labelle sur « la société de l’information » sont éclairantes pour

comprendre le processus d’autonomisation du data-journalisme. Comme « société de

l’information », « fracture numérique » ou « développement durable101 », un terme émerge, puis

s’impose, sans avoir de signification précise. Le terme est alors « réquisitionné » par un certain

nombre d’acteurs – dans le cas du data-journalisme : des hackers aux Etats-Unis, des

entrepreneurs du web en France -, utilisé massivement, le rendant ainsi, « incontournable ».

À l’instar de « la société de l’information » (Labelle, 2001), plus qu’un matériau idéologique ordinaire, c’est un signe écrit global qui s’apparente, comme la marque, à un nom de baptême pour tout un univers (Peninou, 1971) Nous sommes dans le régime de l’“incontournable”. L’inscription est omniprésente (…) Dans cet univers de réquisition (Labelle, 2007), il est moins coûteux pour tous, militant qui défend une cause ou équipe qui engage une recherche, de prétendre œuvrer pour un réel développement durable et pour la vraie société de l’information, que de remettre en cause ces catégories102.

La mobilisation de ce concept aide à penser deux caractéristiques du data-journalisme : la

prétention, abusive, à une nouveauté radicale dans les pratiques journalistiques, ainsi qu’une

injonction à l’action, qui masque en réalité ce flou sémantique.

98 De septembre 2009 à mars 2010, sont utilisés indifféremment les mots clés « database journalism » et « data journalism » pour qualifier les articles, avant que ce dernier ne devienne la norme. 99 GOULARD, Caroline, « La fabrique du data-journalisme », OWNI, [disponible en ligne], 20 mars 2010 ; ou KAYSER-BRIL, Nicolas, « La fabrique du data #2 », OWNI, [disponible en ligne], 25 mai 2010. 100 FANEN, Sophian, « Les journalistes à data sur les données », Libération, [disponible en ligne], 3 janvier 2012. 101 JEANNERET, Yves, « L’optique du sustainable : territoires médiatisés et savoirs visibles », Questions de communication, n°17, 2010, pp. 59-80. 102 Ibid. p. 60.

Page 27: Mémoire de master 2 (CELSA) sur le data-journalisme

26

2. Une prétention abusive à la nouveauté

C’est le propre d’une expression « réquisitionnée » : pour justifier son utilisation courante,

il faut considérer que tout ce qui se faisait auparavant était peut-être proche, mais d’une nature

différente. Selon Philippe Breton il ne s’agit pas d’un phénomène conscient, mais de

« cryptomnésie » : « nous identifions comme nouveau quelque-chose que nous connaissons déjà

mais que nous avons oublié comme tel103 ». Pourtant si l’on se réfère à l’idéal-type complet du

data-journalisme, défini plus haut, aucun des éléments ne semble particulièrement novateur : le

travail journalistique (la « cuisine »), n’est évidemment pas inédit, mais les deux autres éléments

non plus. Ainsi, le traitement de bases de données à des fins journalistiques (« l’ingrédient ») était

déjà à l’œuvre dans les années 1960 aux Etats-Unis, avec le CAR (cf. supra). La filiation est

d’ailleurs clairement assumée 104 . En revanche, concernant l’interface de visualisation

« interactive » (le « mets »), la tentation à faire « table rase » du passé est plus prégnante.

Si nul ne prétend avoir « inventé » la visualisation de statistiques, il est intéressant à ce

propos de noter l’apparition du terme « dataviz », diminutif de l’anglais « data visualization »,

qui caractériserait « l’art d’organiser les données sous forme graphique 105 ». Signifiant

intimement lié au data-journalisme par son préfixe commun, il suggère, par sa seule nouveauté,

des réalisations graphiques inédites, sans doute plus créatives, plus esthétiques, plus pertinentes,

en un mot plus abouties. Pourtant, les imaginaires créatifs – cartes de métro, lecture par flèches,

nuages de mots – peuvent être assez redondants, et les formes graphiques – histogramme

circulaire, cartogramme, cosmographe – inventées il y a parfois plusieurs siècles. Deux

illustrations étayent ce propos. Premièrement, la tentative – humoristique mais signifiante - de

mise en abîme de la notion de « dataviz », par la « start-up » We Do Data (annexe 7)106.

Deuxièmement, l’affiche de présentation d’un concours de « dataviz » organisé par Google à

l’occasion des élections présidentielles françaises de 2012 (annexe 8)107.

103 BRETON, Philippe, L’utopie de la communication : le mythe du « village planétaire », La Découverte, 2004, p.103. 104 Entretiens avec Caroline Goulard (annexe 1) et Pierre Romera (annexe 2) 105 GEVAUDAN, Camille, « Zoom sur 50 classiques de la “dataviz” », Ecrans, [disponible en ligne], 26 juin 2012. 106 « La dataviz de la dataviz », réalisée à l’occasion de l’événement « Expoviz » (annexe 7) 107 « Concours Google de dataviz » (annexe 8)

Page 28: Mémoire de master 2 (CELSA) sur le data-journalisme

27

Michaël Friendly, psychologue et statisticien à l’Université de York au Canada, remet la

représentation statistique dans une perspective historique de long terme108. Il montre que la

plupart des inventions se sont faîtes au XIXe siècle, en particulier pendant sa seconde moitié,

dans ce qu’il nomme un « âge doré109 » de la statistique graphique. Les figures clés de ce

mouvement sont Charles Minard (graphique à plusieurs variables, annexe 9 110), Florence

Nightingale (histogramme circulaire), Emile Levasseur (cartogramme), Emile Cheysson (carte en

anamorphose) ou Francis Galton (concept de corrélation). Beaucoup de représentations

contemporaines répandues s’inspirent ainsi de ces inventions, parfois de manière frappante

(annexes 10 et 11)111.

Enfin, en ce qui concerne l’ « interactivité », les promesses de personnalisation de la

navigation ne sont pas si neuves non plus. Dans les années 1980, autour de l’ « invention » du

lien hypertexte par Ted Nelson, l’image qui dominait était celle d’un « lecteur actif112 ». À la

différence des livres traditionnels au récit linéaire, l’époque encensait le nœud, le lien,

l’arborescence, le fragment ; autant de figures qui furent à la base du web tel qu’inventé par Tim

Berners-Lee en 1989. La promesse était celle d’un lecteur « libre », construisant son propre

parcours à l’aide de grandes arborescences. Le succès des « romans dont vous êtes le héros »

dans les années 1980 et 1990 en est emblématique113. Au sujet des sites d’information en ligne,

John Knox observe cette « représentation idéologique » voulant que « l’internaute [puisse] se

constituer son propre chemin114 ». Il remarque pourtant que ce sont les éditeurs du site qui

« déterminent le paradigme idéologique et le positionnement de chaque information à l’intérieur

108 Voir son projet « Milestrones in the history of thematic cartography, statistical graphics, and data visualization », accessible sur http://www.datavis.ca/milestones/ (consulté le 31 août 2012) 109 FRIENDLY, Michael, « The golden age of statistical graphics », Statistical Science, Vol. 23, 2008, pp. 502-535. 110 Voir notamment sa célèbre carte figurative des pertes de l’armée napoléonienne durant la campagne de Russie (annexe 9) 111 A titre d’exemple, nous comparons en annexe 10 les représentations graphiques de Charles de Fourcroy (1782) et de Guardian (2011), et en annexe 11 les histogrammes circulaires de Florence Nightingale (1857) et d’ActuVisu (2010) 112 JEANNERET, Yves, « Entre héritages et ruptures, la dynamique de l’obsolescence», in Économie politique de la trivialité, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 8 novembre 2011. 113 GANTIER, BOLKA, « L’expérience immersive du web documentaire : études de cas et pistes de réflexion », Les Cahiers du journalisme, n° 22/23 – automne 2011, p. 127. 114 DAGIRAL, Eric et PARASIE, Sylvain, « Presse en ligne : où en est la recherche ? », Réseaux, n° 160-161, 2010/2, p. 23.

Page 29: Mémoire de master 2 (CELSA) sur le data-journalisme

28

de celui-ci115 ». Encadré par les dispositifs techno-sémiotiques, le lecteur n’est donc pas si

« libre » qu’il y paraît.

En somme, aucun des éléments de l’idéal-type ne relève d’un changement de nature par

rapport à des pratiques antérieures. Même en combinant les trois – donnée comme matière

première, travail journalistique, interface web de visualisation non-linéaire -, il existe des

exemples antérieurs à l’apparition du terme « data-journalisme », les représentations

d’assemblées par groupes politiques après une élection par exemple, où l’utilisateur pouvait

naviguer entre différents scrutins.

3. Une injonction à agir

Si les discours d’escorte des termes « réquisitionnés » réactualisent des promesses

anciennes, ils sont également caractérisés par le mode de l’injonction : à l’instar du phénomène

d’ « open data »116, on ne sait pas très bien ce que c’est, mais « il faut y aller ». Dans l’incapacité

de définir précisément l’objet, la rhétorique se fait impérative, et impose le terme en soulignant sa

nécessité. « Pour un journalisme de données117 », « Assez d’articles, on veut des contenus ! 118 » :

les titres utilisant ce registre sont courants au moment où l’expression « data journalisme » fait

son apparition en France. Le tableau ne serait pas complet sans mentionner le texte d’Adrian

Holovaty « A fundamental way newspapers need to change119 », écrit en 2006, et considéré par

beaucoup de commentateurs comme le « manifeste » du data-journalisme, soit le texte fondateur

d’un mouvement.

115 KNOX, John, « Visual-verbal communication on online newspaper home pages », Visual communication, vol. 6(1), 2007, p. 47. Cité et traduit in : DAGIRAL, PARASIE, Ibid. 116 L’injonction est même plus forte encore dans le cas de l’open data, le signifiant « open » étant conjugué impératif. Voir GOETA, Samuel, Open data : qu’ouvre-t-on avec les données publiques ?, Mémoire de master 2 en Sciences de l’Information et de la Communication, CELSA, 2011, pp. 10-11. 117 VAMBREMEERSCH, Art. cit. 118 GOULARD, Caroline, « Assez d’articles, on veut des contenus ! », OWNI, [disponible en ligne], 17 novembre 2009 ; reproduction de l’article originel GOULARD, Caroline, « Le database journalism pour nous sauver du “frogboiling” », Database journalism, [disponible en ligne], 10 novembre 2009. 119 HOLOVATY, Adrian, Art. cit.

Page 30: Mémoire de master 2 (CELSA) sur le data-journalisme

29

La filiation suggérée par le terme est pertinente ici : tout comme le mouvement du logiciel

libre, regroupé autour de la « figure emblématique120 » de Richard Stallman et du projet GNU, on

peut dire que le mouvement du data-journalisme s’est organisé autour d’une personne - Adrian

Holovaty – et de son texte de 2006. L’article de Caroline Goulard, renommé par OWNI « assez

d’articles, on veut des contenus ! », paraphrasant ainsi la dernière phrase, était initialement

intitulé « le database journalism pour nous sauver du frogboiling121 ». Or ce titre, en plus

d’utiliser le registre de la salvation, fait explicitement référence à l’argumentaire d’Adrian

Holovaty dans son « manifeste ». Par cette répétition de l’argumentaire, les militants français se

font « apôtres122 », diffusant la « parole122 » du data-journalisme. La métaphore religieuse est

d’ailleurs très présente dans les discours d’accompagnement : on ne compte plus les « pape123 »,

« bible124 » ou « voies125 » en matière de data-journalisme.

Le rapport sacré au data-journalisme est doublé d’une prétention d’inéluctabilité. Dans

cette vision, rien de sert de lutter : le journalisme de données représente « l’avenir en marche126 ».

La question n’est plus de discuter l’opportunité pour les rédactions de lancer des projets dans

cette direction, mais de se demander « pourquoi les médias français se s’y mettent pas127 », alors

que « quelques grands exemples anglo-saxons ont clairement montré la voie128 ». Beaucoup

d’articles sur le sujet dissertent ainsi autour du supposé « retard129 » de la France par rapport à ces

pays. Ce type de discours d’accompagnement a été mis en perspective par les travaux de Julie

120 PROULX, Serge, « Les militants du code : la construction d’une culture technique alternative », in Le logiciel libre en tant que modèle d’innovation socio-technique. Pratique et développement de coopération dans les communautés, [disponible en ligne], Congrès de l’ACFAS, Université Mc Gill, Montréal, 16 mai 2006, p. 3. 121 Le « frogboiling » correspond à une légende selon laquelle si une grenouille entre dans une casserole d’eau bouillante, elle en sort immédiatement, consciente du danger. En revanche, si cette même grenouille rentre dans une casserole d’eau froide chauffée progressivement, elle ne sortira jamais et mourra de chaleur. Par analogie, on comprend que le journalisme traditionnel ne s’intéresserait qu’aux événements extraordinaires – un incendie mortel par exemple -, alors que le journalisme de données mettrait en perspective sur du long terme – disons les coupures budgétaires chez les pompiers -, jouant le rôle de lanceur d’alerte en cas de dégradation avancée d’une situation. 122 ROMERA, Pierre, « Le data-journalism notre religion », OWNI, [disponible en ligne], 30 août 2011. 123 FANEN, « Le journalisme à data sur les données », Art. cit. 124 LEDUC, Caroline, « Le data journalisme a désormais sa bible », Journalismes, [disponible en ligne], 5 décembre 2010. 125 GOULARD, Caroline, « Les quatre voies du datajournalism », OWNI, [disponible en ligne], 7 avril 2010. 126 METTOUT, Art. cit. 127 GOULARD, Caroline, « Data journalism : pourquoi les médias français ne s’y mettent pas ? », OWNI, [disponible en ligne], 8 mars 2010. 128 Entretien avec Caroline Goulard (annexe 1) 129 CASTELLI, Elodie, « Le data-journalisme peine à se développer en France », Journalismes, [disponible en ligne], le 24 janvier 2010.

Page 31: Mémoire de master 2 (CELSA) sur le data-journalisme

30

Bouchard sur « le retard français130 ». Elle montre que ces discours sont fondés sur l’angoisse et

qu’ils ne peuvent être remis en cause : lorsque l’on est dans l’urgence il est trop tard pour

réfléchir. Derrière, on perçoit un discours de type consultant, qui essaie de vendre un produit à un

dirigeant, pour « ne pas être à la traîne ». Une mise en perspective stimulante dès lors que les

principaux promoteurs français sont aujourd’hui dirigeants de « start-up ».

La mobilisation du concept de « réquisition » a permis de porter notre attention sur les

acteurs de ce que l’on peut désormais appeler le « mouvement » du data-journalisme, dans une

dimension socio-historique et communicationnelle. Dans une approche en termes de trivialité, il

convient désormais de s’attacher plus en détail les des connotations signifiants choisis pour

évoquer le data-journalisme.

C. Une dé-ontologie du data-journalisme : les riches connotations du mot « data »

Peut être encore plus que pour le « journalisme » (cf. supra), réaliser une « dé-

ontologie 131 » du « data-journalisme », et donc se concentrer sur les signifiants, s’avère

indispensable à l’analyse. En étudiant les médias informatisés, Yves Jeanneret remarque ainsi que

« le discours (…) est présent d’emblée dans la désignation des objets qu’il est censé

accompagner », dans la mesure où « l'imaginaire contenu dans les mots et les images fait

davantage qu'accompagner les objets, il les constitue132 ».

En partant de ce postulat, on remarque que les terminologies utilisées en France pour

désigner le data-journalisme sont fortement connotées. A l’inverse des expressions utilisées

outre-Atlantique, elles orientent le regard sur les données (1), et suggèrent dans le même temps

un sentiment de multitude, de foisonnement (2) ainsi que l’appartenance à un mouvement plus

large, regroupé sous une bannière « data » (3).

130 BOUCHARD, Julie, Comment le retard vient aux Français. Analyse d’un discours sur la recherche, l’innovation et la compétitivité 1940-1970, Septentrion, 2008, 328 p. 131 RASTIER, Art. cit. 132 JEANNERET, Yves, « Autre chose qu’un discours, davantage qu’un accompagnement, mieux qu’une résistance », in La communication entre libéralisme et démocratie, Terminal, n° 75, été 2011, L’Harmattan, pp. 107-117.

Page 32: Mémoire de master 2 (CELSA) sur le data-journalisme

31

1. La « data » au cœur de la terminologie française

Les expressions employées pour qualifier le data-journalisme sont extrêmement

nombreuses : « data journalism », bien sûr, mais également « database journalism », « hacker

journalism » et leurs déclinaisons françaises respectives 133 , ainsi que « data-driven

journalism134 », « computational journalism135 », ou encore « programmer-journalism136». Ces

différentes terminologies partagent beaucoup de références et de pratiques mais « ne mettent pas

exactement l’accent sur les mêmes éléments137 ». Certaines mettent ainsi l’accent sur les outils

utilisés. C’est le cas de « computational journalism », qui insiste le rôle de l’informatique, mais

également « data-driven journalism » par une référence aux logiciels de traitement de données :

"Data driven” était plus intéressant par rapport aux technos notamment. Par exemple en visualisation de données, on utilise beaucoup une librairie en Javascript qui s’appelle D3js pour “data driven documents”, donc “data driven documents”, “data driven journalism” : je pense que ce n’est pas anodin138.

Mais le plus marquant est l’opposition entre les terminologies utilisées uniquement dans

le monde anglo-saxon – « programmer journalism » et « hacker journalism » -, et celles

plébiscitées en France – « database journalism » puis « data journalism », ainsi que leurs

traductions littérales. Les premières insistent sur « une figure d’acteurs étrangère aux salles de

rédactions139 », mettant en exergue le brouillage des identités professionnelles du métier de

journaliste. Les secondes mettent au contraire l’accent sur les données, faisant miroiter les

perspectives journalistiques – entendu ici au sens de pratiques propres - d’un champ encore

relativement vierge. 133 PARASIE, Art. cit. 134 DAGIRAL, Eric et PARASIE, Sylvain, « Data-driven journalism and the public good : “Computer Assisted Reporters and “programmer-journalists” in Chicago », à paraître. 135 COHEN, Sarah, HAMILTON, James et TURNER, Fred, « Computational journalism », Communication of the ACM, Vol. 54, n° 10, pp. 66-71. 136 BETANCOURT, Leah, « How Programmer-Journalists are changing the news », Mashable, [disponible en ligne], 11 décembre 2009. 137 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Art. cit., p. 144. 138 Entretien avec Caroline Goulard (annexe 1) 139 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur : l’émergence d’une figure de journaliste “hacker” », Art. cit., p. 144.

Page 33: Mémoire de master 2 (CELSA) sur le data-journalisme

32

La connotation est plus fine encore : ce ne sont pas tant les « données » que ces

terminologies évoquent mais plus précisément la « data ». Il est ainsi significatif de voir que les

promoteurs français du data-journalisme, non contents de choisir les expressions relatives aux

données, ont parfois préféré franciser la terminologie anglaise plutôt que de la traduire

littéralement. Ainsi, à côté des « datajournalism » et « data journalism », coexistent aujourd’hui

les orthographes « datajournalisme », « data journalisme » et « data-journalisme ». Par la

terminaison « -isme », et l’ajout d’un tiret, l’expression prend une tonalité toute autre, plus

française, et naturalise ainsi son existence : il est à l’oreille moins perturbant d’entendre

« data-journalisme » que « datajournalism140 ». La nuance peut paraître marginale au premier

regard ; elle devient très signifiante au second. Un détour par l’étymologie permet de l’expliciter.

2. Un sentiment de multitude

Dans un article de 2005141, traduit récemment en français142, Norman Gray, astronome de

l’université de Glasgow, propose de relire le sens du mot « data » à la faveur des usages de la

langue. L’origine étymologique du terme est latine : « datum » est le participe passé neutre

singulier du verbe « dare », « donner », également utilisé comme nom commun – « une chose

donnée ». « Data » correspondant au pluriel. Il est employé en anglais dans ce sens mais, à

l’instar de « media » ou « agenda », s’impose à l’usage comme un singulier, jusqu’à ce que

« datum » disparaisse purement et simplement. Dans cet usage, « data » ne peut désormais plus

être simplement le pluriel de « datum » :

Privé d'ancrage, il s'est éloigné de ce simple sens dérivé pour un sens en soi distinct et indépendant. Il a alors construit des règles d'usage pour lui-même, sans être entravé par son passé latin. (…) Data ne signifie plus juste une (foutu) [sic] datum après une autre. (…) Cette acception universelle de data comme mesurable plutôt que comptable met sans ambiguïté le mot dans la même catégorie grammaticale que le "charbon", le "blé" ou le "minerai", qui est celle des noms de masse ou d'agrégat143.

La distinction anglaise entre « how much » (« quelle quantité de ») et « how many »

(« quel nombre de »), rend bien compte de cette distinction. Cette subtilité syntaxique est 140 À prononcer avec une terminaison anglaise. 141 GRAY, Norman, « Data is a singular noun », [disponible en ligne], 2 janvier 2005. 142 SALAUN, Jean-Michel, « Singulière data », [disponible en ligne], 10 avril 2012. 143 Ibid. Traduction de GRAY, Art. cit.

Page 34: Mémoire de master 2 (CELSA) sur le data-journalisme

33

masquée par l’adverbe interrogatif « combien », traduisant indifféremment la quantité et le

nombre en français. Or la traduction en « données » reproduit l'emploi originel du terme : il est

tout à fait possible en français d’additionner, compter, dénombrer des données ; on ne les

considère pas comme un bloc indivisible.

On comprend dès lors la nuance à la réquisition du terme « data » plutôt que « données ».

Alors que « la donnée » se représente facilement au singulier, - la donnée d’un problème, la

donnée du jour -, cela semble inconcevable, grammaticalement incorrect, pour « la data » :

lorsque l’on parle de « la data », on évoque un agrégat d’éléments insécables. En utilisant ainsi un

nom singulier figurant pour un tout, on signifie automatiquement la multitude, la profusion, la

masse. Johan Hufnagel, non sans quelques hésitations syntaxiques, abonde dans ce sens : « pour

moi le data c’est le recueil et le traitement de données massives (…) quand je parle de data, je

fais la différence entre le data et l’infographie, les datas c’est vraiment des données massives.

C’est un traitement de plusieurs centaines voire milliers de données144 ».  

Figure 2 : Couverture de The Economist, semaine du 27 février au 5 mars 2010

Figure 3 : Capture d’une présentation de Dataveyes intitulée « transformation de notre paysage informationnel & journalisme de données »

144 Entretien avec Johan Hufnagel (annexe 5), in QUINTARD, Op. cit.

Page 35: Mémoire de master 2 (CELSA) sur le data-journalisme

34

Le  sentiment  est  renforcé  par  la  métaphore  –  très  présente  -­‐,  du  «  déluge  »145  :  pour  

Karen   Bastien   «  la   data,   qui   était   en   petite   quantité   jusqu’ici,   arrive   par   flux,   par   trombe  

d’eau146  ».  Elle  suggère  la  surabondance,  l’envahissement  de  l’espace  personnel  par  un  amas  

de  données,  mais  également,  par   le  choix  d’un  terme  apocalyptique,  un  univers  menaçant,  

incontrôlable,   confirmant   ainsi   la   manipulation   du   registre   de   l’angoisse147.   Mais   plus  

encore  que  le  data-­‐journalisme,  cet  imaginaire  sied  au  «  Big  Data148  »,  signe  que  toutes  les  

expressions  composées  par  le  «  data  »  se  répondent,  dans  un  univers  sémantique  commun.  

3. Le rattachement à une bannière « data »

Saussure, fondamentalement opposé à l’approche classique de la grammaire, selon

laquelle un mot correspond à une chose du monde, avait posé l’idée que les mots n’ont de sens

que de manière négative, par opposition les uns avec les autres. Ils signifient « par ce qu’ils ne

sont pas », dans la mesure où chaque mot a au moins un élément de différence avec un autre.

François Rastier pousse la réflexion à son terme, et affirme que le langage se caractérise par un

« système différentiel d’oppositions et non un codage d’identités référentielles149 ». Dès lors,

« data-journalisme », à la différence du « journalisme de données », s’enrichit du sens des autres

expressions francisées partageant le terme « data » : « le Big Data », « l’open data », « la

dataviz », « le data mining ». Passons en revue leurs différentes connotations.

Par l'adjonction d’un adjectif représentant la grandeur – alors que « data » le suggère déjà

-, et le choix de majuscules, « Big Data » se place dans un registre pléonastique, signifiant plus

fortement encore ce sentiment de multitude. Le terme « open data » évoque lui une triple

signification : une transparence politique, un mouvement social et une injonction150. « Dataviz »

figure plutôt les réalisations, le « mets », en mettant l’accent sur la mobilisation d’une « narration

145 BAYET, Antoine et DUCHAMP, Agathe, « Les nouveaux habits du journalisme dans le monde du déluge des données », Regards Sur Le Numérique, [disponible en ligne], 10 mars 2011. 146 Entretien avec Karen Bastien (annexe 4) 147 BOUCHARD, Opcit. 148 GUILLAUD, Hubert, « Big data : les progrès de l’analyse de données », Internet Actu, [disponible en ligne], 3 octobre 2011. 149 RASTIER, François, « Le silence de Saussure ou l’ontologie refusée », in BOUQUET, Simon, Saussure, L’Herne, 2003, p. 26. 150 GOETA, Opcit., pp. 10-11.

Page 36: Mémoire de master 2 (CELSA) sur le data-journalisme

35

visuelle151 », plutôt qu’une « narration verbale151 », assimilée au journalisme traditionnel. Quant à

« data mining », il procède sans équivoque de la métaphore du gisement, d’une richesse enfouie à

aller déterrer. Le « data-journalisme », bien plus que le « journalisme de données » se renforce de

toutes ces connotations. En témoigne cette très longue citation de Caroline Goulard :

En fait ça a un sens parce que le mot “data” ce n’est pas uniquement la version anglaise de “donnée”. Quand on utilise le mot data en Français, de plus en plus c’est pour parler des données un peu “nouvelle génération”, parce tu as “Big Data”, “open data”, “data-vizualization”, “data-journalisme”. Parfois les gens en Français, ils vont dire “on a de la data”, pourquoi il ne disent pas “on a de la donnée” ? Le sous entendu pour moi là-dedans, c’est que quand tu parles de la data, tu as des données riches, volumineuses, en temps réel, profondes, tu es au dessus de la donnée. La donnée, c’est la « business intelligence » à l’ancienne, c’est les données pas valorisées, considérées comme des résidus de l’activité de l’entreprise. Aujourd’hui quand tu parles de data, c’est du volume, de la profondeur, de la richesse, de l’intelligence, du “Big Data”… C’est marrant d’ailleurs, parce qu’un truc comme le “data Tuesday” c’est un rassemblement tous les 1e mardi du mois. Tu as des gens qui viennent du “Big Data”, de “l’open data”, et de la visualisation, data-journalisme, et tu retrouves pas du tout les gens de la BI [Business Intelligence].152

L’idée centrale ici est celle de « données nouvelle génération », affublées de toute une

séries de qualités - « volume », « profondeur », « intelligence », « richesse » -, qui, par négation,

permettent de caractériser les données « ancienne génération ». Entre les lignes, on lit ainsi une

volonté de se défaire des représentations statistiques classiques, représentées par l’image du

« camembert » et la figure du statisticien John Tukey 153 . Mais on comprend que le

renouvellement « générationnel » se fait surtout au niveau des personnes et institutions qui

promeuvent la « data ». Comme le suggérait Samuel Goëta dans son analyse de l’ « open data »,

on se trouve face à un « mouvement social », entendu ici au sens d’ « action collective » ou

« action commune ayant pour fin d’atteindre des fins partagées154 ». Ce mouvement dispose de

ses lieux de rencontre – les « data Tuesday » organisées par les « start-up » Data Publica, Captain

Dash et MFG Labs155 ou les éphémères « cafés data » du Social Media Club France (cf. supra) -,

151 THIBAUT, Nirina, « Datajournalism : les chiffres nous parlent, écoutons les ! », YCAW, [disponible en ligne], 6 juillet 2010. 152 Entretien avec Caroline Goulard (annexe 1) 153 Grand statisticien du XXe siècle, John Tukey est renommé pour ses découvertes en mathématiques algorithmiques (transformée de Fourier rapide, etc.) et en représentations graphiques de statistiques (diagramme en boîte ou « boîte à moustache, etc.) 154 MANN, Patrice, L’action collective. Mobilisation et organisation des minorités actives, Armand Colin, 1991, coll. « U Sociologie », p. 20. 155 DESAUTEZ, Ludovic, « “Data Tuesday”, c’est parti », Les Echos, [disponible en ligne], 6 novembre 2011.

Page 37: Mémoire de master 2 (CELSA) sur le data-journalisme

36

et de ses références propres, à l’esthétique plus « sexy156 » – David Mc Candless, Manuel Lima,

Hans Rosling ou Nathan Yau157. Il est principalement porté par des acteurs économiques

émergents, qui, pour différencier leur offre d’autres entreprises déjà implantées, manipulent un

double registre d’angoisse – le déluge, l’absence de contrôle -, et d’espoir – la richesse,

l’intelligence, la créativité. C’est sous l’angle de cette action collective, de cette

bannière identitaire « data » que doit aussi se comprendre le data-journalisme.

Sous l’égide de la catégorie descriptive de trivialité, ce premier mouvement a permis de se

détacher d’une approche ontologique, rendue de toute manière impossible par la variété des

définitions récoltées. Par une analyse successive du discours des acteurs ayant installé

l’expression dans le paysage français, puis des connotations du terme « data-journalisme », il a

été possible de rattacher l’objet de recherche à une bannière plus large de la « data », décrivant

une situation, prétendument neuve, marquée les métaphores contradictoires de l’agrégat

(multitude, indivisibilité, danger) et de gisement (rareté, granularité, richesse). Ce double

discours d’angoisse et d’espoir, mobilisé autour d’une bannière commune, permet à ces acteurs

de pousser les rédactions à l’action.

Il apporte ainsi des premiers éléments de réponse à la question de la compatibilité entre

promesses du data-journalisme et imaginaires du journalisme, par la nature des promoteurs - non-

journalistes -, et des discours tenus, parfois plus commerciaux que journalistiques. Il convient

cependant de poursuivre la réflexion en examinant la critique « subjectiviste » adressée au data-

journalisme. Si l’idéal-type défini plus haut encourage à penser qu’une médiation journalistique

est nécessaire, la prétention de certains à un journalisme « objectif » invite à étudier cette

question en profondeur.

156 DESAUTEZ, Ludovic, « Avec le 1e “data Tuesday”, la data se fait plus “sexy” », Les Echos, [disponible en ligne], 17 novembre 2011. 157 SCHERER, Eric, « Données publiques et journalisme : une mine de richesses ! », OWNI, [disponible en ligne], 7 juillet 2010.

Page 38: Mémoire de master 2 (CELSA) sur le data-journalisme

37

II. Le data-journalisme comme médiation

professionnelle

"Pour moi, l'objectivité n'existe pas (…) Seule importe l'honnêteté intellectuelle158"

David Dufresne, journaliste.

Dans une émission télévisuelle intitulée « l’avènement du data-journalisme signe-t-il le

retour vers un besoin d’objectivité ? », Fabrice Epelboin, hacker, entrepreneur web et co-

fondateur d’OWNI, explique qu’une des forces du data-journalisme est de s’appuyer sur des

« faits indiscutables159 ». Dans une chronique radio, un étudiant en journalisme loue lui les

potentialités de cette nouvelle discipline qu’il nomme « journalisme Excel160 », insistant par là sur

l’aide apportée par les outils informatiques. Ce sont sur ces deux types de promesses, objectivité

et automatisation, que se fondent les principales critiques adressées au data-journalisme.

Et en effet, force est de constater que ces prétentions objectivistes ne sont pas isolées.

Elles procèdent d’un amalgame courant entre « fait » et « donnée » (A). Après avoir rappelé que

la subjectivité est inscrite dans les données à toutes les étapes de leur production (B), il s’agira de

démontrer les acteurs qui se revendiquent du data-journalisme sont conscients de ces biais. C’est

pourquoi ils défendent la nécessité d’un travail professionnel de médiation dans le traitement de

la donnée comme dans sa représentation (C). 158 « L’affaire de Tarnac : “La fabrication d’une menace”, Libération, [disponible en ligne], 16 mars 2012. 159 MENARD, Robert, « L’avénement du data-journalisme signe-t-il un retour vers un besoin d’objectivité ? », Medias[2], [disponible en ligne], juillet 2012. 160 HAUSHALTER, Louis, « Le journalisme Excel », Medias[2], date non mentionnée, [disponible en ligne].

Page 39: Mémoire de master 2 (CELSA) sur le data-journalisme

38

A. Une prétention à l’impartialité, dans un amalgame entre « fait » et « donnée »

Les tentations objectivistes se nourrissent d’une sacralisation des faits, renforcée par un

amalgame ente le « fait » et la « donnée » (1). La donnée chiffrée est ainsi perçue par certains

comme précise et impartiale, donc objective (2). Le « fact-checking », pratique journalistique

voulant démêler le vrai du faux dans les discours politique, voire quantifier leur niveau de

« véracité », se présente comme l’aboutissement polémique de ce phénomène (3).

1. Une sacralisation des faits

Le terme « objectivité » revêt en français plusieurs significations161. Dans son sens

philosophique, il correspond à « ce qui existe en soi, indépendamment du sujet pensant ».

Lorsque l’on emploie ce mot, on postule donc que les choses ont leur réalité propre, leur logique

propre, et que l’on ne peut agir sur elles en dehors de cette logique : elles s’imposent à notre

volonté., Nietzsche parle de « faitalisme162 », néologisme né de la fusion entre « fait » et

« fatalisme ». Il critique par là l’impuissance des penseurs positivistes à voir qu’« il n’y a pas de

faits, que des interprétations163 ». La tentation est forte, pour les plus « objectivistes » des

commentateurs, telle cette chroniqueuse de France Inter, de céder à cette définition :

[Le datajournaliste] envisage d'une manière différente son rôle de médiation : il s'interdit de faire appel à sa subjectivité comme dans un récit de reportage (exit le baroudeur), il ne cherche pas à produire un commentaire en contextualisant un fait par le savoir qu'il possède (exit l'éditorialiste)164.

La tension est palpable dans cette définition, entre une subjectivité qui semble

« interdite », et une objectivité absolue, qui semble impossible, en raison de la « médiation » du

journaliste. On comprend finalement que cette dernière doit se limiter à sa plus faible expression,

161 Les différentes définitions sont tirées du Trésor de la Langue Française Informatisé, à l’entrée « objectivité ». 162 CANDEL, Etienne, « Éléments de définition », in La « réalité » une approche communicationnelle, organisé par CELSA, Master 2 « Médias Informatisés et Stratégies de Communication », Neuilly-sur-Seine, 10 janvier 2012. 163 Cité dans : DELEUZE, Gilles, Nietzsche et la philosophie, 6e éd. (1962), PUF, 1983, p. 68. 164 CLARINI, Julie, « Le journalisme de données : nouveau journalisme ? », France Culture, Les idées claires, [disponible en ligne], 10 février 2011.

Page 40: Mémoire de master 2 (CELSA) sur le data-journalisme

39

et rester dans un registre de « monstration » plutôt que de « démonstration », à l’instar des grands

reportages dans les premiers temps de la télévision165.

Dans un deuxième sens, l’objectivité se définit comme « le fait d’être dépourvu de toute

partialité ». Dès lors, le journaliste « objectif » se conçoit en opposition au journaliste d’opinion,

idéologique, partisan. S’il accepte l’altération – préjudiciable mais inévitable - des faits par la

médiation journalistique de recueil, traitement, mise en perspective et mise en récit, il s’interdit

de les juger. Dans l’opposition constitutive de la presse contemporaine entre les figures du

journaliste « gatekeeper », qui exige de séparer les faits des opinions pour tirer ce qui est

important dans l’information, et « advocate », militant et pourfendeur du mythe de

l’impartialité166, c’est clairement la première qui est représentée par cette définition. La majorité

des acteurs du data-journalisme, à l’instar de Caroline Goulard, semble se situer dans ce cadre

théorique, non sans une certaine récusation de la figure du journaliste « advocate » :

Derrière, il y aussi le rejet chez Versac, et chez moi aussi, d’un journalisme à la française, beaucoup trop subjectif… pas forcément de rejet mais de lassitude du journalisme français qui est dans le commentaire permanent, dans l’opinion, la subjectivité : on va avoir un éditorialiste qui va donner son avis, etc. Personnellement j’en ai rien à f... ! 167.

La distinction avec le modèle de Janowitz se fait autour d’un amalgame, très répandu les

discours d’escorte, entre « fait » et « donnée ». Dans son texte fondateur, Adrian Holovaty prend

l’exemple d’un fait divers, un incendie mortel, pour démontrer la nécessité du data-journalisme.

Un bon traitement journalistique de cette catastrophe se ferait, selon lui, en récoltant toute une

série de données – date, heure, nombre de victimes, distance de la caserne, années d’expérience

des pompiers, etc. -, et en les comparant avec d’autres incendies pout les mettre en perspective.

Cette approche donne le sentiment que, finalement, un « fait » n’existe que par les « données »

qui le qualifient, ou autrement dit que ces dernières sont constitutives d’un fait.

165 ARQUEMBOURG-MOREAU, Jocelyne, Le temps des événements médiatiques, De Boeck, 2003, 116 p. 166 JANOWITZ, Morris, « Professional Models in Journalism : The Gatekeeper and the Advocate. », Journalism Quarterly, Printemps 1975, pp. 618-626. 167 Entretien avec Caroline Goulard (annexe 1)

Page 41: Mémoire de master 2 (CELSA) sur le data-journalisme

40

Figure 4 : logo du « datablog »

Figure 5 : première de couverture d’un ouvrage mis en vente par le Gurdian

Le logo du « datablog168 » du Guardian, semble aller dans le même sens. En associant

« facts are sacred » à l’appellation « datablog », il signifie que les données sont les seuls éléments

capables de représenter fidèlement les faits ; horizon « sacré » d’un bon journaliste. Outre cette

sacralisation critiquable du fait – Nietzsche ne disait-il pas que « les faits sont stupides, ayant de

tout temps ressemblé à un veau plus qu’à un Dieu169 » -, cette association révèle la confusion

entre le « fait » et la « donnée ». La première de couverture d’un ouvrage sur le data-journalisme

mis en vente par le Guardian 170 est encore plus éloquente : c’est la « puissance des

données [power of data] », leur force intrinsèque, qui permet d’évaluer la consistance d’un fait,

et ainsi réaliser la promesse d’une sanctification des faits.

L’amalgame est poussé plus loin encore : par un effet de synecdoque, la « donnée » en

vient à désigner le « fait ». Alors que les discours d’accompagnement utilisent généralement le

mythe de « données brutes » (ou « raw data »), Adrian Holovaty évoque dans son texte des « faits

bruts » (« raw facts171 »). Second exemple, un des premiers articles français sur le data-

journalisme semble utiliser indifféremment les deux termes. Alors qu’il est titré « Pour un

journalisme de données », l’URL de l’article mentionne le titre « Pour un journalisme de

168 Inséré dans le site du Guardian, c’est l’endroit où sont publiées toutes les réalisations de data-journalisme. 169 DELEUZE, Op. cit., p. 68. 170 ROGERS, Simon, Facts are Sacred : The power of data, Guardian Books, 2001, 92 p. 171 HOLOVATY, Art. cit.

Page 42: Mémoire de master 2 (CELSA) sur le data-journalisme

41

faits »172. Une différence entre l’URL et le titre visible intervient généralement lorsqu’un article a

été publié sous un premier titre, et que quelqu’un, généralement l’éditeur du site, a préféré en

changer. Il semblerait donc que cette personne ait interverti « faits » et « données », sans estimer

altérer le sens du titre.

Cette utilisation indifférente des deux termes peut s’expliquer par leur prétention

commune à une certaine objectivité. La donnée, par sa nature chiffrée, donc impartiale aux yeux

de beaucoup, jouit sans doute d’un effet d’autorité encore supérieur.

2. L’ « évidence » du chiffre

La différence entre le « journalisme de faits », dont se revendiquent les acteurs, et le data-

journalisme, est à trouver dans l’omniprésence du chiffre chez ce dernier. Or le chiffre, élément

quantifiable et manipulable mathématiquement, charrie avec lui une promesse d’impartialité. Le

quotidien Libération présente ainsi le journalisme de données comme un travail journalistique

s’appuyant sur « des informations chiffrées, qui sont compilées, comparées, questionnées et

présentées afin de fournir la matière objective d’un article173 ». La mission Etalab174, justifie elle

le data-journalisme par « l’exigence d’une information incontestable, qui s’appuie sur des

éléments objectifs.175 ». Et son président, Séverin Naudet, d’appliquer le même raisonnement à

l’ « open data », démarche permettant de fonder les choix « non plus sur des positions

idéologiques a priori, mais sur des analyses informées et nourries de chiffres objectifs176 ». On

pourrait multiplier ainsi les exemples opposant l’ « objectivité » du chiffre, dans son sens

d’impartialité, à l’ « idéologie ». Ce pouvoir de persuasion des données s’explique en grande

partie à leur précision. Comment comprendre autrement le titre de l’ouvrage de Philip Meyer,

pionnier de l’utilisation des bases de données en journalisme, The New Precision Journalism177 ?

172 VAMBREMEERSH, « Pour un journalisme de données », Art. cit. [disponible en ligne : http://www.slate.fr/story/8643/pour-un-journalisme-de-faits], consulté le 31 août 2012. 173 FANEN, « Le journalisme à data sur les données », Art. cit. 174 Mission rattachée au Premier Ministre, chargée de « l’ouverture des données publiques et du développement de la plateforme française d’open data ». 175 « Datajournalisme : des données pour s’informer », Etalab, [disponible en ligne], 11 juillet 2012. 176 « Le discours de Séverin Naudet au congrès i-expo », Les Echos, [disponible en ligne], 22 mai 2011. 177 MEYER, Op. cit.

Page 43: Mémoire de master 2 (CELSA) sur le data-journalisme

42

Utiliser une information chiffrée dans le domaine du social revient en effet à « apporter à

la chose dite le caractère de l’exactitude, la validité supposée évidente, voire indiscutable, que

porte un traitement statistique ou mathématique, une mesure178 ». Elle acquiert alors une valeur

d’évidence, et s’impose comme argument par sa seule existence. Cette puissance du chiffre

s’explique selon Abraham Moles par la progression dans nos société de « l’idéologie » de la

précision, qui nous fait passer « d’une constatation : “la précision c’est bien”, à une idéologie :

“n’est bien que ce qui est précis”179 ». Réservée généralement aux sciences exactes - « sciences

susceptibles de manipuler des langages formels et symboliques180 » : statistiques, économie,

économétrie –, la mesure devient également pertinente, dans le cadre de l’ « idéologie de le

précision », pour appréhender les « sciences de l’imprécis », et plus généralement tous les

phénomènes humains. Le raisonnement est celui d’un syllogisme : (i) « n’est bien que ce qui est

précis », (ii) « les interactions du monde social peuvent se mesurer », (iii) « le chiffre est donc

nécessaire pour appréhender le social ». Pierre Romera défend ainsi cette conclusion : « le

problème c’est que la “data” aujourd’hui c’est limite une condition sine qua none pour fournir

de l’information de qualité. Et à trop le négliger… Enfin ça me semble indispensable : une

information il faut la vérifier, il faut l’appuyer avec des chiffres.181 ».

Une information n’est ainsi pertinente dans le cadre du data-journalisme que si elle se

fonde sur des données chiffrées. Ces dernières sont les « briques élémentaires de

l’information182 », « des parcelles d’information, (…) des données brutes qui demandent à être

traitées pour produire des informations183 ». Le data-journalisme se différencie donc de la

pratique éditoriale du « chiffre du jour », étudiée par Etienne Candel, dans la mesure où une

donnée ne se suffit pas en elle-même pour incarner l’information : elle doit être « traitée ». Il s’en

rapproche en revanche dans la convocation de la métaphore de la physique élémentaire, à travers

la notion de « granularité », « qui fait écho à celle de l’atome avec ses nucléons, ses protons et

ses neutrons184 ». Comme l’atome, étymologiquement « qui ne peut être divisé », la donnée est

178 CANDEL, Etienne, « Une ration quotidienne de statistiques. La pratique éditoriale du “chiffre du jour” dans la presse écrite », Médiation Et Information, n° 28, 2008, p. 38. 179 MOLES, Abraham, « Introduction ». Les sciences de l’imprécis, Seuil, 1990, pp. 15-16 180 CANDEL, Art. cit., p. 39. 181 Entretien avec Pierre Romera (annexe 2) 182 JOANNES, Op. cit., p. 16. 183 Idem. 184 Idem.

Page 44: Mémoire de master 2 (CELSA) sur le data-journalisme

43

présentée comme l’ « informationnème185 », ou « unité minimale d’information185», entretenant la

confusion entre « faits » et « données ». Le « fact checking » la pousse encore plus loin, en

promettant de vérifier les « faits » à partir de données chiffrées.

3. Le « fact-checking » comme aboutissement

Le « fact checking » est une approche journalistique, mettant l’accent sur la vérification

des « faits » et des « vérités » énoncées par les hommes politiques. On devine aisément les liens

qu’il entretient avec le data-journalisme D’abord, la manipulation fréquente de statistiques : la

grande majorité de ces « vérifications » se base en effet sur des données chiffrées. Ensuite, des

discours d’escorte utilisant la même rhétorique autour du « retard français »186 et entretenant un

rapport quasiment sacré aux « faits », éléments incontestables – donc vérifiables. Enfin, une

prétention commune à réinventer le journalisme sur Internet, concrétisée par une

institutionnalisation progressive dans le monde journalistique187. Ce n’est donc pas un hasard si

les deux expressions sont souvent associées ou analysées conjointement188. Le « fact checking »

relève même pour certains d’un sous-domaine du data-journalisme : « ça rentre dans le data-

journalisme ce terme-là, parce que les compétences auxquelles ça fait appel sont celles d’un

data-journaliste189 », suggère ainsi Pierre Romera.

Il semble cependant que le « fact checking » pousse plus loin encore certaines des

prétentions du data-journalisme. Le site Politifact.com, développé par le quotidien floridien St

Petersbugh Times, et vainqueur d’un Prix Pulitzer en 2009, en est une bonne illustration. La

devise du site promet ainsi de « démêler le vrai du faux en politique [sorting out the truth in

185 CANDEL, Art. cit., p. 41 186 SÉNÉCHAL, Lorrain, « Le “fact checking” peine à s’imposer en France », OWNI, [disponible en ligne], 18 novembre 2011. 187 L’institutionnalisation est même plus poussée dans le cas du fact-checking : différentes grandes rédactions françaises ont désormais leur équipe dédiée, beaucoup à la faveur de la présidentielle (Le Monde, Libération, Le Parisien, Le Nouvel Obs, Rue 89, Sud Ouest, etc.). 188 Voir par exemple la conférence « Réinventer le journalisme avec Internet : Data journalisme, fact-checking, et nouvelles écritures numériques », organisée à la BNF le 6 juin 2012, [disponible en ligne : http://www.bnf.fr/fr/evenements_et_culture/anx_auditoriums/f.rencontres_labo.html?seance=1223907481771, consulté le 31 août 2012. 189 Entretien avec Pierre Romera (annexe 2)

Page 45: Mémoire de master 2 (CELSA) sur le data-journalisme

44

politics] ». Les signes du logo sont autant de rappels de ce slogan : l’indice de vérification en

forme de « V », la couleur verte pour ce qui est juste, la rouge pour ce qui est faux, etc.

Figure 5 : logo du site Politifact

Figure 6 : traitement d’une déclaration par le même site

Mais le site ne se contente pas de déceler le vrai du faux, il promet d’évaluer le degré de

véracité de chaque propos par la représentation d’un « truth-o-meter », néologisme désignant un

appareil de mesure (« meter ») de la vérité (« truth »). Cinq possibilités sont envisagées : vrai

(« true »), majoritairement vrai (« mostly true »), à moitié vrai (« half true »), majoritairement

faux (« mostly false ») et faux (« false »). Les déclarations politiques sont ainsi rangées en

catégories et jugées moralement selon leur degré de mensonge.

Car c’est finalement le « produit d’appel » de ces sites : pointer les hommes politiques qui

manipulent les chiffres, puis les comparer entre eux, bien plus qu’ouvrir le débat sur la manière

dont sont réalisés les calculs statistiques. L’appellation « bobaromètre » de la rubrique

« Désintox » de Libération est en ce sens explicite. Le « Véritomètre » d’OWNI procède de la

même logique de classement, en attribuant à chacun des candidats un « indice de crédibilité ».

Dans cette « démesure de la mesure190 », aboutissement de l’« idéologie de la précision »

prétendant même quantifier la vérité, François Hollande aurait ainsi un « taux de crédibilité » de

9,2 points supérieur à celui de Nicolas Sarkozy.

190 CANDEL, « Une ration quotidienne de statistiques. La pratique éditoriale du “chiffre du jour” dans la presse écrite », Art. cit., p. 46.

Page 46: Mémoire de master 2 (CELSA) sur le data-journalisme

45

Figure 7 : « Bobaromètre » de Libération Figure 8 : « Véritomètre » d’OWNI

La majorité des sites compense cette quantification outrancière par de longs commentaires

de méthode. Sur Politifact, le jugement d’une déclaration ne s’arrête pas à la répartition dans une

des cinq catégories. Il ouvre sur un article écrit où est explicitée la démarche des journalistes pour

arriver à cette conclusion, quitte à la modifier si des internautes pointent des failles dans le

raisonnement (cas de l’exemple illustré plus haut). La rédaction de la rubrique Désintox de

Libération insiste sur le caractère « ludico-statistique191 » du « bobaromètre » et son absence de

prétention à la « précision scientifique ni à l’exhaustivité191 ». Une éditorialisation est par ailleurs

effectuée pour développer les cas jugés les plus intéressants, et renvoyer l’internaute curieux vers

les sources ayant servi au raisonnement.

OWNI se place dans une position distincte. Si les journalistes affirment leur souci de

référencer chaque assertion en consacrant un onglet « données », l’article explicatif se veut

souvent plus lapidaire, en raison du nombre de cas traités. Ce dispositif tend à restreindre le

jugement d’un fait à la précision d’une donnée. Le 8 mars 2012, Eva Joly était ainsi invitée de la

matinale d’Europe 1, et aurait affirmé au bout de huit minutes et dix-sept secondes : « les

minimas sociaux, on ne peut pas vivre avec 420 euros ». Verdict des journalistes : « incorrect »

(0%) car les minimas sociaux pour une personne seule et sans enfant seraient de 474,93 euros,

soit un chiffre supérieur de plus de 10% à celui avancé par la candidate.

191 « Sarkozy, roi du “bobaromètre” (épisode 6)», Libération, [disponible en ligne], 22 mars 2012.

Page 47: Mémoire de master 2 (CELSA) sur le data-journalisme

46

Figure 9 : traitement d’une déclaration par le « Véritomètre » d’OWNI

Cependant, si l’estimation est effectivement incorrecte, eut égard aux statistiques –

considérées ici comme admises de tous -, cela rend-il l’affirmation « incorrecte » pour autant ? La

citation semble avant tout suggérer qu’il est impossible de vivre avec les minimas sociaux. Or ce

n’est pas ce qui est évalué par les journalistes, qui justifient leur verdict négatif par l’écart entre la

déclaration chiffrée et les statistiques mobilisées. On assiste ainsi à un réductionnisme de la

parole politique, et plus généralement du fait, à ses simples dimensions chiffrées. En ce sens le

« fact-checking » est l’aboutissement des prétentions « précisionnistes » du data-journalisme,

fondées sur l’idée que « la véritable médiation avec la réalité se fait par la donnée192 ».

Ces différents éléments montrent que les critiques « objectivistes » formulées à l’encontre

du data-journalisme ne sont pas infondées. Dans un amalgame entre « faits » et « données », la

précision des données est louée, sacralisée, au point de devenir nécessaire pour accéder la réalité.

Cette représentation intellectuelle se fonde sur la croyance qu’il existe des « données brutes ».

B. La « data modelée » ou le mythe de la donnée brute

Durant la conférence TED de 2009, Tim Berners Lee haranguait la foule en lui faisant

répéter « We want raw data ! We want raw data » [« nous voulons des données brutes »],

leitmotiv repris par Benoît Vidal, co-fondateur de Dataveyes, dans un de ses articles193. Pierre

Romera estime lui que le data-journalisme permet de « se réapproprier la matière même du 192 VAMBREMEERSH, Art. cit. 193 VIDAL, Benoît, « Data, data, data », Database journalism, [disponible en ligne], 24 janvier 2010.

Page 48: Mémoire de master 2 (CELSA) sur le data-journalisme

47

journalisme : le chiffre, la donnée neutre, brute194 ». Ces deux exemples attestent de la diffusion

du mythe de la donnée brute chez certains acteurs du data-journalisme. Ce mythe est d’autant

plus dangereux ici qu’il est porté par « le “bon côté” de la force : des citoyens, des citadins et/ou

des innovateurs qui veulent améliorer le fonctionnement démocratique au sens large, et non des

managers ou gestionnaires cyniques qui veulent renforcer les moyens de contrôle par des

indicateurs automatiques (des data) fort discutables et fort discutés.195 ». Une situation très

distincte de l’approche barthienne, où le « mythe » est à l’initiative de l’idéologie dominante – la

bourgeoisie -, pour diffuser sa culture et ses valeurs196.

L’expression de « données brutes » est pourtant bel et bien mythique par l’oxymore

qu’elle crée. En sciences naturelles, un corps brut est un corps qui « n’a pas subi de

manipulation, de transformation197 ». Or une « donnée » n’est paradoxalement pas « donnée »,

c’est une construction humaine. Il existe une médiation, donc une altération, à toutes les étapes de

fabrication de la donnée : de la construction catégorielle (1) à la représentation de la donnée (3),

en passant par le processus de captation et de traitement de la mesure (2).

1. La naturalisation des nomenclatures

Dans le débat mentionné en introduction sur « la vérité des chiffres198 », Alain Blum

rappelle que tout chiffre statistique est le fruit d’une histoire. Une partie des indicateurs de

mesure de la « fécondité naturelle » d’un couple, utilisée comme étalon des effets de la

contraception, est ainsi fortement inspirée des travaux du démographe italien Corrardo Gini,

critiqué pour ses conceptions biologisantes, voire eugénistes199. Dans un registre différent, Alain

Desrosières, statisticien, et Laurent Thévenot, sociologue et économiste, ont démontré le poids

des différents groupes professionnels dans la refonte des catégories socio-professionnelles

194 Entretien avec Pierre Romera (annexe 2) 195 Commentaire de Jérôme Denis, sociologue à TELECOM Paris Tech, à l’article : GUILLAUD, Hubert, « Open data (1/4) : Où en est-on ? », InternetActu, [disponible en ligne], 30 mai 2011. 196 BARTHES, Roland, Mythologies, Seuil, coll. « Points », 1970, 233 p. 197 Entrée « brut » du Trésor de la Langue Française Informatisé 198 MARTIN, Art. cit. 199 ROSENTAL, Paul-André, « La nouveauté d’un genre ancien : Louis Henry et la fondation de la démographie historique », Population, Vol. 58/1, 2003, p. 116.

Page 49: Mémoire de master 2 (CELSA) sur le data-journalisme

48

françaises, à laquelle ils étaient associés200. Assemblage composite de critères relevant du métier

(le secteur économique), du statut (salarié ou employeur) ou de la qualification (hiérarchie), la

nomenclature française « ne va pas de soi » : c’est une production liée à un contexte socio-

politique. Luc Boltanski avait entamé cette démarche constructiviste quelques années auparavant

en étudiant l’émergence de la catégorie des « cadres »201. D’un noyau originel, organisé autour

d’ingénieurs catholiques de Grandes Ecoles, l’expression de « cadre » attire progressivement des

groupes disparates « démunis jusque-là d’instances de représentations202 ». Sans être homogènes,

les « cadres » se constituent finalement en groupe social dans les années 1960, jouissant d’une

cohérence et d’une institutionnalisation propre. Ces trois exemples démontrent qu’il n’existe pas

de catégories d’analyse naturelles : ces dernières sont des construits.

Elles n’en n’ont pas moins des effets notoires sur le monde. L’exemple classique est celui

des maladies. Dans les années 1970, des médecins de différents pays ont voulu créer une

classification des maladies afin d’organiser la recherche au niveau international. L’élaboration de

la nomenclature s’est faite en regroupant des pathologies par types. Les plus difficiles à associer,

les maladies « orphelines », ont été regroupées dans la catégorie « autres », devenant ainsi des

« monstres », des éléments inclassables. Conséquence de leur exclusion, ces pathologies étaient

moins bien remboursées et recevaient moins de subventions destinées à la recherche. Un

mouvement comme le Téléthon en France, créé pour améliorer les crédits alloués à la recherche

sur la myopathie, trouve son origine dans cette mise à l’écart de la nomenclature internationale203.

Mais ce phénomène d’exclusion s’applique également à des catégories qui semblent beaucoup

plus naturelles. La division administrative hommes/femmes, longtemps considérée comme

« allant de soi », excluait de fait toutes les personnes transgenre. C’est dans cette optique que

l’Australie a récemment créé une troisième catégorie administrative : « indéterminé »204.

Cette dénaturalisation permet également de voir que les catégories ne renvoient pas

nécessairement aux mêmes phénomènes selon les pays, rendant les comparaisons internationales

difficiles. Lorsque CNN et Oméga réalisent une application de data-journalisme sur les femmes 200 DESROSIÈRES, Alain et THÉVENOT, Laurent, Les catégories socio-professionnelles, La Découverte, coll. « Repères », 1998, 127 p. 201 BOLTANSKI, Luc, Les cadres. La formation d’un groupe social, Éditions de Minuit, 1982, 523 p. 202 Ibid., p. 89. 203 Paragraphe inspiré de : DENIS, Jérôme, « Les figures de l’usager », in Sociologie des usages, organisé par CELSA, Master 2 Médias Informatisés et Stratégies de Communication, Neuilly-sur-Seine, 20 octobre 2011. 204 DAUSSY, Laure, « Australie / passeports : homme, femme et “indéterminé” », Arrêt sur images, [disponible en ligne], 15 septembre 2011.

Page 50: Mémoire de master 2 (CELSA) sur le data-journalisme

49

entrepreneuses dans le monde on est ainsi en droit de se demander si les réalités comparées sont

effectivement comparables (annexe 12)205. Constater que 12,4% des actifs colombiens sont des

femmes à la tête de leur entreprise, contre moins de 1,65% en France signifie-t-il vraiment que

les femmes colombiennes sont 7,5 fois plus entrepreneuses que les françaises comme le suggère

le titre de l’article ? Ou bien plus vraisemblablement que la précarité des situations pousse ces

femmes vers des métiers peu qualifiés (vente de rue, femme domestique, ouvrière agricole), où la

flexibilité d’une situation d’auto-entreprenariat devient un avantage concurrentiel ?

Ce type d’interrogations encourage à se plonger dans la « boîte noire » de la production

des données.

2. Le processus d’élaboration : une « boîte noire » éludée

Dans sa sociologie des sciences, Bruno Latour, définit les « boîtes noires » de l’innovation

comme les « faits scientifiques ou machines - donnant l'illusion d'exister comme réalités

autonomes, d'avoir une stabilité et de se répandre par elles-mêmes en vertu d'une sorte d'énergie

interne206 ». La production de données répond d’un système comparable, où toute la négociation

humaine, la tension entre le « réalisme » (l’épreuve des faits) et le processus d’élaboration, est

masquée par les chiffres finaux. Ce phénomène de négociation est permanent mais apparaît de

manière notoire à au moins deux étapes : l’objectif donné à la mesure et la traduction d’une

captation en chiffre.

Premièrement, en tant qu’institution, un chiffre se mesure toujours par un acteur donné et

dans un but précis, nous l’avons vu en introduction. Lors de l’année 2010, deux institutions ont

ainsi mesuré le nombre de naissances à Paris : l’INSEE et la municipalité, comptabilisant

respectivement 31 440 et 44 362 nouveau-nés207. Pourquoi un tel écart ? La raison se trouve dans

le mode de calcul : l’INSEE attribue une naissance à une ville en fonction de la localisation du

foyer de la mère, tandis que la mairie le fait en fonction du lieu de naissance, très souvent la

205 BARRINGER, Matt, « Where do the world’s most entrepreunarial women live », CNN, [disponible en ligne], avril 2012 (annexe 12). Cité in : « Les data en forme », OWNI, publié le 17 avril 2012, Art. Cit. 206 QUÉRÉ, Louis, « Les boîtes noires de Bruno Latour ou le lien social dans la machine », Réseaux, 1989, Vol. 7, n°36, p. 97. 207 CHIGNARD, Simon, « En finir avec le mythe de la donnée brute », Données ouvertes, [disponible en ligne], 1e juin 2012.

Page 51: Mémoire de master 2 (CELSA) sur le data-journalisme

50

maternité208. Or il y a fort à parier que le choix de la municipalité ait été guidé par la volonté de

mettre en avant des chiffres imposants : les modes de calcul ne sont donc pas « neutres ».

Laurent Muchielli en donne une seconde illustration avec les chiffres de la criminalité :

« on a constaté parfois que, lorsqu’un ministre d’un nouveau gouvernement prenait

l’engagement de faire baisser l’insécurité, les chiffres publiés au début de l’année suivante

enregistraient miraculeusement la baisse espérée 209 ». Il illustre par là les critiques sur

« l’opérationnalisme210 » d’une mesure. Ce risque est courant lorsque des notions sont si

complexes à objectiver – l’intelligence en est un autre exemple -, que la notion se résume à ce qui

est mesuré : est « criminalité » ce que les indicateurs de criminalité mesurent. L’institution à

l’origine de la mesure détient tous les pouvoirs pour faire évoluer les chiffres, sans que la

perception sur le terrain ait changé. Dans cette optique, « les chiffres de la police sont

fondamentalement les résultats de son activité, bien plus que les chiffres de la criminalité.211 ».

Un deuxième biais intervient dans le processus même d’observation et de recueil des

données. La simple présence d’un observateur dans un environnement modifie cet

environnement, et altère donc la notion mesurée. C’est le cas par exemple lorsque le sociologue

réalise une observation participante ou qu’il envoie des questionnaires : les réactions qu’il obtient

sont en partie au moins « provoquées » par son travail de recherche. Face à ces modifications

inévitables de l’environnement, le statisticien « redresse » les mesures obtenues, afin de limiter

l’effet distordant de l’agent observateur. Le cas emblématique est celui des enquêtes

pré-électorales d’intentions de vote, qui voient régulièrement les instituts de sondage redresser les

chiffres de certains candidats « inavouables » - celui du Front National en France -, en appliquant

des algorithmes propres. Or ces méthodes de calcul statistique sont rarement publicisées, ou

lorsque c’est le cas, ne sont analysées uniquement en cas de controverse.

On se trouve face à ce qu’Alain Desrosières nomme un « effet de cliquet » : « une fois la

quantification effectuée, les hésitations, les négociations et les traductions impliquées par le

passage d'un monde de mots à un monde de nombres disparaissent, par un effet de cliquet. On ne 208 Cela explique le chiffre incongru de 17 naissances seulement en 2010 sur les arrondissements de 1 à 9 http://opendata.paris.fr/opendata/jsp/site/Portal.jsp?document_id=61&portlet_id=102 (consulté le 31 août 2012) 209 MUCHIELLI, Laurent, Violences et insécurité. Fantasmes et réalités dans le débat français, La Découverte, 2002, 158 p.. in GOETA, Op. cit., p. 50. 210 MARTIN, Art. cit. 211 MUCHIELLI, Op. cit, in GOETA, Op. cit., p. 50.

Page 52: Mémoire de master 2 (CELSA) sur le data-journalisme

51

revient éventuellement en arrière qu'en cas de contestation.212 » Or c’est là le principal risque lié

à la notion mesurée : que l’indicateur chiffré s’autonomise de son contexte de production, de

manière à produire du sens « en soi ». Alain Blum montre ainsi qu’en plus d’être un construit,

hérité d’une histoire, le chiffre est également une « métaphore213 ». Les méthodes d’élaboration

des statistiques étant généralement très complexes, on donne un nom aux indicateurs –

« intelligence », « fécondité », « chômage » -, par souci de simplification. Or ces appellations

sont chargées d’imaginaires, de sorte que le raisonnement prend souvent son autonomie par

rapport à la construction chiffrée. Dans les années 1920-1930, la baisse de la fécondité est

interprétée comme un refus de la naissance, donc nécessairement comme une décadence de la

société. De la même manière, une baisse du PIB, une « récession », est aujourd’hui

automatiquement interprétée comme un appauvrissement de la nation, sans questionner cette

notion de « richesse ».

Ce genre de raisonnement procède d’une confusion dangereuse entre la donnée en tant

que processus de mesure et sa représentation chiffrée. D’autant que l’information chiffrée est

encore plus facilement naturalisée lorsqu’elle est représentée graphiquement.

3. Une visualisation éditorialisée des données

Après être passée d’un « monde de mots à un monde de nombres », la donnée est souvent

représentée dans le « monde des graphiques ». Le data-journalisme ne fait pas entorse à cette

observation, à tel point que certains définissaient les « dataviz » comme l’essence de cette

discipline (cf. supra I. A. 2.). Or cette mise en visibilité influence la perception du lecteur.

C’est le cas lorsque, soucieux d’accentuer son propos, un médiateur déforme une

représentation, au mépris des conventions statistiques. Ces phénomènes sont assez courants en

journalisme ; citons deux exemples. Le 12 janvier 2012, dans l’émission de France 2 dédiée à

l’élection présidentielle, « Des Paroles et des Actes », François Lenglet présente les dépenses

publiques de différents pays ou zones géographiques. La base des histogrammes ne

212 DESROSIÈRES, Alain, « Pour une politique des outils du savoir : le cas de la statistique », in Politics and Knowledge: Democratizing Knowledge in Times of the Expert, Université de Bergen, 21-22 juin 2004. In GOETA, Op. cit, p. 51. 213 BLUM, Alain in MARTIN, Olivier, Art. cit.

Page 53: Mémoire de master 2 (CELSA) sur le data-journalisme

52

correspondant pas à zéro, une différence de quinze points entre la France et les Etats-Unis se

traduit par un doublement de la surface (annexe 13). Seconde illustration, lorsque Le Point tente

de démontrer par un graphique (annexe 14) la baisse de l’utilisation du peer-to-peer, et en conclut

que cette pratique « pourrait disparaître dans les prochains mois214 ». En fait, ce graphique

représente sur l’axe des ordonnées une proportion du trafic internet : il ne démontre donc pas que

le peer-to-peer a baissé en valeur absolue, mais que sa part dans le trafic internet a diminué215.

Ces erreurs sont également fréquentes lorsque le beau est favorisé à la bonne lecture des

statistiques, esthétisme qui fait partie des promesses de rénovation du data-journalisme (cf. supra

I. C. 3., ou le titre de l’ouvrage de David McCandless « Information is Beautiful »216). Les deux

représentations qui suivent en sont une bonne illustration217.

Figure 10 : représentation de la répartition de la population à l’horizon 2033

Figure 11 : représentation du fossé entre les pays les plus riches et les plus pauvres

214 PONCET, Guerric, « Le streaming écrase le peer-to-peer : Hadopi dépassée », Le Point, [disponible en ligne], 15 octobre 2009. 215 Exemple cité par : EPELBOIN, Fabrice, « Le journalisme de données, les données ouvertes et la dictature de la transparence », ReadWriteWeb, [disponible en ligne], 19 octobre 2009. 216 MC CANDLESS, David, Information is beautiful, Collins, 2011, 256 p. 217 Exemples tirés de la présentation de Gaëtan Gaborit, « Visualisation de données : les leçons de l’histoire », http://fr.slideshare.net/gaetangab/visualisation-de-donnes-les-leons-de-lhistoire-13139160 (31 août 2012)

Page 54: Mémoire de master 2 (CELSA) sur le data-journalisme

53

La première, tirée d’un ouvrage de prospective 218 , représente la répartition de la

population mondiale à l’horizon 2033, dans l’hypothèse où les tendances démographiques

actuelles se poursuivent. Le visuel est indéniablement agréable à regarder, mais est-il plus

pertinent qu’une traditionnelle pyramide des âges ? L’utilisation d’une échelle logarithmique

trouble en effet la perception que le lecteur a des rapports entre les différentes tranches d’âge. La

seconde, pourtant tirée d’un manuel de sociologie219, est également difficile à appréhender en

raison d’une échelle de temps non proportionnelle et d’une utilisation de cercles concentriques

peu évocatrice. La représentation traditionnelle par courbes, pourtant beaucoup plus claire, est

confinée au coin en bas à droite – dernier endroit examiné dans le cadre d’une lecture occidentale

-, comme si l’auteur l’avait cachée, par « honte » de son classicisme.

Outre ces déformations graphiques, la perception des résultats peut également être

influencée par la mise en scène éditoriale des données. Dans une démonstration vidéo portant elle

aussi sur les différences de richesses entre pays, Hans Rosling, médecin et statisticien suédois, en

donne une illustration significative. Chaque disque représente un pays. Pour chacun quatre types

de données sont représentées : l’espérance de vie (ordonnée, échelle linéaire), le PIB par habitant

(abscisse, échelle logarithmique), l’appartenance continentale (couleur) et la taille du pays

(surface). La première capture correspond à la situation en 1812, la seconde en 2012.

Figure 12 : représentation des pays du monde selon l’espérance de vie et le PIB par habitant, en 1812

Figure 13 : idem en 2012

218 RAISSON, Virginie, 2033, Atlas des futurs du monde, Robert Laffont, 2010, 204 p. 219 APPELBAUM, Richard P., CARR, Deborah, DUNEIER, Mitchell, et GIDDENS, Antony, Essentials of sociology, 3e éd., W. W. Norton & Company, 2010, 499 p.

Page 55: Mémoire de master 2 (CELSA) sur le data-journalisme

54

La conclusion de la démonstration de Rosling est que les pays du monde convergent

globalement vers un idéal de santé (espérance de vie) et de richesse (PIB par habitant). Cette

convergence est symbolisée par la flèche directionnelle, qui oriente le lecteur dans son

interprétation. Une telle conclusion est pourtant amendable. Premièrement sur les indicateurs

choisis : le PIB par habitant symbolise-t-il vraiment la « richesse » ? Deuxièmement sur l’échelle

logarithmique, qui amoindrit les écarts : en 1812, l’écart entre le pays le plus « riche » et le plus

« pauvre » est grossièrement un rapport de 1 à 10 (400 à 4000) ; alors qu’en 2012, c’est un

rapport de 1 à 100 (400 contre 40000). Dès lors, la conclusion n’est-elle pas à trouver dans une

explosion des inégalités plutôt que dans une convergence mondiale ?

Enfin, sans nécessairement d’ajout sémiotique, telle la flèche de Rosling, la représentation

graphique de différents jeux de données encourage la détection de corrélations, facilement

associées à des causalités par l’œil. Or corrélation n’est pas causalité. Une corrélation est

simplement un lien mathématique entre deux variables, tandis que la causalité nécessite une

relation de cause à effet. La vente de lunettes de soleil et la vente de glaces sont ainsi corrélées.

Pourtant le port de lunettes ne donne pas soif : cette corrélation s’explique par un tiers facteur,

l’ensoleillement. De même, Simon Chignard montre que l’espérance de vie à la naissance et la

part de fumeurs d’un pays sont corrélées (annexe 15)220. Est-ce à dire que la consommation de

cigarettes allonge l’espérance de vie ? Evidement non, bien que la représentation graphique sous

forme de courbe suggère fortement cette idée. Il y a donc un risque de mésinterprétation à voir

une causalité lorsqu’il n’y a que corrélation. L’émergence de sites encourageant l’individu à

réaliser ses propres assemblages (ou « mashups ») de données – Gapminder221, Datamasher222,

etc. – ne fait qu’accentuer ce risque.

Malgré certains discours ambigus, utilisant la figure mythique de la « donnée brute », les

acteurs du data-journalisme sont néanmoins très au fait de tous ces risques, depuis l’intention

jusqu’à la visualisation. C’est pourquoi ils revendiquent que le travail de mise en perspective soit

fait par des professionnels du journalisme et de la statistique : les data-journalistes.

220 CHIGNARD, Art. cit. 221 http://www.gapminder.org/ (consulté le 31 août 2012) 222 http://www.datamasher.org/ (consulté le 31 août 2012)

Page 56: Mémoire de master 2 (CELSA) sur le data-journalisme

55

C. Le « data-journaliste » : un professionnel du traitement des données

« Le data-journalisme est du journalisme223 ». Pierre Romera peut difficilement être plus

explicite. Cette affirmation se fonde sur l’idée que la manipulation d’informations chiffrées rend

nécessaire une médiation professionnelle, respectueuse d’une certaine éthique (1). En

conséquence, le data-journalisme laisse entrevoir un nouveau rapport aux médias informatisés, où

la figure du journaliste serait confortée dans son rôle de producteur d’une information à haute

valeur ajoutée (2). On perçoit cependant une défiance de certains acteurs face aux pratiques du

journalisme professionnel, qui encourage à nuancer la citation de Pierre Romera (3).

1. Une médiation nécessaire

La proximité avec le modèle de « gatekeeper » défini par Janowitz n’empêche pas les

data-journalistes d’être conscients des altérations inévitables de l’information dans le travail de

médiation. Comme dans toute autre genre, le journaliste fait jouer sa subjectivité à toutes les

chaînes de la production de l’information : en choisissant un sujet, en hiérarchisant les données,

en les éditorialisant d’une certaine manière, en sélectionnant le type de rendu, etc. Pour Karen

Bastien finalement, « rien n’est objectif : en faisant notre travail de journaliste, on fait une

hiérarchie donc on fait des choix 224 ». Et lorsque Caroline Goulard se revendique du

« journalisme de faits », « ce n’est pas pour dire journalisme “plus objectif que les autres”, c’est

pour dire “journalisme qui va plus s’intéresser à rapporter des événements”, il sera tout aussi

subjectif que les autres225 ». Dès lors, le fait de travailler avec des chiffres ne constitue pas un

moyen plus « objectif » d’atteindre la réalité. Au contraire, il constitue un danger par leur « effet

d’autorité226 », qui rend possible toute sorte d’interprétations erronées.

C’est pourquoi il est si nécessaire pour ces acteurs que le travail de médiation soit fait par

des professionnels consciencieux. Des journalistes pour recueillir les faits, les mettre en 223 Entretien avec Pierre Romera (annexe 2) 224 Entretien avec Karen Bastien (annexe 4) 225 Entretien avec Caroline Goulard (annexe 1) 226 Ibid.

Page 57: Mémoire de master 2 (CELSA) sur le data-journalisme

56

perspective, et interroger l’origine des données qui, « comme toute source, doivent être traitées

avec scepticisme227 ». Mais également des personnes maîtrisant les statistiques « qui sauront si les

chiffres sont significatifs et quel sens leur donner228 », et évitent ainsi approximations ou

surinterprétations mentionnées plus haut. La combinaison de ces deux compétences permet de

questionner les raisonnements de certains hommes politiques, non dans une optique de

quantification de la vérité ni de classement, comme suggéraient certaines réalisations de « fact

checking », mais dans le but d’ouvrir un débat sur la production des chiffres. Car à lire certains

points de vue, le data-journalisme se veut paradoxalement un moyen de lutter contre

« l’obsession du chiffre229 », et revaloriser ainsi un objet dévoyé dans le débat public. Karen

Bastien abonde dans ce sens :

Un chiffre en soi ne veut rien dire s’il n’est pas remis dans son contexte. Lors de la présidentielle, que ce soit sur les chiffres de dettes, d’immigration, de justice, d’éducation nationale, les gens ont pu avoir l’impression que les chiffres ne voulaient plus rien dire puisque les partis s’en emparaient pour dire tout et son contraire. Mais une fois que l’on replace le chiffre dans son contexte, cela veut dire quelque chose : c’est ça notre travail de journaliste230.

À entendre ces discours, on peut se demander si les prétentions d’objectivité énumérées

plus haut ne sont pas à comprendre différemment. Aux deux premiers sens – « ce qui existe en

soi » et « ce qui est impartial » - le Trésor de la Langue Français Informatisé en ajoute un

troisième : « qualité de ce qui donne une représentation fidèle de la chose observée ». La nuance

peut sembler faible entre la « fidélité » et l’ « impartialité », elle existe pourtant. L’impartialité

suppose d’éliminer tout jugement personnel, toute pensée propre : elle s’oppose à l’ « idéologie ».

La « représentation fidèle » s’entend plus comme une honnêteté intellectuelle dans la

retranscription d’un événement. Il est possible de prendre parti, mais sans déformation grossière

de ce qui a été observé, sans omission ou surinterprétation mensongère. Dès lors,

l’objectivité revendiquée par certains est l’apanage de tous les journalistes : elle consiste à

conserver une honnêteté intellectuelle dans la construction et le récit de l’information. C’est en

tout cas le sens que donne Caroline Goulard lorsqu’elle emploie le terme d’ « objectivité » :

227 « Like any source, it should be treated with scepticism », Paul Bradshaw, dans l’introduction de BOUNEGRU, Liliana, CHAMBERS, Lucy et GRAY, Jonathan, Data Journalism Handbook, O’Reilly, juillet 2012, [disponible en ligne] 228 Nicolas Kayser-Bril, in GONTIER, Art. cit. 229 LAPOIX, Sylvain, « Mon data-journalisme à l’heure Sarkozy », OWNI, [disponible en ligne], 14 janvier 2010. 230 Entretien avec Karen Bastien (annexe 4)

Page 58: Mémoire de master 2 (CELSA) sur le data-journalisme

57

Le journaliste il a une éthique journalistique, qui va être de relater les faits au plus juste de ce qu’il a vu, avec le plus d’objectivité. C’est une éthique. Tu peux très bien déroger à ton éthique, mais ça reste de l’éthique professionnelle. Les journalistes c’est comme les scientifiques, ils essaient d’être proche de la réalité sans jamais l’atteindre, sachant très bien que ce n’est pas la réalité telle quelle qui transparaît dans leurs travaux. Et le journaliste de données c’est exactement pareil : s’il a une éthique, une démarche scientifique, c’est ce qu’on attend de lui sinon c’est un mauvais journalisme de données. Il n’a pas à biaiser les données de manière consciente, il ne doit pas manipuler les données de façon à les dénaturer parce que ça va choquer son éthique, ou sa démarche scientifique, ou les deux. Il va essayer d’être le plus honnête et le rigoureux possible. Ça relève de l’éthique professionnelle231.

C’est cette démarche de mise à distance des faits, cette « éthique professionnelle », qui

fait la spécificité de la parole journalistique, qui la définit et l’assoit par rapport à la parole

littéraire ou la parole politique. Il semble donc à ce niveau de la réflexion que le data-journalisme

comme pratique soit bel et bien « soluble » dans les imaginaires professionnels du journalisme.

Mieux, le data-journalisme permet à la presse d’entretenir un nouveau rapport aux médias

informatisés, devenus non plus un danger, mais une opportunité.

2. Un nouveau rapport aux médias informatisés

Fragilisés dans leur modèle économique, concurrencés par des contributeurs internautes,

pressés par une temporalité distincte, les titres de presses ont d’abord considéré internet, et plus

généralement les médias informatisés, comme une menace. Le data-journalisme se propose d’en

faire une opportunité, un nouveau terrain pour exercer un journalisme à forte valeur ajoutée.

Dans la continuité des discours d’escorte du web 2.0 autour de la figure du

« consommacteur232 », le développement de sites d’information en ligne a porté avec lui la

promesse du « tous journalistes ». Joël de Rosnay, fondateur du site d’information Agoravox,

annonçait ainsi le remplacement des « média de masse [sic] » par les « média des masses

[sic] »233. Au-delà de son caractère essentiellement « messianique234 », cet « imaginaire d’une

231 Entretien avec Caroline Goulard (annexe 1) 232 Néologisme formé par la fusion des termes « consommateurs » et « acteurs », qui prétend décrire l’ « empowerment » rendu possible par la technologie internet. Voir : REBILLARD, Franck, Le web 2.0 en perspective, L’Harmattan, 2007, 158 p. 233 ROSNAY (DE), Joël, La révolte du pronétariat. Des mass média aux média des masses, Fayard, coll. « Transversales », 2006, 250 p. 234 REBILLARD, Franck, « Le journalisme participatif : de l’idéologie à la pratique », Argumentum, n° 6, 2006, p.12.

Page 59: Mémoire de master 2 (CELSA) sur le data-journalisme

58

information désintermédiée235 » a favorisé la diffusion de discours considérant le web comme une

menace pour l’identité du journalisme professionnel236. Or le data-journalisme propose justement

au journaliste de « retrouver [le] rôle de médiateur qu’il a quelque peu perdu avec l’arrivée du

numérique237 ». Ce travail de médiation se ferait à partir des données, un terrain difficile d’accès,

où l’internaute ne serait pas encore à même de concurrencer le journaliste. Caroline Goulard

développe cette idée d’un « nouveau territoire à défricher238 » :

Si on avait besoin avant des journalistes, c’est parce qu’ils pouvaient aller chercher l’information là où nous on pouvait pas aller la chercher : dans les pays en guerre, dans les entreprises, au Parlement, etc. En gros s’ils faisaient pas leur travail, on n’avait pas l’information. Et ça a été pas mal bouleversé par les nouvelles technos, les réseaux sociaux en particulier, entre Twitter, les sources qui prennent directement la parole en ligne, la désintermédiation de l’information, (…) son rôle de médiateur s’est un peu amoindri. En revanche les journalistes de données, il y a peu de gens qui ont les capacités d’analyse, les moyens aussi, la capacité d’assembler les compétences pour chercher à de donner du sens, pour aller chercher l’information dans les bases de données et la restituer de façon compréhensible pour le grand public239.

Le data-journalisme, « vecteur de sens240 » pour un public sans les compétences ni le

temps pour analyser les bases de données, formule ainsi la promesse d’un journaliste web

consolidé dans sa position de médiateur. Il prend ainsi le contre-pied des recherches en sciences

sociales dépeignant des « journalistes assis et sous pression241 ». Mobilisés pour des tâches très

courtes242, souvent contraints d’effectuer la réécriture de contenus existants243, dépendants vis-à-

vis des rédactions de presse imprimée244, ces journalistes sont remis en cause dans leur identité

professionnelle245. Le data-journalisme leur offre au contraire la possibilité de s’investir dans des

projets au long cours, étalés sur plusieurs jours voire plusieurs semaines. Il propose de produire 235 TREDAN, Olivier, « Le journalisme citoyen en ligne : un public réifié », Hermès, n° 47, 2007, p. 115. 236 DAGIRAL, PARASIE, « Presse en ligne : où en est la recherche », Art. cit., p. 27. 237 JEANIARD, Lucille, « Grâce au journalisme de données, les professionnels de l’information retrouvent leur rôle de médiateur », Horizons Médiatiques, [disponible en ligne], 5 avril 2012. 238 Entretien avec Jean-Marc Manach (annexe 6) 239 Entretien avec Caroline Goulard (annexe 1) 240 KAYSER-BRIL, Nicolas, « Le data-journalisme, vecteur de sens et de profit », OWNI, [disponible en ligne], 17 avril 2011. 241 DAGIRAL, PARASIE, « Presse en ligne : où en est la recherche », Art. cit., p. 19. 242 QUANDT, Thorsten, « News, Tuning, and Content Management : An Observation Study of Old and News Routines in German Online Newsroom », in PATERSON, David et DOMINGO, Chris, Making online news. The ethnography of New Media Production, Peter Lang, 2008, pp. 76-97. 243 REBILLARD, Franck, « Du traitement de l’information à son retraitement. La publication de l’information journalistique sur l’internet », Réseaux, n° 137, pp. 31-68. 244 CABROLIÉ, Stéphane, « La recomposition d’une organisation de presse : le cas du Parisien.fr », Terrains & travaux, vol. 1, n°15, 2009, pp. 127-145. 245 SINGER, Jane B., « Who are these guys ? The online challenge to the notion of journalistic profesionalism », Journalism, Vol. 4/2, 2003, pp. 139-163

Page 60: Mémoire de master 2 (CELSA) sur le data-journalisme

59

de nouveau de « l’information à forte valeur ajoutée 246 », dans des formats difficilement

reproductibles par d’autres sites d’information, et inaccessibles à la presse papier. On observe

même dans certains titres de presse une inversion de la dépendance entre rédaction web et

rédaction papier. Au Guardian par exemple, à la faveur des logs afghans révélés par Wikileaks,

la rédaction de « data-journalistes » a fourni pendant plusieurs mois la version papier en

infographies, articles et autres mises en perspectives247.

Cette double opportunité pour les journalistes – réaffirmation de leur rôle de médiateur,

amélioration des conditions de travail -, se manifeste par la métaphore omniprésente du gisement,

reprenant ainsi les connotations du « data mining » (cf. supra I. C. 3.). Le data-journalisme se

présente ainsi comme un « futur eldorado248 » du journalisme, une « mine de richesse249 »,

permettant d’extraire des « pépites d’or250 » jusque là « enfoui[es]251 » dans une base de données.

Selon Alain Joannès, le journaliste de données est utile dans la mesure où « il sait raffiner les

données brutes pour produire de l’information252 ». La vidéo de présentation de Dataveyes est

encore plus explicite dans cette comparaison.

Figure 14 : capture d’écran tirée de la vidéo de présentation de Dataveyes

246 GOULARD, « Le journalisme de données », Art. cit. 247 ROGERS, Simon, « Wikileaks’ Afghan war logs : how our datajournalism operation work », The Guardian, [disponible en ligne], 27 juillet 2010. 248 KALOUGUINE, Tatiana, « Les données ouvertes, nouvel eldorado du data-journalisme », La voix du dodo, [disponible en ligne], 5 février 2010. 249 SCHERER, Art. cit. 250 Entretien avec Jean-Marc Manach (annexe 6) 251 CLARINI, Art. cit. 252 JOANNES, Op. cit., p. 30.

Page 61: Mémoire de master 2 (CELSA) sur le data-journalisme

60

Considérer ainsi les données comme le « nouveau pétrole » permet deux choses.

Premièrement, signifier la haute valeur, la richesse de cet amas masqué au commun des mortels :

comme le diamant, le pétrole, le minerai, l’or ou le gaz, la « data » est une matière qui nécessite

des investissements lourds, mais est porteuse d’une grande rentabilité. Deuxièmement, insister

sur le travail d’ « extraction » et de « raffinage » réalisé par le journaliste : la « data » ne se donne

pas à voir ou à comprendre immédiatement, la médiation de professionnels compétents s’avère

nécessaire. C’est finalement dans ce sens qu’il faut comprendre l’expression de « données

brutes » utilisée par certains. Non comme une donnée naturalisée, niant la médiation humaine,

mais comme une donnée qui n’a pas encore acquis toute sa valeur. Comme le pétrole brut, la

donnée brute nécessite un traitement précis et complexe pour être pleinement exploitable par

l’utilisateur final. On comprend dès lors l’enthousiasme des journalistes face à ce qui se présente

comme un nouveau genre journalistique.

3. Des lignes de fractures entre promoteurs

Si tous s’accordent sur le travail de médiation et d’ « enrichissement des contenus », la

perception des liens entre data-journalisme et journalisme diffère légèrement selon les types de

promoteurs. Pour les journalistes professionnels, ceux ayant reçu une formation en école de

journalisme, le journalisme de données est « avant tout du journalisme253 », qui se distingue

d’autres genres journalistiques par un « champ d’investigation 254 » différent. Les plus

enthousiastes y voient un moyen de faire du « journalisme augmenté255 », mais aucun ne

considère le data-journalisme comme « l’alpha et l’oméga256 » du journalisme, encore moins

comme la « fin de l’histoire 257». Il s’agit à leurs yeux, assez modestement, d’une « corde de plus

à l’arc, une branche de plus sur l’arbre258 ». Nicolas Patte résume remarquablement cette idée :

Le journaliste de données est un journaliste comme les autres. Il n’est ni grand reporter, ni journaliste d’investigation, ni journaliste politique, ni JRI, ni critique littéraire, ni éditorialiste. Comme les

253 Entretien avec Karen Bastien (annexe 4) 254 Entretien avec Johan Hufnagel (annexe 5) 255 Entretien avec Jean-Marc Manach (annexe 6) 256 Entretien avec Johan Hufnagel (annexe 5) 257 Entretien avec Jean-Christophe Féraud (annexe 3) 258 Ibid.

Page 62: Mémoire de master 2 (CELSA) sur le data-journalisme

61

autres toutefois il rassemble des faits, les analyse, les transforme, pour informer le public et il poursuit sa mission à travers la même déontologie que ses semblables. Comme un journaliste “traditionnel”, le journaliste de données peut être neutre ou s’engager politiquement259.

 

Ces développements suggèrent que le journaliste professionnel est la figure la plus à

même de faire du data-journalisme. Pas simplement la figure du journaliste « gatekeeper »,

proche des faits et médiateur proclamé impartial, mais également celle du journaliste

« advocate », engagé, qui se sert de la démarche journalistique pour dénoncer des situations. En

somme, le data-journalisme s’apparente à un « nouveau continent pour le journalisme260 », où le

journaliste continuerait d’appliquer les méthodes qui lui ont permis d’asseoir sa respectabilité et

son autorité de discours.

Les acteurs non journalistes, à l’initiative du mouvement en France comme aux Etats-

Unis, sont plus circonspects quant à ce monopole de la médiation par les journalistes. Ainsi,

l’expression de « professionnels de l’information 261 » est souvent préférée à celle de

« journalistes ». Or cette expression est beaucoup plus large que celle de « journalistes » : elle

renvoie pour Erik Neveu à « un conglomérat de métiers et d’activités ayant comme dimension

commune d’offrir des nouvelles et de l’information à des audiences262 ». Cette définition est

éclairante sur deux points au moins. Premièrement la production d’information peut se faire par

d’autres professionnels. Cette expression ne promet pas l’avènement d’une société où tout le

monde se ferait journaliste, mais remet en question le monopole de la médiation de l’information

par les journalistes professionnels. Pour ces acteurs, la production d’information de qualité ne

passe pas nécessairement par un journaliste titulaire d’une carte de presse. Caroline Goulard reste

ainsi « persuadée qu’il n’y a pas besoin de se définir comme journaliste pour être capable de

remplir ce rôle d’éditorialisation263 ». Deuxièmement, l’utilisation du terme « d’audience »

suggère de penser l’information dans un aspect plus marchand. Elle correspond à une critique

latente adressée par ces acteurs aux journalistes professionnels, qui vivraient le marketing comme

259 PATTE, Nicolas, « Datagenèse », OWNI, [disponible en ligne], 10 juin 2012. 260 HANNE, Isabelle, « “Internet reste un objet étrange dans les rédactions françaises”. Interview de Bertrand Pecquerie », Libération, [disponible en ligne], 29 mai 2012. 261 Interview de Caroline Goulard dans JEANNIARD, Art. cit ; ou RENÉ-WORMS, Pablo, « Les coulisses du journalisme de données », Le Point, [disponible en ligne], 1e décembre 2010. 262 NEVEU, Art. cit., p. 33. 263 GOULARD, « Quatre voies du data-journalisme », Art. cit.

Page 63: Mémoire de master 2 (CELSA) sur le data-journalisme

62

« quelque chose de satanique264 », et ne se préoccuperaient pas assez de générer des ressources.

C’est que suggère Pierre Romera lorsqu’il décrit les tensions au sein d’OWNI :

C’est là où ça a commencé à poser problème, parce que quand t’as 20 journalistes, et seulement 5 développeurs pour payer les salaires de tout le monde, il y a forcément un moment où ça coince, (…) il y avait cette disproportion entre les gens qui rapportent de l’argent et les gens qui consomment.

On se trouve finalement dans une situation où les journalistes professionnels acquis à la

cause du data-journalisme voient ce dernier un genre « naturellement » destiné à la profession

journalistique, alors que les premiers promoteurs, non journalistes, partagent une vision plus large

des acteurs capables de réaliser ce travail. À la question « vous considérez-vous comme

journaliste ? », Nicolas Kayser-Bril a cette réponse édifiante : « c’est écrit sur mon contrat de

travail265 ». Il manifeste par là une indifférence à être inclus dans la corporation journalistique, et

un scepticisme quant à la distinction entre journalistes professionnels et non professionnels.

Ce deuxième mouvement a permis de montrer que les critiques les plus courantes à

l’encontre du data-journalisme – objectivisme et automatisation du journalisme -, étaient

globalement infondées. Certes, il existe des prétentions objectivistes chez certains acteurs. Mais

ces discours sont à comprendre dans le sens faible de l’ « objectivité », une honnêteté

intellectuelle doublée d’une rigueur quasi-scientifique. Le mythe de « données brutes » est

finalement peu répandu, et lorsque cette expression est utilisée, elle signifie plutôt, dans une

analogie pétrolière, la nécessité d’une médiation professionnelle pour exploiter un jeu de

données. Concernant l’ « ordre du discours » et les pratiques journalistiques, les imaginaires du

journalisme professionnel semblent donc confortés, même renforcés, par le data-journalisme.

Une divergence de point de vue a cependant été notée entre, d’une part, des journalistes

professionnels convaincus de la nécessité du rôle de la corporation journalistique, et de l’autre,

des acteurs extérieurs au journalisme beaucoup plus ouverts quant à la possibilité de réaliser ce

travail rigoureux de médiation en dehors de la profession journalistique. Cette tension peut

s’expliquer en considérant le data-journalisme comme un projet politique de rénovation du

journalisme, parfois en contradiction avec ses imaginaires et repères constitutifs. 264 Entretien avec Caroline Goulard (annexe 1). 265 In PORTE (DE LA), Art. cit.

Page 64: Mémoire de master 2 (CELSA) sur le data-journalisme

63

III. Le data-journalisme comme projet politique de

« réinitialisation » du journalisme

« Libération est (…) un journal fait par des gens avec l’aide de journalistes »

Manifeste du quotidien Libération, 1973.

Le data-journalisme n’est pas simplement un genre journalistique, une discipline dont les

pratiques se veulent en adéquation avec la démarche journalistique : c’est aussi, et peut être avant

tout, un projet politique de rénovation du journalisme.

En effet, l’utilisation de bases de données par des journalistes, ou Computer Assister

Reporting (CAR) n’est pas nouvelle, nous l’avons vu. Elle se développe même particulièrement

au milieu des années 1990 aux Etats-Unis, à la faveur de l’émergence du web et d’une

démocratisation de l’informatique personnelle266. Les journalistes qui se revendiquent du CAR

sont alors dépositaires d’un « modèle épistémologique267 » dans leur pratique du journalisme. Ils

se servent des données pour révéler une « histoire cachée268 » contenue dans les données, souvent

pour démontrer une discrimination entre des groupes sociaux. Ce rôle de dénonciation est vu

comme un moyen de pousser le politique à agir, et renforce donc la figure du journaliste comme

266 GARRISON, Bruce, « Newspaper size as a factor in use of computer-assisted reporting », in Communication Technology and Policy Division of the Association for Education in Journalisme and Mass Communication, [disponible en ligne], Baltimore, août 1998. 267 DAGIRAL, PARASIE, « Data-driven journalism and the public good », Art. cit., p. 9. 268 Ibid., p. 13.

Page 65: Mémoire de master 2 (CELSA) sur le data-journalisme

64

œuvrant pour le bien public. L’intégration progressive de hackers dans les rédactions américaines

modifie sensiblement la donne.

Ce rapprochement des mondes du développement et de la presse a été facilitée par des

acteurs institutionnels intermédiaires : la Sunlight Foundation, la Knight Foundation, la Medill

School of Journalism, faculté de journalisme dépendant de la Northwestern University de

Chicago ; ces deux derniers acteurs lançant même un programme de formation à destination des

développeurs269. À la croisée du journalisme, du logiciel libre et de l’ « open data », se forme

ainsi un réseau de personnes gagnées à l’idée de transformer le journalisme à l’aide des outils

informatiques. La plus éloquente manifestation de cette ambition se trouve dans le collectif

« hacks270/hackers », créé par trois personnalités au croisement de ces réseaux271. Leur projet :

faire la « révolution des médias » et « réinitialiser le journalisme » :

Figure 15 : logo du collectif « hacks/hackers »

Cette « réinitialisation » du journalisme se veut porteuse de nouvelles « propositions

épistémologiques272 », parfois divergentes avec le modèle des journalistes de CAR, et plus

généralement avec les imaginaires et repères du journalisme professionnel. Nous en avons

dénombré trois, plus ou moins actualisées selon les personnalités et les projets : une transparence

démocratique radicale (A), la réalisation d’outils pensés avant tout pour l’action individuelle, et

non plus l’action publique (B), et une rénovation organisationnelle des rédactions, fragilisant le

rôle du journaliste dans la production de l’information (C).

269 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur », Art. cit., pp. 149-150. 270 « Hacks » est un mot d’argot américain signifiant « journalistes ». 271 Rich Gordon, professeur d’ « innovation digitale » à la Medill School of Journalism, Burt Herman, ancien correspondant de l’Associated Press, aujourd’hui entrepreneur web, et Aaron Pilhofer, journaliste et dévelopeur, en charge de l’équipe de « data-driven journalism » au New York Times. 272 Ibid., p. 2.

Page 66: Mémoire de master 2 (CELSA) sur le data-journalisme

65

A. La promesse d’une transparence démocratique radicale

La notion de transparence propose de « laisser voir ce qui se trouve derrière 273 ».

Appliquée à la démocratie, elle renvoie à la mise en lumière des secrets cachés dans les

interstices du pouvoir. Les réalisations de data-journalisme destinées à surveiller les

comportements de « puissants » - hommes politiques, industriels, etc. - s’avèrent ainsi fréquentes

(1), sans doute car elles réactualisent une figure ancienne du journalisme : le « journaliste-

justicier », qui démêle les intrigues au service du bien public (2). Le projet politique et social de

transparence porté par certains hackers se distingue cependant légèrement de celui des

journalistes par sa radicalité (3).

1. Une surveillance démocratique par les données

Si différentes personnalités se revendiquant de la culture « hacker » ont investi la presse

états-unienne au milieu des années 2000, c’est parce qu’ils font le lien entre leur engagement

démocratique et l’activité de production de l’information. Nombre d’entre eux ont ainsi

abandonné des emplois de développeur, autrement plus rémunérateurs, par souci de « participer à

quelque chose de plus grand274 ».

Ils se donnent comme ambition de renouveler la manière dont les citoyens peuvent

responsabiliser les autorités politiques. Il ne s’agit plus uniquement d’interroger les données

statistiques produites par ces autorités, pour en extraire un sens caché, mais de dénoncer des

agissements incorrects, en rendant public des documents méconnus des citoyens. Ces acteurs,

pour beaucoup également militants de l’ « open data », défendent en effet une accessibilité

maximale aux dossiers publics. La divulgation de documents touchant à l’élaboration des

politiques publiques doit permettre aux citoyens d’exercer une surveillance démocratique sur ses

représentants, en s’assurant que ces décisions ont bien été motivées par l’intérêt général. La

273 Entrée « transparence » du Trésor de la Langue Française Informatisé 274 PARASIE, Art. cit. p. 3.

Page 67: Mémoire de master 2 (CELSA) sur le data-journalisme

66

maîtrise des outils informatiques, et non simplement statistiques, est perçue par ces acteurs

comme un moyen de « [pousser] encore plus loin l’impératif de transparence275 ».

Premièrement, parce que le hacker, « bidouilleur » en français, peut mettre en œuvre « des

processus plus ou moins automatisés, du bricolage, pour aller récupérer de la donnée276 ».

Autrement dit, si les données qu’il cherche ne sont pas disponibles sous forme structurée, ce

dernier dispose des capacités techniques pour aller récolter (« scrapper ») et compiler des

informations éparpillées à plusieurs endroits, puis les présenter au lecteur de manière intelligible.

Il est moins dépendant des formats fournis par les autorités publiques. Lorsqu’il était au

Washington Post, Adrian Holovaty a ainsi réuni toutes les informations relatives à l’activité

parlementaire (présence dans l’hémicycle, dépôt d’amendements, questions, etc.) sur un même

site277, inspirant des projets similaires dans différents pays278. Le « journaliste hacker » peut alors,

à l’instar de son prédécesseur « assisté par ordinateur », croiser des jeux de données afin

d’« augmenter279 » l’information. Se servant de la base de données établie par Holovaty, la

Sunlight Foundation a établi de cette manière une corrélation entre l’origine géographique des

sénateurs et leur vote en défaveur de la réforme du système pénitencier, suggérant que les

représentants des Etats les plus peuplés en prisonniers se satisfaisaient assez bien des retombées

économiques du système actuel280.

Ensuite, il peut mettre une grande quantité de documents à disposition des internautes, et

les solliciter pour discerner les comportements potentiellement amoraux des puissants. Lors du

scandale des notes de frais des parlementaires britanniques, le Daily Telegraph s’est ainsi appuyé

sur des milliers d’individus pour faire remonter les notes les plus douteuses281. Dans la même

veine, le site CityPayment.com282 présente toutes les dépenses des autorités locales et encourage

275 PARASIE, Art. cit., p. 9. 276 Entretien avec Pierre Romera (annexe 2) 277 « The US Congress Vote Database », http://projects.washingtonpost.com/congress/112/ (consulté le 31 août 2012) 278 Citons notamment l’initiative française du collectif Regards Citoyens : http://www.nosdeputes.fr/ (consulté le 31 août 2012) 279 Entretien avec Jean-Marc Manach (annexe 6) 280 Le système pénitencier américain étant en partie privé, les propriétaires des établissements jouissent d’un certain pouvoir économique au niveau des Etats. Voir : KIRKPATRICK, Marshall, « What can you do with Government data ? Bust politicans that’s what », ReadWriteWeb, [disponible en ligne], 12 juillet 2009. 281 METTOUT, Art. cit. 282 Ce site permet aux internautes de voir tous les contrats passés par la municipalité, puis de répertorier et commenter ceux qu’il estime « truqués ». Voir : http://www.citypayments.org (consulté le 31 août 2012)

Page 68: Mémoire de master 2 (CELSA) sur le data-journalisme

67

l’utilisateur à marquer comme « truquées » [« goofy »] celles qu’il estime suspectes283. Plus

qu’une « surveillance », ces mécanismes portent la promesse d’une « sousveillance284 » au sens

de Jean-Gabriel Ganascia, où le dispositif foucaldien de panoptique285 s’inverse au profit des

« surveillés ». Ce n’est plus un regard unique qui surveille la masse, mais une infinité de regards

qui se posent sur l‘action des dirigeants. Cette inversion se traduit par une surveillance « des

puissants par tous », qui permettrait un contrôle démocratique optimal.

Dans tous ces exemples, l’objectif est cependant de faire la lumière sur des agissements

jugés immoraux (une absence soutenue à l’Assemblée), illégaux (le trucage d’un marché public,

l’achat d’un vote), voire criminels de la part d’autorités ou de personnalités publiques. En cela le

« journaliste hacker » se rapproche de la figure ancienne du journaliste justicier.

2. La réactualisation de la figure du « journaliste-justicier »

Le data-journalisme est fréquemment présenté comme un sous-genre du journalisme

d’investigation. La quatrième de couverture de l’ouvrage d’Alain Joannès affirme par exemple

qu’ « à l'ère du web et du numérique, le data journalism doit désormais figurer dans la panoplie

de l'enquêteur ». Caroline Goulard affirme elle que « l’investigation » est l’une des « quatre

voies » du data-journalisme dans la mesure où il « permet d’éclairer autrement le monde286 ».

L’entrée « journalisme » de Wikipédia est encore plus explicite :

Le journalisme d'investigation qui traite les faits dont la collecte peut être entravée par des tiers intéressés à leur non-divulgation, ou que le sujet étudié réclame un travail de recoupement long et complexe. Le journalisme de données qui consiste à analyser des données complexes ou à extraire des informations pertinentes de quantités importantes de données en est une variante287.

 

  Cette   association   commune   n’est   ni   anodine,   ni   fortuite.   Elle   manifeste   les  

représentations   communes   aux   «  journalistes   d’investigation  »   et   «  journalistes   hacker  ».  

Ces   deux   catégories   partagent   la   revendication   d’un   contrôle   démocratique   sur   les  

283 DAGIRAL, PARASIE, « Data-driven journalism and the public good », p. 26. 284 GANASCIA, Jean-Gabriel, Voir et pouvoir, qui nous surveille ?, Le Pommier, 2009, 4e de couverture. 285 FOUCAULT, Michel, Surveiller et punir, Gallimard, 1998 (1975), 360 p. 286 GOULARD, « Les quatre voies du datajournalism », Art. cit. 287 Entrée « journalisme » sur Wikipédia. http://fr.wikipedia.org/wiki/Journalisme#Les_genres_journalistiques (consulté le 31 août 2012)

Page 69: Mémoire de master 2 (CELSA) sur le data-journalisme

68

dirigeants,  quitte  à  aller  «  [écouter]  dans  les  coulisses,  [récupérer]  des  documents  cachés  (…)  

pour  révéler  les  motifs  et   les  logiques  qui  président  aux  événements288  ».  Elles   se   retrouvent  

également  dans  la  dénonciation  d’un  «  journalisme  de  connivence289  »,  qui  relaie  naïvement  

et  sans  distance  les  événements  tels  qu’ils  sont  rapportés  par  les  puissants.  Enfin,  toutes  les  

deux   sont   attachées   à   rendre   publics   les   comportements   des   individus   en   les   désignant  

nominativement   pour   «  [obtenir]   des   résultats   concrets 290  »  -­‐   une   condamnation,   une  

démission,   des   excuses   -­‐  :   c’est   la   politique   dite   du   «  naming,   blaming,   claiming291  ».   Une  

telle   proximité   renforce   le   «  journalisme   hacker  »   dans   la   mesure   où   le   personnage   du  

journaliste   d’investigation   est   fortement   ancré   dans   les   imaginaires   du   journalisme  

professionnel,  faisant  lui-­‐même  écho  à  une  figure  ancienne  :  le  journaliste  justicier.    

Cyril  Lemieux  montre  que  cette  dernière  figure  apparaît  en  France  autour  de  1750,  à  

travers  les  «  journalistes  de  combat  »  et  «  publicistes  »  qui  s’emparent  de  questions  de  justice  

collective292.  Contre  une  justice  partiale,  ils  prennent  le  rôle  de  l’avocat  ou  du  magistrat  et  

constituent  un  «  tribunal  de  second  recours293  »  pour  les  personnes  s’estimant  mal  jugées.  À  

l’orée  de  la  Révolution  Française,  ils  dénoncent  déjà  «  l’empire  censorial294  »  représenté  par  

les  institutions  publiques  et  judiciaires.  Au  XIXe,  le  journaliste  justicier  se  réincarne  dans  la  

figure   du   «  journaliste   d’enquête  »,   aux   allures   de   détective   privé.    Magnifié   par   le   genre  

émergent  du  fait-­‐divers,  il  en  vient  à  concurrencer,  par  son  apport  présumé  dans  les  affaires  

judiciaires,   le   journaliste   tribunicien.   Cette   prétention   à   «  rendre   justice  »   se   réactualise  

dans  les  années  1980-­‐1990,  avec  l’apparition  du  «  journaliste  d’investigation  ».  À  la  faveur  

d’un   double   mouvement   de   remise   en   cause   de   l’autorité   post   soixante-­‐huitarde,   et   de  

progression   de   normes   de   rentabilité   favorisant   le   «  scoop  »,   il   s’attache   désormais   à  

dénoncer   le   «  comportement   moral   et   légal   des   élites   politico-­‐administratives295  »  ;   rôle  

jusque-­‐là  réservé  à  l’éditorialiste.   288 CARDON, « Zoomer et dézoomer : les enjeux politiques des données ouvertes », Art. cit. 289 Ibid. 290 KELLER, Thiery, « La révolution hacker », OWNI, [disponible en ligne], 17 avril 2012. 291 FESTINER, William L., « The emergence and transformation of disputes: Naming, Blaming, Claiming”, Law and Society Review, Vol. 15, n° 3/4, 1980, pp. 631-654. 292 LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du journalisme justicier dans la France contemporaine », Quaderni, n° 45, 2001, p. 56. 293 Idem. 294 Expression de Camille Desmoulin, citée in : LEMIEUX, Cyril, « La Révolution française et l’excellence journalistique au sens civique. Notes de recherche », Politix, Vol. 5, n °19, 1992, p. 34. 295 LEMIEUX, « Les formats de l’égalitarisme », p. 57.

Page 70: Mémoire de master 2 (CELSA) sur le data-journalisme

69

Cette   dernière   figure,   de   laquelle   se   rapproche   celle   du   «  journalisme   hacker  »,   se  

nourrit   néanmoins   des   prétentions   justicières   des   deux   précédentes.   Au   publiciste   du  

XVIIIe,  il  reprend  la  volonté  de  faire  avancer  des  causes  d’intérêt  général.  Avec  l’enquêteur  

du   XIXe,   il   partage   un   talent   pour   démêler   les   intrigues   et   une   méticulosité   dans  

l’agencement   des   preuves.   Le   logo   du   site   d’information   ProPublica,   fréquemment   cité  

comme  une  référence  de  data-­‐journalisme296,  rend  compte  de  cette  dualité.  

 

Figure 16 : logo du site d’information ProPublica

La loupe fait référence à l’archétype de l’enquêteur privé, suggérant la nécessité d’aller

examiner ce qui est caché, ce qui est invisible à œil, sans se fier naïvement aux discours des

acteurs concernés. Le nom du site et sa devise sont eux sans équivoque quant à l’inscription des

investigations au service de l’intérêt général. On comprend ainsi les liens, étroits, entre data-

journalisme et journalisme d’investigation. La participation importante de hackers à la

construction identitaire du journalisme de données invite néanmoins à noter quelques points de

divergence quant à l’objectif final de la démarche.

3. La transparence « nue » en question

La surveillance démocratique prônée par les hackers s’inscrit dans une aspiration plus

générale à la transparence, « imaginaire constitutif d’internet297 » pour Patrice Flichy. Elle

procède d’une division du monde où ce qui est masqué est par défaut suspect, et mérite d’être

révélé au grand jour, pour s’en assurer. La conscience sociale est secondaire dans la 296 RAPHAËL, Benoît, « Propublica : journalisme à (très) haut coût, financé par des dons », OWNI, [disponible en ligne], 18 novembre 2010. 297 FLICHY, Patrice, Les imaginaires d’internet, La Découverte, 2001, 272 p. In : AIM, Olivier, « La transparence rendue visible. Médiations informatiques de l’écriture », Communication et langages, n° 147, 2006, p. 33.

Page 71: Mémoire de master 2 (CELSA) sur le data-journalisme

70

compréhension de leur méfiance à l’égard du pouvoir : ce n’est pas parce qu’un homme politique

agit mal qu’il est avant tout répréhensible, mais parce qu’il cache des informations aux citoyens,

et entrave ainsi la liberté de circulation de l’information. Dès lors le hacker se donne pour objectif

de « rendre visible ce qui est caché et accessible ce qui est confisqué298 », assimilant le bien

public à une transparence radicale. David Brin résume la dichotomie morale de cette pensée :

En un mot, la formule clé de notre nouveau monde est : Ouvert, bon. Fermé, mauvais. Tatouez-la sur votre front. Appliquez la à la technologie, à la vie des affaires, à la philosophie de la vie. C’est le concept gagnant pour les individus, les nations, pour la communauté globale des années à venir299.

Cette foi dans la vertu de « l’ouverture » procède de la théorie cybernétique de Norbert

Wiener. L’abondance de l’information y est perçue comme un objectif vital, un bouclier contre la

propagande des régimes totalitaires, ou la standardisation imposée par les industries de la culture.

Dans une métaphore organiciste, Wiener estime que limiter la communication revient ainsi à

« s’arrêter de respirer ou à s’asphyxier300 ». Et c’est la technologie, la mise en réseaux des

ordinateurs, qui doit permettre d’atteindre cet idéal de libre circulation de l’information et

permettre de construire un monde meilleur. Au secret et à la rétention des puissants, les hackers

opposent la notion de transparence, représentée par la métaphore de la lumière, que ce soit le

faisceau de Wikileaks ou le soleil de la « Sunlight Foundation ».

Figure 17 : image de l’association Wikileaks Figure 18 : logo de la Sunlight Foundation

298 KELLER, Art. cit. 299 Traduction de GOETA, Op. cit., p. 34. Voir : BRIN, David, « The transparent society », Wired, [disponible en ligne], 4 décembre 1996. 300 REBILLARD, Op. cit., p. 90.

Page 72: Mémoire de master 2 (CELSA) sur le data-journalisme

71

Le journaliste « justicier » se situe dans une approche partiellement distincte. La

surveillance démocratique qu’il effectue entend contrôler que les décisions publiques servent bien

l’intérêt général. Motivé par une certaine conscience sociale, il cherche à connaître les coulisses

du pouvoir seulement s’il pense qu’un choix ne sert pas l’intérêt général (négligence de sécurité,

discrimination d’un groupe social, népotisme, etc.). Et lorsqu’il soupçonne une motivation

intéressée, le journaliste justicier prend le temps d’enquêter en profondeur, parfois sur plusieurs

mois, pour administrer les preuves de son accusation et présenter au lecteur un récit le plus fidèle

possible de la réalité. Attaché à ce travail poussé de médiation, il fait part d’un certain

scepticisme face à la demande d’une « transparence nue301 », qui érige de fait la manipulation et

l’intéressement comme motivation par défaut de l’action publique.

Dans son essai « Against Transparency », Lawrence Lessig, célèbre juriste de la propriété

intellectuelle, donne l’exemple d’une réalisation de l’association MapLight. Cette dernière révèle

que les représentants ayant voté « oui » à un amendement de dérèglementation du secteur de

l’énergie ont reçu une moyenne de 37 700 dollars des lobbies pétrolier, minier et nucléaire, contre

11 304 dollars en moyenne pour ceux ayant voté non ; suggérant de facto que l’industrie de

l’énergie a acheté les votes de ces députés. En donnant une explication unique au vote de

l’amendement, une telle conclusion nie la complexité des facteurs de décision de chaque

représentant, et encourage le public à se détourner d’une classe politique « achetée ». Lawrence

Lessig, filant la métaphore du soleil, défend ainsi que la transparence n’est pas vertueuse en soi :

There is no questioning the good that transparency creates in a wide range of contexts, government especially. But we should also recognize that the collateral consequence of that good need not itself be good. (…) Sunlight may well be a great disinfectant. But as anyone who has ever waded through a swamp knows, it has other effects as well302.

Finalement, les imaginaires du data-journalisme et du journalisme se retrouvent dans leurs

velléités de ne pas relayer naïvement les discours des puissants, et de contrôler la probité de leurs

301 [« naked transparency »] LESSIG, Lawrence, « Against Transparency. The perils of openness in government », The New Republic, [disponible en ligne], 9 octobre 2009. 302 Ibid. La dernière phrase semble faire référence à la puanteur et/ou l’insalubrité provoquée par le soleil dans un marécage [« Il va sans dire que la transparence crée du bien dans un large éventail de contextes, relatifs à l’Etat en particulier. Mais il faut aussi reconnaître que les conséquences collatérales de ce bien, ne sont pas nécessairement le bien (…) Le soleil peut être un désinfectant très efficace. Mais quiconque a déjà pataugé dans un marécage sait qu’il a aussi d’autres effets »]

Page 73: Mémoire de master 2 (CELSA) sur le data-journalisme

72

actions. Si une divergence se fait jour quant à l’importance donnée à la notion de transparence, on

pourrait l’atténuer en remarquant l’utilisation de plus en plus fréquente de la notion de

« décryptage » dans les médias303. Par la promotion des coulisses et du caché comme « grand

motif d’explication du réel304 », cette expression se rapproche en effet de l’attitude de suspicion

hacker. Une divergence politique plus fondamentale est à trouver en analysant le deuxième sens

de la notion de transparence.

B. Des dispositifs pensés pour l’action individuelle

La notion de transparence, « faculté de mettre en lumière », s’entend également dans un

sens moins lié aux coulisses du pouvoir. Elle peut décrire la capacité à « éclairer » des chiffres

statistiques, en sortant au grand jour une « vérité » inaccessible à l’œil profane. C’est par exemple

la démarche qu’adoptaient les « journalistes assistés par ordinateurs » aux Etats-Unis, utilisant les

statistiques publiques pour révéler des discriminations illégales.

Dans le cadre du data-journalisme, le « dévoilement » d’informations contenues dans les

chiffres se fait pourtant dans une ambition sensiblement différente. En s’appuyant sur le dispositif

de la carte « zoomable », qui permet d’entrer dans l’information de manière individuelle (1), le

travail de mise en perspective des données est réduit à sa partie congrue, laissant leur

interprétation à l’utilisateur (2). La figure mobilisée est alors celle de l’individu rationnel, qui

accède à des informations sur son quartier pour maximiser ses intérêts (3).

1. La carte « zoomable » comme dispositif phare

Outre l’ancienneté d’un journalisme « assisté par ordinateur » aux Etats-Unis, le

data-journalisme a profité d’un intérêt renouvelé pour les informations micro-locales au milieu

des années des 2000. Communautés de voisinages, associations de parents d’élèves, clubs sportifs

303 AÏM, Olivier, « Introduction », in Les médias dans les sciences de l’information et de la communication, organisé par CELSA, Département « Médias et Communication », Neuilly-sur-Seine, 21 septembre 2011. 304 Ibid.

Page 74: Mémoire de master 2 (CELSA) sur le data-journalisme

73

se sont ainsi manifestés pour obtenir des données concernant leur zone géographique de

référence, que ce soit le quartier, la ville ou une entité plus grande305. C’est sur cet engouement

que se fonde Adrian Holovaty lorsqu’il lance à titre personnel le site Chicagocrimes.com en

2005, carte en ligne de la ville permettant de localiser les données criminelles. Par le travail de

qualification des données, le site permet des requêtes très précises, selon le lieu, la date, le type

d’acte délictueux, etc.306. A l’issue de ces premières expériences menées par des « start-up », de

nombreux sites d’information régionaux – Washington Post, Cincinnati Enquirer, Texas Tribune,

etc. -, emboîtent le pas en proposant des « datastores », des cartes représentant des données ultra

locales. Fort du succès d’audience de ces travaux307, le spectre des données représentées devient

très large : agressions sexuelles, prix de l’immobilier, accidents de vélo, mais aussi boîtes de

croquettes pour chiens rappelées par leur fabriquant ou répartition géographique des gains de tel

ou tel casino308.

L’instrument de navigation proposé par ces différentes initiatives est celui de la « carte

zoomable / dézoomable309 », où l’utilisateur peut jongler entre une situation locale et un aperçu

plus général. Il forme un dispositif au sens d’Yves Jeanneret et Emmanuel Souchier - « ensemble

qui relie le substrat matériel et technique de la communication et d’autre part, les formes

langagières et énonciatives qu’il rend possible310 » -, dans la mesure où il conditionne les

possibilités d’utilisation. Ce type de carte encourage l’utilisateur à aller voir par curiosité « ce qui

se passe » dans son quartier, pour se situer par rapport aux données rapportées. Dominique

Cardon compare cette situation à la première utilisation du service « Google Earth » où le réflexe

est de « partir du globe terrestre pour aller son propre lieu d’habitation311 ». L’impression

donnée est que le monde s’organise autour de la situation de l’individu. En témoignent deux des

exemples les plus cités de data-journalisme : « EveryBlock » et « Police.uk ».

305 GOULARD, « Le journalisme de données », Art. cit. 306 Interview de Sylvain Parasie, in INIZAN, « Chicago : de la prohibition au data-journalisme », Art. cit. 307 Pour le jeune Texas Tribune, plus d’un tiers des visites seraient dues à ces « datastores ». Voir : SMITH, Evan, « Lessons for the Tribune’s First 6 Months », Texas Tribune, [disponible en ligne], 10 mai 2010. 308 GOULARD, Ibid. 309 CARDON, Art. cit. 310 Entrée « dispositif » in ABLALI, Driss et DUCARD, Dominique, Vocabulaire des études sémiotiques et sémiologiques, Honoré Champion, 2009. Cité par : GOMEZ MEJIA, Gustavo, « La quête d’un point de vue communicationnel sur le web », in Poétique et usages du web, organisé par CELSA, Master 2 « Médias Informatisés et Stratégies de Communication », Neuilly-sur-Seine, 25 janvier 2012. 311 CARDON, Art. cit.

Page 75: Mémoire de master 2 (CELSA) sur le data-journalisme

74

Figure 19 : logo de l’entreprise EveryBlock

Figure 20 : page d’accueil du site Police.uk Figure 21 : capture du même site après avoir rentré une adresse

« EveryBlock » est la continuation du projet « ChicagoCrimes » lancé par Adrian

Holovaty. Il reprend la même idée – localiser des données sur une carte -, et l’étend à tous les

secteurs de la vie : ouverture de commerces, transactions immobilières, licences de débit

d’alcool, etc. Comme le suggère le logo, c’est le « bloc », le quartier, soit l’unité géographique de

référence au quotidien, qui est au centre du dispositif. Le site Police.uk procède de la même

logique en invitant l’utilisateur à entrer son code postal pour accéder aux données. S’ouvre alors

une carte répertoriant les différents types d’agressions dans un périmètre, modulable, autour de

son lieu de résidence. Contrairement aux cartes traditionnelles où les ensembles, les blocs

s’imposent à l’œil à première lecture, la vision est ici individualisée, quitte à ne montrer qu’une

infime partie de la carte.

Par la force des promesses de ces dispositifs, l’idée d’une approche personnalisée est

reprise par d’autres réalisations de data-journalisme, même en l’absence de carte. Lorsque le

Chicago Tribune présente à ses lecteurs les notes de frais des conseillers municipaux, l’entrée se

fait également par code postal312. Dans un registre différent, le quotidien USA Today a proposé, à

312 BOYER, Brian, DARDRICK, Hal, GERMUSKA, Joe et RYAN, Mark, « City Council’s $3,7 million allowance : how aldermen spent taxpayer money », The Chicago Tribune, [disponible en ligne], 7 avril 2010.

Page 76: Mémoire de master 2 (CELSA) sur le data-journalisme

75

l’occasion des dix ans des attentats du 11 septembre 2001, de représenter sur une frise

chronologique, tous les événements liés aux attentats, de 2001 à aujourd’hui. 313 Par une

synchronisation avec le compte Facebook de l’utilisateur, le dispositif permet de mettre en

relation chacun de ces événements avec un événement de la vie personnelle de l’utilisateur

(obtention de diplôme, album photo, mariage, etc.).

Tous ces exemples suggèrent que la meilleure porte d’entrée vers l’information se fait par

la situation individuelle. Une telle posture fragilise le travail de mise en perspective défendu par

les journalistes et les sciences sociales.

2. Un travail de mise en perspective fragilisé

Les journalistes « assistés par ordinateur » avaient pour ambition d’utiliser les données à

des fins de compréhension de la société. L’ouvrage de Philip Meyer, The New Precision

Journalism, disposait ainsi d’un sous-titre : « A Reporter’s Introduction to Social Sciences

Methods ». La filiation avec les sciences sociales était alors pleinement assumée. Revendiquée

même : pour ce pionnier, le journalisme avait beaucoup à apprendre des méthodes d’analyse

statistique des sciences sociales. S’inspirer de leur rigueur permettrait au journaliste de

« produire une information en rupture avec les préjugés314 », à l’image des reportages du même

Philip Meyer ou de Bill Dedman (cf. supra).

Or les usages de la statistique en sciences sociales se sont en partie construits sur deux

oppositions : l’échantillonnage contre l’exhaustivité des données, et la structure contre l’individu.

La première renvoie à l’idée qu’il est possible de rendre compte fidèlement de la réalité à partir

d’un échantillon. Souvent même, l’étude approfondie et problématisée d’ « agrégats

représentatifs315 » est plus riche que l’analyse quantitative d’une base complète et « granulaire »,

mais dont la compréhension fine est difficile. La deuxième opposition souligne la primeur des

catégories sur les individus dans l’explication du social. Les individus intéressent beaucoup

313 http://www.usatoday.com/news/911/plus_me/index.html, (consulté le 31 août 2012). Cité par Caroline Goulard lors de l’atelier de travail de la mission Etalab sur le data-journalisme, le 13 octobre 2011 : http://www.etalab.gouv.fr/pages/Atelier_de_travail_du_13_Octobre_2011_Datajournalisme-5913723.html (consulté le 31 août 2012) 314 PARASIE, « Chicago : le parrain du data-journalisme », Art. cit. 315 CARDON, Art. cit.

Page 77: Mémoire de master 2 (CELSA) sur le data-journalisme

76

moins le sociologue, l’historien ou le démographe que « le système qui les fait agir en raison de

certaines de leurs propriétés catégorielles316 ». Il est ainsi fréquent que le chercheur en sciences

sociales, et c’est là une différence fondamentale avec le journaliste d’investigation, anonymise

entièrement un terrain d’enquête pour se préserver d’une explication ad hominem317.

Les dispositifs de « carte zoomable/dézoomable » se situent dans une démarche opposée :

elles favorisent l’entrée subjective pour appréhender le social, ainsi que l’exhaustivité des bases

de données. Fidèles à la conception de transparence évoquée plus haut, les promoteurs de ce

genre de réalisations considèrent que plus la base sera exhaustive, et plus la granularité sera

importante – dans les limites du respect de la vie privée318 -, meilleure sera la connaissance. Le

travail du journaliste ou du statisticien, visant à chercher des vérités masquées dans les chiffres,

n’a dès lors plus lieu d’être, dans la mesure où « les données ne peuvent ni mentir ni cacher

quelque chose si elles sont granulaires, complètes et mises à jour régulièrement319 ». C’est cette

foi absolue et un peu naïve dans la transparence que Jason Grotto, journaliste du Chicago Tribune

formé au CAR, reproche aux projets d’Adrian Holovaty :

J’en questionne l’utilité parce que les données en elles-mêmes, que vous disent-elles ? Certes, vous avez des crimes dans votre voisinage, mais qu’est-ce que cela signifie ? Les journalistes interprètent, filtrent et font toutes sortes de choses que je considère importantes. C’est ce que nous souhaitons apporter. Les données en elles-mêmes et pour elles-mêmes n’ont pas nécessairement de valeur. Elles sont importantes pour des personnes qui savent les utiliser et leur donner du sens, mais pour l’individu lambda, je ne pense pas que cela suffise320.

On comprend bien la critique dans la mesure où l’individu, confronté à une donnée le

concernant personnellement, risque d’en avoir « une réception non rationnelle 321 ». C’est

316 Idem. 317 Voir notamment : LASCOUMES, Pierre (dir.), Favoritisme et corruption à la française. Petits arrangements avec la probité, Presses de Sciences Po, 2010, 283 p. 318 La granularité poussée de certains dispositifs, où le zoom peut se faire jusqu’à l’immeuble, pose cependant question. En incitant ainsi les utilisateurs à observer la situation de leurs voisins, elle fait peser le risque d’une situation de « sous-veillance », entendue cette fois-ci non comme le « contrôle des puissants par tous » mais comme le contrôle « de tous par tous », où chaque geste du voisin est épié. Olivier Aïm propose le terme de « paranoptique318 », néologisme entre « paranoïa » et « panoptisme », pour décrire cet affaissement du regard inquisiteur central en une infinité de regards latéraux, situation où tout le monde est invité à observer tout le monde. Les dernières évolutions du projet EveryBlock, vers un « réseau social de voisinage », où tous les événements du quartier sont rapportés et commentés abonde dans ce sens. Voir : AÏM, Olivier, « Une télévision sous surveillance. Enjeux du panoptisme dans les « dispositifs » de télé-réalité », Communication et langages, n° 141, 2004, pp. 49-59. 319 [« the data cannot lie or hide anything if they are granular, complete, and regularly updated »], in DAGIRAL, PARASIE, « Data-driven journalism and the public good », Art. cit., p. 29. 320 DAGIRAL, PARASIE, « Portrait du journaliste en programmeur », Art. cit., p. 149. 321 CANDEL, Art. cit., p. 47

Page 78: Mémoire de master 2 (CELSA) sur le data-journalisme

77

particulièrement vrai en ce qui concerne les données de la criminalité, où il est facile de

sur-interpréter les quelques faits délictueux de son quartier comme un signe de la dangerosité de

la zone. « Le nez collé dans la donnée322 », l’individu concerné ne verrait pas, par exemple, que

certains faits sont liés à une situation conjoncturelle, ou bien qu’ils demeurent très marginaux à

l’échelle nationale ; le risque étant de diffuser un « climat anxiogène323 » pourtant infondé si les

données avaient été mises en perspective.

Une telle critique omet cependant de voir que ces dispositifs n’ont pas pour objectif

l’explication du social, mais la mise à disposition outils d’aide à la décision pour que l’individu

rationnel puisse maximiser ses intérêts en connaissance de cause.

3. Des outils d’aide à la décision rationnelle

La disposition sur une carte de données ultra-locales invite spontanément à une lecture

consumériste et intéressée de ce qui est donné à voir. Ce n’est pas un hasard à ce titre si les

expériences d’utilisation des données publiques les plus populaires sont des cartes du crime324. La

prétention de celles-ci n’est pas de se demander comment évolue la criminalité au niveau macro,

mais « mon quartier est-il suffisamment protégé ? ». De la même manière, on ne s’interroge plus

sur le modèle éducatif national, mais « l’école des mes enfants a-t-elle une bon taux de

réussite ? » ; on ne se questionne pas sur les raisons de la flambée de l’immobilier, mais on

regarde dans quelle mesure son quartier a été épargné.

La conclusion de ce processus intellectuel est l’optimisation de ses intérêts : si un secteur

apparaît comme trop dangereux, ou une école trop mauvaise, l’individu rationnel prendra la

décision de déménager pour un quartier où son « utilité » sera meilleure. Les concepteurs de ces

dispositifs ne s’en cachent d’ailleurs pas : la carte est avant tout un « outil d’aide à la décision ».

322 Citation de Valérie Peugeot, in : KALOUGUINE, Art. cit. 323 Ibid. 324 TRAVIS, Alan et MULHOLLAND, Helen, « Online crime maps crash under weight of 18 million hits an hour », The Guardian, [disponible en ligne], 1e février 2011.

Page 79: Mémoire de master 2 (CELSA) sur le data-journalisme

78

It could be a citizen who finds out about something and goes and looks at it, and then makes a decision about the neighborhood, about what they’re going to bring back to their block club or what - you know, if I’m going to live here or not. So it’s a decision-making tool and a research tool for everybody325.

Aux dires de Daniel O’Neil, les dispositifs se voudraient également des « outils de

recherche », conservant ainsi, au moins formellement, l’objectif d’analyse de la société défendue

par les journalistes « assistés par ordinateurs ». En entrant dans une grande base de données selon

son gré, l’utilisateur peut « accéder aux petits bouts en fonction de son intérêt326 ». Alors que les

statisticiens dressent des « tableaux de la société si désincarnés qu’ils n’attirent plus le

public327 », ces dispositifs se proposent de renouveler l’intérêt de ce dernier, qui s’approprierait

l’information, la retiendrait plus facilement, et découvrirait peut être des choses invisibles à la

vision macro du journaliste.

Cette vision reste cependant prisonnière du niveau local. La vigilance citoyenne ne se fait

plus à l’encontre des puissants, mais des acteurs du bas de l’échelle : les fonctionnaires, les

acteurs locaux, les voisins, etc. L’interprétation des données ne tente pas de « remonter la chaîne

des causes vers les effets structurels328 » d’une situation observée, mais se contente du prisme

ultra-local, sur des variables et des entités géographiques où les individus estiment avoir un

pouvoir d’action. Par cette analyse en « caméra subjective329 », il ne s’agit plus de rendre compte

fidèlement de la réalité sociale, mais de comparer des espaces géographiques proches, sur fond de

concurrence entre les territoires : « la régie municipale s’occupe mieux du quartier d’à côté », « la

criminalité devient trop importante passé telle rue », etc. S’installe ainsi un climat de rivalité, de

lutte entre les individus pour le lieu de résidence optimal, où sont naturellement favorisés ceux

qui ont les moyens de s’installer là où le cadre de vie apparaît être le meilleur. Les dispositifs de

la carte « zoomable » ne sont donc pas un outil d’aide à la décision pour tout le monde, mais

uniquement pour ceux qui ont un pouvoir d’action, renforçant ainsi les inégalités sociales330.

325 Entretien avec Daniel O’ Neil, co-fondateur de EveryBlock, cité dans : DAGIRAL, PARASIE, « Data-driven journalism and the public good », Art. cit., p. 23. 326 Entretien avec Caroline Goulard (annexe 1) 327 CARDON, Art. cit. 328 Ibid. 329 Ibid. 330 Cette observation relance le débat sur l’opportunité de publicisation de certaines données statistiques, en raison de leur performativité. Il est ainsi fréquent de voir que des phénomènes observés se renforcent lorsqu’ils sont rendus publics, les individus avec un pouvoir d’action suffisant « fuyant » les zones ou institutions les moins favorisées. Ce débat se pose régulièrement dans le champ journalistique, comme récemment entre Thomas Legrand (France Inter)

Page 80: Mémoire de master 2 (CELSA) sur le data-journalisme

79

À travers le dispositif de la carte « zoomable », le data-journalisme actualise donc la

figure de l’individu rationnel, qui optimise ses choix en fonction des informations dont il dispose,

dans le but de maximiser ses intérêts. Contrairement au journaliste « assisté par ordinateur », qui

révélait des situations socialement inacceptables et poussait le politique à agir, ces dispositifs

n’ont pas pour objectif de participer au bien collectif. Dans ce cadre, le data-journalisme

s’éloigne donc sensiblement des mythes fondateurs du journalisme professionnel.

Cette divergence entre data-journalisme et imaginaires du journalisme s’observe

également dans la prétention du premier à changer en profondeur l’organisation des rédactions.

C. La « data », levier d’une organisation « décloisonnée » des médias

Omettre l’ambition de transformation des organisations médiatiques lorsque l’on étudie le

data-journalisme serait prendre ce dernier par « le petit bout de la lorgnette331 ». Ce projet

managérial propose de faire du journaliste un chef de projet web, discutant avec différentes

compétences (1). Il invite à repenser la place de l’internaute dans la production de l’information :

lorsque ce dernier est expert sur un domaine, il est ainsi encouragé à concurrencer le journaliste

(2). Ses fondements idéologiques – management par projet, « société en réseau » - questionnent

l’émergence d’un « nouvel esprit du journalisme », en symbiose avec le « nouvel esprit du

capitalisme » décrit par Luc Boltanski et Ève Chiapello (3).

1. Un journaliste chef de projet web

Les promoteurs du data-journalisme partagent un même constat : le cloisonnement du

journaliste professionnel dans la production de l’information. Ce dernier est dépeint comme un

et Eric Mettout (L’Express) sur le sujet du classement des lycées. Voir : METTOUT, Eric, « Pourquoi nous classons les lycées (réponse à Thomas Legrand) », L’Express, [disponible en ligne], 6 avril 2012. 331 Entretien avec Caroline Goulard (annexe 1)

Page 81: Mémoire de master 2 (CELSA) sur le data-journalisme

80

travailleur « solitaire332 », « isolé333 », « qui bosse dans son coin334 » et « [écrit] trois ou quatre

articles par jour tout seul335 ». Le data-journalisme propose au contraire un fonctionnement

« hyper collaboratif336 », où le journaliste est amené à travailler avec d’autres compétences tout

au long du traitement et de la mise en forme des données. Designers comme développeurs

seraient associés dès l’amont de la réalisation, afin d’intégrer pleinement les dimensions

esthétiques et techniques au travail journalistique L’influence managériale de ces

recommandations est celle de la « gestion de projet web337 ». Une telle parenté suggère deux

évolutions pour le journaliste, l’une au niveau de ses compétences, l’autre de son statut.

Premièrement une relative maîtrise technique de la part du journaliste devient nécessaire.

Pour la plupart des promoteurs, cela ne signifie pas que « les rôles vont s’inverser338 » : le

journaliste ne devra pas apprendre toutes les ficelles du code mais simplement être capable parler

la même langue avec un développeur web. Ce degré de maîtrise « minimal » est cependant assez

élevé chez certains programmeurs, venus au journalisme par conviction mais également par défi

technique ; les échéances de court terme du monde de la presse nécessitant de coder vite et bien.

Il est ainsi fréquent d’entendre des personnes acquis à la cause du data-journalisme fustiger

le « journaliste qui ne sait pas calculer une moyenne339 » et réclamer « une approche de la techno

bien meilleure que nos journalistes littéraires340 ». Ces injonctions fréquentes, tendant parfois à

faire de la programmation « l’avenir du journalisme 341 », se nourrissent par ailleurs, la

prééminence d’une « nouvelle espèce hybride342 », journaliste et programmeur, tels d’Adrian

Holovaty (EveryBlock), Aaron Pilhofer (New York Times) ou Dan Nguyen (ProPublica). Elle fait

craindre aux journalistes une modification de la pratique de leur métier, à l’instar d’Owen

Youngman, fondateur et ancien directeur de la rédaction web du Chicago Tribune :

332 Ibid. 333 VALENCOT, Corentin, « Hack the Press #2 relance le data-journalisme en France », Horizons Médiatiques, [disponible en ligne], 13 janvier 2012. 334 Karen Bastien lors de l’atelier de la mission Etalab sur le data-journalisme, le 13 octobre 2011, Art. cit. 335 Entretien avec Caroline Goulard (annexe 1) 336 Entretien avec Karen Bastien (annexe 4) 337 Ibid. 338 ROMERA, Art. cit. 339 Entretien avec Pierre Romera (annexe 2) 340 Entretien avec Caroline Goulard (annexe 1) 341 MENTRÉ, Marc, « La programmation : l’avenir du journalisme ? », OWNI, [disponible en ligne], 30 juillet 2010. 342 BLANC, Sabine, « Journaliste-programmeur : le mutant parfait ? », OWNI, [disponible en ligne], 23 février 2010.

Page 82: Mémoire de master 2 (CELSA) sur le data-journalisme

81

J’ai quitté la partie Internet et suis revenu au papier car je m’étais brouillé avec les gens qui y avaient été recrutés. Ils n’envisageaient pas le journalisme de la même façon que moi. C’était quelque chose de très différent, très centré sur la technologie343

En second lieu, les défenseurs du data-journalisme se donnent comme objectif, peut être

plus fondamental encore, de mettre fin à la « conscience de différenciation344 » des journalistes

professionnels. Ils désignent par là l’idée selon laquelle le journaliste est une figure qui

revendique, par la singularité de son travail, une autorité et un statut « à part ». Derrière l’idée de

collaboration, se trouve en effet la proposition d’un « journalisme en réseau345 », où le journaliste

ne serait qu’un des nombreux maillons de la production de l’information. Elle réactualise le

mythe saint-simonien d’une société en réseau346, où la « discussion horizontale347 » remplace les

« modèles verticaux347 », et qui érige l’union et la coopération entre les hommes comme idéal

égalitaire. D’abord opposée à une organisation hiérarchique du travail, cette vision proclame

également la supériorité de la rencontre et du dialogue sur l’isolement. Aussi le journaliste doit-il

s’appuyer sur d’autres, qu’ils soient journalistes, développeurs ou designers, pour produire de

l’information. Il devient « chef de projet348 », figure qui coordonne au moins autant qu’elle ne

conçoit, et entretient des relations horizontales avec ses collaborateurs.

Or le traitement de la donnée, par la mobilisation de différentes compétences, « [oblige]

vraiment à changer les pratiques349 » et représente donc un formidable levier de transformation

organisationnelle. Dès lors, l’organisation de l’entreprise médiatique ne doit plus « avoir une

vision centrée sur les articles (…) mais une vision centrée sur les données350 », c’est-à-dire être

principalement destinée à la production de données. Caroline Goulard cite l’exemple du New

York Times qui, en convertissant certains articles – politiques, sportifs, littéraires, économiques -

en données, a pu mettre en place des API351. D’abord destinées à l’interne pour faciliter la

343 Cité in : DAGIRAL, PARASIE, « Portrait d’un journaliste en programmeur », Art. cit., p. 150. 344 Entretien avec Caroline Goulard (annexe 1) 345 Nicolas Kayser-Brill, in : INIZAN, « L’open data appliqué au journalisme », Art. cit. 346 MUSSO, Pierre, Critique des réseaux, PUF, coll. « La politique éclatée », 2003, 374 p. 347 Séverin Naudet, lors de l’atelier de la mission Etalab sur le data-journalisme, le 13 octobre 2011, Art. cit. 348 Nicolas Kayser-Brill, in : INIZAN, « L’open data appliqué au journalisme », Art. cit. 349 Entretien avec Caroline Goulard (annexe 1) 350 Ibid. 351 Une API (Application Programing Interface) est une interface permettant la communication entre plusieurs programmes. Elle définit les fonctions / procédures qui peuvent être appelées, et avec quels arguments.

Page 83: Mémoire de master 2 (CELSA) sur le data-journalisme

82

recherche d’information, ces API ont ensuite été ouvertes à l’externe, permettant à d’autres

personnes d’utiliser leurs données.

En somme, recentrer le travail journalistique sur le traitement de données permet d’obliger

la collaboration en interne, et de la favoriser en externe. Cette glorification du réseau et de

l’horizontalité pose la question de la place de l’internaute dans cette ambition de transformation

organisationnelle des rédactions.

2. L’internaute expert mobilisé

L’horizontalité égalitariste du réseau internet est souvent évoquée pour revendiquer la

participation du citoyen aux activités politiques, économiques, culturelles ou informationnelles352.

Le data-journalisme ne fait pas défaut à cette observation, certains érigeant le « crowdsourcing »

comme élément constitutif du journalisme de données353. Il semble pourtant que les exemples de

« participation » ne remettent pas en cause la nécessité d’une médiation professionnelle dans la

publication de l’information (cf. supra II. C.).

En effet, dans le cadre du data-journalisme le « crowdsourcing » consiste principalement

en une sollicitation d’une masse d’internaute sur des petites tâches, afin de démultiplier le

pouvoir d’action du journaliste. C’est le cas par exemple lorsqu’OWNI demande à ses lecteurs de

faire remonter des factures d’eau pour représenter sur une carte les différences de prix entre les

régions354. C’est également le cas pour l’enquête sur les notes des frais des parlementaires

britanniques, pourtant présentée comme un modèle « d’enquête participative355 ». Lorsque le

Guardian invite les internautes à indiquer les notes qui leur semblent suspectes, il s’agit

principalement de faire remonter l’information à un professionnel, qui pourra ensuite la traiter de

manière journalistique. Le « citoyen » n’est sollicité que dans une première étape afin d’assister

le journaliste dans le long et fastidieux travail sur archives. C’est le sens de la métaphore

employée par Pierre Romera :

352 REBILLARD, Op. cit. 353 Pierre Romera en entretien (cf. I. A. 1.) ; GOULARD, « Les quatre voies du data-journalisme », Art. cit. 354 KAYSER-BRIL, Nicolas, « Prix de l’eau : libérons nos données », OWNI, [disponible en ligne], 22 mars 2011. 355 METTOUT, Eric, « Les renforts du Guardian », L’Express, [disponible en ligne], 19 juin 2009.

Page 84: Mémoire de master 2 (CELSA) sur le data-journalisme

83

On a un jeu de données qui est balancé comme un jardin avec plein de mauvaises herbes et on va couper les mauvaises herbes, tous ensemble. On peut utiliser une tondeuse à gazon si c’est possible, ou alors donner un ciseau à tout le monde et chacun coupe sa mauvaise herbe. Quand on fait du crowdsourcing, c’est que la tondeuse à gazon c’est pas possible donc on donne des ciseaux356.

L’idée de « journalisme citoyen », entendue comme la possibilité pour les amateurs de

publier des contenus au même titre que les professionnels, est donc assez lointaine. Les tenants

du data-journalisme jugent cette promesse du « tous journalistes », au mieux comme un « vœu

pieux357 », au pire comme une « catastrophe qui n’a pas du tout marché358 ».

La possibilité de solliciter l’internaute est cependant évoquée dans le cadre de la

proposition « journalisme en réseau ». Dans la théorie saint-simonienne, si le réseau est perçu

comme intrinsèquement supérieur à la verticalité et à l’isolement, c’est parce que ce dernier

multiplie les possibilités de dialogue et de rencontre. Dans cette conception, le journaliste est

encouragé à s’entourer du plus grand nombre de collaborateurs possibles, à l’intérieur de la

rédaction mais également à l’extérieur : « augmenté de ses pairs359 », « augmenté des autres

corps de métier359 », le journalisme doit aussi être « augmenté de l’audience359 ». Il ne s’agit pas

de faire la promotion naïve des contenus publiés par des profanes, mais de se servir des

internautes qui jouissent d’une expertise utile à la réalisation du journaliste. C’est ce qu’a fait le

Guardian à propos d’une carte sur les inégalités sociales en Angleterre. Après des commentaires

critiques sur le choix de couleurs, la rédaction s’est tournée vers « les internautes » pour recueillir

leurs perceptions 360 . En fait, seuls deux internautes ultra spécialisés – Gregor Aisch,

« visualization architect361 » et éditeur du site driven-by-data.net, ainsi que Moritz Stefaner,

« information vizualizer362 » et éditeur du site well-formed-data.net – ont été écoutés, par la

qualité de leurs explications et leur capacité de proposition. Cette ambition à mobiliser les

expertises internautes est développée, dans un registre injonctif, par Dominique Cardon :

Il n'y a pas de compétition entre les internautes et les professionnels de l'information, on est plutôt dans un travail d'hybridation, d'articulation entre des journalistes qui doivent transformer leur manière de travailler, notamment parce qu’ils sont de en plus en dialogue avec les internautes et notamment avec les

356 Entretien avec Pierre Romera (annexe 2) 357 Olivier Tesquet, in : INIZAN, « L’open data appliqué au journalisme », Art. cit. 358 Nicolas Kayser-Bril in : Ibid. 359 SCHERER, Eric, « Le journalisme augmenté en 10 points », OWNI, [disponible en ligne], 7 novembre 2010. 360 ROGERS, Simon, « How can we get our map colours right ? How open journalism helped us better », The Guardian, [disponible en ligne], 13 avril 2012. 361 Présentation sur le site http://driven-by-data.net (consulté le 31 août 2012) 362 Présentation sur le site http://well-formed-data.net (consulté le 31 août 2012)

Page 85: Mémoire de master 2 (CELSA) sur le data-journalisme

84

internautes experts qui les renseignent, les corrigent et les contestent. De l’autre côté, les internautes doivent travailler avec les journalistes, les gens de l’information, du design et de la visualisation pour traiter ces grandes masses de données et ne pas faire des statistiques naïves363.

 

La description d’une « hybridation », où les internautes pourraient également s’appuyer

sur les professionnels de l’information pour produire leur propre contenu, tend néanmoins à

brouiller les pistes quant au rôle des internautes dans la publication d’informations. Ces tentations

« participatives » sont confirmées par un article de Simon Rogers intitulé « Anyone can do it.

Data journalism is the new punk364 ». Il démontre qu’à l’instar du mouvement punk, qui

promettait de monter un groupe instantanément en apprenant trois accords basiques, tout le

monde peut facilement avoir accès aux outils pour faire du data-journalisme. Il confesse

cependant, à contrecœur, que contrairement au punk, une certaine qualité est nécessaire dans le

cadre du data-journalisme365. Mais cela n’empêche pas ceux qui en ont les capacités, de s’auto-

former à l’analyse et la visualisation de données, à l’instar de certaines rédactions parties de rien.

Se dessine ainsi un journalisme qui ne se ferait pas uniquement par les journalistes mais

par n’importe quelle personne ayant les compétences et la volonté de le faire, dans le cadre d’une

« société en réseau ». Un « nouvel esprit du journalisme » ?

3. Un « nouvel esprit du journalisme » ?

Luc Boltanski et Ève Chiapello ont mis à jour les ressorts idéologiques de ce qu’ils ont

nommé le « nouvel esprit du capitalisme »366. La force de cet ensemble doctrinal tient dans la

prise en compte des critiques antérieures adressées au capitalisme.

Les auteurs identifient deux types de critiques du capitalisme : la critique sociale et la

critique artiste. La première dénonce les inégalités sociales et la pénibilité du travail engendrées

par le système capitalisme. Incarnée par les mouvements politiques – ouvriéristes, socialistes et

363 Dominique Cardon, in INIZAN, « L’open data appliqué au journalisme », Art. cit. 364 ROGERS, Simon, « Anyone can do it. Data journalism is the new Punk », The Guardian, [disponible en ligne], 24 mai 2012. 365 Il cite notamment Dan Sinker, figure du logiciel libre et de la mouvance punk : « While I agree with the premise - it's never been easier to do this stuff than it is right now - I think there are a few steps beyond just learning three chords when doing data journalism. For one, Legs [McNeil, who coined the word 'punk'] didn't really say a band needed to be *good* but I'd like to think we'd require that for data journalism » 366 BOLTANSKI, Luc et CHIAPELLO, Ève, Le nouvel esprit du capitalisme, Gallimard, 1999, 843 p.

Page 86: Mémoire de master 2 (CELSA) sur le data-journalisme

85

communistes -, elle milite pour des contreparties à ces dérives, la sécurité sociale par exemple. La

critique artiste porte sur l’aliénation consumériste engendrée par le système capitaliste. Incarnée

par le mouvement étudiant de mai 68 ou la pensée existentialiste, elle propose de substituer à

« la situation d’un consommateur passif face à une offre standardisée367 » une reprise en main de

la production par les consommateurs. Antiautoritaire, plaidant une liberté de parole maximale,

c’est cette critique qui a inspiré les premières radios libres dans les années 1970, ainsi que les

discours d’escorte du web « 2.0 » dans les années 2000368.

Le « nouvel esprit du capitalisme » reprend en partie cette critique, en la travestissant à

des fins de productivité (flexibilité, coordination internationale, etc.). Il se fonde sur deux piliers :

le management par projet, présenté comme « gage d’autonomie accordé aux travailleurs369 », et

l’organisation en réseau, censée effacer l’existence de relations hiérarchiques. Dans cette « cité

connexionniste par projet370 », l’information pourrait enfin circuler librement, libre de tous les

filtres que représentaient la hiérarchie, et plus généralement les institutions. Comme le note

Franck Rebillard, la métaphore convoquée est celle du fluide vital, opposé à la solidité des

institutions sociales que sont l’Etat, l’entreprise, la famille, etc. Par cette métaphore organiciste,

censée épanouir les travailleurs, le néo-capitalisme gomme la violence de cette organisation du

travail (précarité, stress, nécessaire mobilité). Les publics les plus fragiles sont ainsi « sacrifiés »

sur l’autel de la réorganisation managériale

Cette mise en perspective réalisée, les liens entre les propositions du data-journalisme et

ce « nouvel esprit du capitalisme » apparaissent plus précisément. Militant pour faire du

journaliste un chef de projet, louant les vertus d’une société en réseau, et promettant à des non-

journalistes de faire un travail équivalent à celui des professionnels, il épouse presque point par

point ce nouveau corpus doctrinal. La seule divergence notable est que le data-journalisme ne

masque pas les déterminants sociaux-culturels nécessaires à une participation aux activités de

production, en occurrence l’information. Il ne promet pas que tout le monde pourra réaliser un

journalisme de qualité, mais invite les gens qui s’en sentent capables à venir concurrencer les

journalistes sur leur terrain. A l’instar des imaginaires du web 2.0, la proximité du data-

journalisme avec l’idéologie dominante permet d’expliquer le succès de ce néologisme. En

367 REBILLARD, Op. cit., p. 91. 368 Idem. 369 Ibid., p. 92. 370 Ibid. p. 93.

Page 87: Mémoire de master 2 (CELSA) sur le data-journalisme

86

reconstituant l’histoire et les différents promoteurs du mouvement d’ « open data » en Grande-

Bretagne, Valérie Peugeot note ainsi que ce dernier épouse les intérêts de beaucoup d’acteurs

économiques, dont les médias ne sont qu’une « infime partie371 ».

Ces discours d’accompagnement sont en revanche moins compatibles avec les

imaginaires et repères du journalisme comme profession. Le data-journalisme plaide ainsi pour

une refonte des entreprises médiatiques, où la structure organisationnelle serait « fluidifiée », et

où le data-journalise / chef de projet, s’appuierait sur des compétences chaque fois différentes

pour produire de l’information. Dans le cadre de ce « journalisme en réseau », toutes les

personnes se sentant capables de tenir ce rôle peuvent en prendre l’initiative, affaiblissant ainsi la

singularité, voire la nécessité d’un journaliste professionnel.

Projet de rénovation porté par des positions idéologiques marquées, le data-journalisme

remet en cause les imaginaires du journalisme professionnel sur plusieurs points. Si des

convergences ont été trouvées dans la volonté d’enquêter sur les comportements amoraux des

puissants, l’érection d’une « transparence nue » en valeur cardinale questionne le rôle de mise en

perspective du journaliste. Appliqué à des données statistiques, cette exigence de transparence se

mue en outil de décision dans une compétition entre individus rationnels. Enfin, en promettant

une « fluidification » organisationnelle de l’entreprise médiatique, le data-journalisme se

rapproche du nouvel esprit capitalisme, où le modèle du journaliste n’est plus un bouclier de

protection de la démocratie mais un créatif indépendant, libéré de toute hiérarchie, puisant dans

son réseau pour proposer des contenus innovants.

Sur une échelle entre libéralisme et démocratie, ressort de ce portrait global un

déplacement du curseur du journalisme vers le premier élément. Ces deux pôles ne se rejoignent

que dans la surveillance démocratique des puissants, qui, sous couvert de libre circulation de

l’information, témoigne d’une grande méfiance envers les institutions politiques. Il semble

pourtant possible d’imaginer des applications davantage portées sur la compréhension des

phénomènes sociaux. C’est le sens des deux recommandations formulées en conclusion.

371 PEUGEOT, Valérie, « Les enjeux publics, économiques et citoyens de l’ouverture des données : l’expérience britannique », in Document numérique et société, [disponible en ligne], IEP d’Aix en Provence, Aix en Provence, 15-16 novembre 2010. Cité in : CARDON, Art. cit.

Page 88: Mémoire de master 2 (CELSA) sur le data-journalisme

87

Conclusion

Rappelons une dernière fois le questionnement qui a guidé ce travail : comment les

promesses du data-journalisme s’articulent-elles avec les repères et imaginaires du journalisme

professionnel ? La première difficulté a été de rendre compte des différentes réalités décrites

lorsque les acteurs évoquent le data-journalisme. Sans parvenir à une définition atemporelle et

universelle, il a été possible de mettre à jour certains des discours d’escorte de l’expression. En

« réquisitionnant » cette nouvelle expression, différents acteurs – entrepreneurs web, hackers,

parfois journalistes – l’ont investie de valeurs. Parler aujourd’hui de « data-journalisme » revient

ainsi à promettre de découvrir des trésors dans un « déluge » de données, et à représenter ces

informations cachées dans des formats visuels qui se veulent esthétiquement aboutis, et

graphiquement novateurs. Qu’importe finalement si ces promesses ne sont que rarement

actualisées dans les réalisations, elles créent un imaginaire qui devient constitutif du data-

journalisme. Quant à la prétendue nouveauté, elle permet à ce mouvement social d’enjoindre les

rédactions à développer le journalisme de données, pour « ne pas être à la traîne ».

Les critiques les plus fréquentes laissaient craindre un objectivisme béat, une robotisation

de la production d’information ou la fin du récit journalistique. L’étude des discours et pratiques

des différents promoteurs du data-journalisme a permis d’affirmer que ces allégations étaient

pour la plupart infondées. La critique subjectiviste fut la plus difficile à repousser, en raison des

prétentions de certains acteurs à une « objectivité » des données. Mais cette revendication doit

plutôt s’entendre comme une foi dans les chiffres pour rendre compte de la réalité, aussi

longtemps que le journaliste fait preuve d’honnêteté intellectuelle et de sens critique dans la

Page 89: Mémoire de master 2 (CELSA) sur le data-journalisme

88

production de l’information. Dans cette acception, le data-journaliste s’applique à mettre à

distance les faits, et à les restituer en choisissant un récit, un angle, propre au discours

journalistique. Seule différence : alors que le journaliste « traditionnel » protège ses sources, le

data-journaliste met un point d’honneur à les mettre à disposition du public. Cette actualisations

des deux premiers imaginaires professionnels – « ordre du discours » journalistique et pratique de

recueil des faits – explique le succès chez certains journalistes, qui s’approprient les promesses

du data-journalisme. À la suite des Etats-Unis, plusieurs pays institutionnalisent au sein des

rédactions ce qui est perçu comme un nouveau genre : Royaume-Uni (The Guardian), Espagne

(El País), Argentine (La Nación). Même en France, bien qu’encore en marge des rédactions, le

data-journalisme entrouvre progressivement la porte menant à une institutionnalisation, en

intégrant les formations de certaines écoles (ESJ Lille, CFPJ, IEP Paris).

Pourtant une étude attentionnée des valeurs du projet politique défendu par le data-

journalisme invite à affiner les relations entre promesses du data-journalisme et imaginaires du

journalisme professionnel. Certes, la transparence démocratique portée par certains projets

réactualise la figure bien installée du journaliste d’investigation, qui surveille le comportement

moral et légal des élites. Sa radicalité laisse cependant entrevoir une défiance a priori, portant

l’opprobre sur tous les puissants. Appliquée aux bases de données statistiques, cette radicalité

encourage exhaustivité et granularité, permettant aux individus de localiser les informations à

l’échelle de leur quartier, de leur bloc, de leur immeuble. Pensée comme un outil d’aide à la

décision, la transparence encourage alors la compétition entre individus rationnels pour le

meilleur cadre de vie. Le mythe du noble journaliste, intellectuel dédié à la défense de la

démocratie, s’éclipse sous cette figure d’intermédiaire au service de la maximisation des intérêts

particuliers. Est-il encore journaliste ? Sans doute mais il est concurrencé par d’autres acteurs. Le

projet politique du data-journalisme propose en effet un l’idéal de « journalisme en réseau », où

la collaboration prend le pas sur le « cloisonnement » des rédactions. Le journaliste devient chef

de projet, une figure parmi d’autres de la production de l’information, dont l’autorité est

contestée par des internautes experts. Finalement, si le journalisme n’est pas « sacrifié sur l’autel

de la donnée », il est fragilisé par ce projet politique. Ce dernier se rapproche plus des

imaginaires d’internet – transparence, libre circulation de l’information, horizontalité – que des

imaginaires du journalisme professionnel.

Page 90: Mémoire de master 2 (CELSA) sur le data-journalisme

89

Ce travail, communicationnel, se borne cependant à l’étude des discours, des imaginaires,

des projets. Ses conclusions ne signifient pas que journalisme et data-journalisme soient

intrinsèquement irréconciliables – ce serait avoir une approche essentialiste, réfutée plus haut -,

ou pire que le data-journalisme ne s’imposera jamais en France, - ce serait se placer dans le

champ de la futurologie. C’est l’atout d’une approche constructiviste : penser les expressions

comme des objets culturels et sociaux, investis de connotations différentes selon les époques.

Peut être que demain des journalistes jouissant d’une grande légitimité dans la profession,

s’empareront de l’expression et l’investiront d’un sens plus favorable à la corporation

journalistique et à ses mythes démocratiques. Si c’était le cas, les deux recommandations qui

suivent permettraient sans doute d’aider le public à mieux appréhender l’information produite à

partir de données. Chacune dispose d’un corolaire qui tente de monter en généralité en dépassant

la problématique stricto sensu des réalisations de data-journalisme.

Recommandations

Ouvrir la boîte noire

Pour éviter l’ « effet de cliquet » mis à jour dans ce travail, les journalistes pourraient

mettre encore plus en évidence le processus de production des données. En rendant le contrat de

lecture plus complet – sur les choix effectués dans le recueil des données et leur traitement

statistique -, et plus humble – sur les prétentions à décrire le social -, les réalisations gagneraient

paradoxalement en force. Une référence peut être donnée dans l’application « Explorer le

discours » du Monde.fr372, qui proposait à l’orée du premier tour de la présidentielle française, de

comparer les discours des différents candidats. Chaque module de représentation graphique est

accompagné d’une icône « i », invitant l’internaute à prendre connaissance des règles de

traitement statistiques appliquées, et un lien est proposé vers une notice explicative complète de 372 Réalisée en partenariat avec Linkfluence et Jean Véronis Technologies : « Explorer les discours des candidats à la présidentielle », Le Monde, [disponible en ligne], 6 mars 2012.

Page 91: Mémoire de master 2 (CELSA) sur le data-journalisme

90

l’application. Cette dernière présente ainsi les difficultés rencontrées par les journalistes – les

différences entre versions écrite et orale par exemple -, ainsi que les limites de la démarche,

lorsque les « petits » candidats ne publient pas leurs discours en ligne. Par ce faire, l’internaute

est invité à « mettre les mains » dans la méthodologie, et à affiner ses critiques.

Le corolaire de cette recommandation consiste à demander une formation aux statistiques

au sein de l’Éducation Nationale, en tant que matière académique propre. Aujourd’hui cette

science est uniquement enseignée au lycée en cours de mathématiques, alors qu’elle prétend

produire des explications sur les phénomènes sociaux, et dépasse donc largement le champ du

calcul, Cette dépendance disciplinaire est d’autant plus préjudiciable que la statistique est

considérée par les mathématiciens comme une discipline peu noble de la science mathématique,

ne demandant pas de s’y appesantir longtemps en classe. En dotant les élèves d’une connaissance

statistique solide à l’école, les chiffres mobilisés dans l’espace public seraient sans doute plus

systématiquement débattus.

Mettre l’égocentrisme au service du collectif

La carte « zoomable / dézoomable », et ses déclinaisons qui personnalisent une

représentation à partir de la situation de l’utilisateur, tirent leur force de l’égocentrisme de

beaucoup d’entre nous. Plutôt que de lutter contre, le journaliste de données pourrait s’appuyer

sur leur popularité, et inviter l’internaute à rentrer par une porte individuelle pour comprendre des

phénomènes d’intérêt général, qu’ils soient démocratiques, sociologiques, historiques, etc..

L’application « où habitez-vous vraiment », développée par Orange Labs et OWNI, répond de

cette ambition373. Après un questionnaire de dix items, l’internaute compare la perception qu’il a

de son territoire à la « réalité » des chiffres. Il est ensuite invité à comparer son lieu de vie à

d’autres, afin de le situer dans un cadre national. Le projet « How Jewish is my street », porté en

France par Nicolas Kayser-Bril en est une autre illustration : en localisant les Juifs de France

déportés pendant la Seconde guerre mondiale selon leur adresse, il invite l’internaute à

s’intéresser aux déportés de son quartier, et aiguise par là sa curiosité historique374. Citons encore

373 http://app.owni.fr/ou-habitez-vous-vraiment/ (consulté le 31 août 2012) 374 KAYSER-BRIL, Nicolas, « Le data-journalisme pour incarner l’histoire », OWNI, [disponible en ligne], 25 septembre 2009.

Page 92: Mémoire de master 2 (CELSA) sur le data-journalisme

91

l’initiative de Slate, qui proposait à l’utilisateur de réaliser son propre découpage des

circonscriptions de l’étranger, pour se rendre compte du caractère très partisan de l’ exercice375.

Le corolaire consiste, à l’instar de ce dernier exemple, à dénaturaliser les catégories de

l’analyse sociale. Sans remettre en cause la nécessité d’une certaine stabilité, il doit être possible

de mettre en débat certains indicateurs. À ce titre, Alain Blum note justement que si les débats

entre historiens ou sociologues sont fréquents, il est bien plus rare, et c’est problématique,

d’assister à des affrontements entre statisticiens376. C’est la démarche qu’a adoptée récemment

l’INSEE, en proposant aux internautes de créer leur propre indice des prix, calculé en fonction de

leur consommation personnelle377. C’est aussi le parti-pris du site de Thomas Piketty, qui propose

aux internautes de simuler leur propre réforme fiscale, en faisant varier les taux des différents

impôts, taxes et contributions378.

Perspectives de recherche

Le modèle économique du data-journalisme

Ce travail a permis d’observer l’investissement massif d’acteurs économiques dans la

promotion du data-journalisme : EveryBlock aux Etats-Unis, Dataveyes ou Journalism++ en

France. Il ne s’est pourtant que très peu épanché sur le modèle de commercialisation et de

rentabilisation des dispositifs se réclamant du journalisme de données, alors que le prix de ces

réalisations est un des points les plus cités par les rédactions pour expliquer leur supposé

« retard » 379 . Un article d’InternetActu développe pourtant certaines pistes 380 . Alors que

l’information en ligne est marquée par une « circulation réticulaire381 », où les contenus d’une

375 GIRARD, Quentin, « Toi aussi, fais gagner trois députés au PS », Slate, [disponible en ligne], 3 juillet 2009. 376 MARTIN, Art. cit. 377 http://www.insee.fr/fr/themes/indicateur.asp?id=29&page=indic_sip.htm (consulté le 31 août 2012) 378 http://www.revolution-fiscale.fr/simulez-votre-propre-reforme-fiscale (consulté le 31 août 2012) 379 Voir par exemple l’entretien avec Johan Hufnagel (annexe 5) 380 GUILLARD, « Journaliste de données : data as stortytelling », Art. cit. 381 REBILLARD, Franck, « L’information journalistique sur l’internet, entre diffusion mass-médiatique et circulation réticulaire de l’actualité », in BROUDOUX, Evelyne et CHARTRON Ghilsaine (dir.), Document numérique et société – Actes du colloque DocSoc 06, ADBS Editions, 2006, pp. 213-226.

Page 93: Mémoire de master 2 (CELSA) sur le data-journalisme

92

source – agence de presse en ligne, sites d’information, blogs, etc. - sont repris et réécrits, les

visualisations dites « interactives » sont plus difficilement duplicables. Elles rendent possible une

commercialisation « à l’unité », impossible pour un article écrit, immédiatement décliné sur des

dizaines de sites ou « portails ». Ces dispositifs se voulant également « immersifs », en captant

l’attention de l’utilisateur de manière durable, ils pourraient faciliter la diffusion des messages

publicitaire, et réactualisent la question de la relation entre contenus éditoriaux et commerciaux

dans le journalisme.

Un rapport ambigu à la temporalité

Deuxième piste de recherche, le rapport que le data-journalisme entretient à la

temporalité. Certains discours tendent à présenter le journalisme de données comme un gain de

temps – en évitant de réécrire une brève tous les mois lorsque les chiffres du chômage sont

publiés -, et par conséquent comme un moyen de réaliser un journalisme en « temps réel », en

actualisant immédiatement la base de données sur le chômage pour reprendre le même

exemple382. Parallèlement, les mêmes promoteurs présentent le data-journalisme comme un retour

d’un « temps long », celui de l’analyse et de la mise en perspective de données complexes,

forçant les rédactions à anticiper au moins « sur quelques semaines383 ». Les longues enquêtes de

certains data-journalistes états-uniens, à l’instar de celle sur la méthadone citée en introduction384,

plaident en ce sens. Un questionnement plus complet permettrait d’éclaircir cette ambivalence.  

382 Caroline Goulard in : PORTE (DE LA), Xavier, Art. cit. 383 Entretien avec Caroline Goulard (annexe 1) 384 BERENS, Art. cit.

Page 94: Mémoire de master 2 (CELSA) sur le data-journalisme

93

Bibliographie

Références universitaires

Ouvrages

ABLALI, Driss et DUCARD, Dominique, Vocabulaire des études sémiotiques et sémiologiques,

Honoré Champion, 2009.

ARQUEMBOURG-MOREAU, Jocelyne, Le temps des événements médiatiques, De Boeck,

2003, 116p.

BARTHES, Roland, Mythologies, Seuil, coll. « Points », 1970, 233 p.

BOLTANSKI, Luc, Les cadres. La formation d’un groupe social, Les Éditions de Minuit, coll.

« Le sens commun », 1982, 523p.

BOLTANSKI, Luc et CHIAPELLO, Ève, Le nouvel esprit du capitalisme, Gallimard, coll.

« NRF Essais », 1999, 843p.

BOUCHARD, Julie, Comment le retard vient aux Français. Analyse d’un discours sur la

recherche, l’innovation et la compétitivité 1940-1970, Septentrion, 2008, 328 p.

BRETON, Philippe, L’utopie de la communication : le mythe du “village planétaire”, La

Découverte, 2004, 171 p.

CHALABY, Jean, The invention of journalism, Palgrave Mc Millan, 1998, 224 p.

DELEUZE, Gilles, Nietzsche et la philosophie, 6e éd. PUF, 1983 (1962), 232 p.

Page 95: Mémoire de master 2 (CELSA) sur le data-journalisme

94

DESROSIÈRES, Alain et THÉVENOT, Laurent, Les catégories socio-professionnelles, La

Découverte, coll. « Repères », 1998, 127 p.

FLICHY, Patrice, Les imaginaires d’internet, La Découverte, 2001, 272 p.

FOUCAULT, Michel, L’ordre du discours, Gallimard, 1971, 81 p.

FOUCAULT, Michel, Surveiller et punir, Gallimard, éd. 1998 (1975), 360 p.

GANASCIA, Jean-Gabriel, Voir et pouvoir, qui nous surveille ?, Le Pommier, coll. « Essais »,

2009, 255 p.

JEANNERET, Yves, Penser la trivialité. Volume 1 : La vie trivialise des êtres culturels,

Hermès-Lavoisier, coll. « Communication, médiation et construits sociaux », 2008, 266 p.

KAUFMANN, Jean-Claude, L’entretien compréhensif, Paris, Nathan, 1996, 127 p.

LE BOHEC, Jacques, 2000, Les mythes professionnels des journalistes, L’Harmattan, 395 p.

LIBAERT, Thierry, La transparence en trompe-l’œil, Descartes & Cie, coll. « Gouvernance et

démocratie », 2003, 166 p.

MANN, Patrice, L’action collective. Mobilisation et organisation des minorités actives, Armand

Colin, coll. « U Sociologie », 1991, 152 p.

MOLES, Abraham, Les sciences de l’imprécis, Seuil, 1990, 310 p.

MUCHIELLI, Laurent, Violences et insécurité. Fantasmes et réalités dans le débat français, La

Découverte, 2002, 158 p.

MUSSO, Pierre, Critique des réseaux, PUF, coll. « La politique éclatée », 2003, 374 p.

REBILLARD, Franck, Le web 2.0 en perspective, L’Harmattan, 2007, 158 p.

RUELLAN, Denis, Le professionnalisme du flou, PUG, 1993, 232p.

SAUSSURE (DE), Ferdinand, Cours de linguistique générale, Payot, éd. 1973 (1916), 510 p.

Articles

AÏM, Olivier, « Une télévision sous surveillance. Enjeux du panoptisme dans les « dispositifs »

de télé-réalité », Communication et langages, n° 141, 2004, pp. 49-59.

AÏM, Olivier, « La transparence rendue visible. Médiations informatiques de l’écriture »,

Communication et langages, n° 147, 2006, pp. 31-45.

BARTHES, Roland, « Rhétorique de l’image », Communications, Vol. 4/4, pp. 40-51

Page 96: Mémoire de master 2 (CELSA) sur le data-journalisme

95

BOLKA, Laure et GANTIER, Samuel, « L’expérience immersive du web documentaire : études

de cas et pistes de réflexion », Les Cahiers du journalisme, n° 22/23 – automne 2011, pp.

118-133

BONGRAND, Philippe et LABORIER, Pascale, « L’entretien dans l’analyse des politiques

publiques : un impensé méthodologique ? », Revue française de science politique, Vol.

55, 2005, pp. 73-111

CABROLIÉ, Stéphane, « La recomposition d’une organisation de presse : le cas du Parisien.fr »,

Terrains & travaux, vol. 1, n°15, 2009, pp. 127-145.

CANDEL, Etienne, « Une ration quotidienne de statistiques. La pratique éditoriale du “chiffre du

jour” dans la presse écrite », Mediation Et Information, n° 28, 2008, pp. 37-52

CARDON, Dominique, « Zoomer ou dézoomer ? Les enjeux politiques des données ouvertes »,

OWNI, [disponible en ligne : http://owni.fr/2011/02/21/zoomer-ou-dezoomer-les-enjeux-

politiques-des-donnees-ouvertes/], publié le 21 février 2011, consulté le 31 août 2012385.

COHEN, Sarah, HAMILTON, James et TURNER, Fred, « Computational journalism »,

Communication of the ACM, Vol. 54, n° 10, pp. 66-71.

DAGIRAL, Eric et PARASIE, Sylvain, « Presse en ligne : où en est la recherche ? », Réseaux,

n°160-161, 2010/2, pp. 13-42

DAGIRAL, Eric et PARASIE, Sylvain, « Portrait du journaliste en programmeur : l’émergence

d’une figure de journaliste “hacker” », Les Cahiers du Journalisme, n° 22/23, 2011, pp.

144-155

DAGIRAL, Eric et PARASIE, Sylvain, « Data-driven journalism and the public good :

“Computer Assisted Reporters and “programmer-journalists” in Chicago », à paraître.

ESTIENNE, Yannick, « Evolution des pratiques journalistiques sur Internet : journalisme

“augmenté”, data journalism et journalisme hacker (entretien avec Jean-Marc Manach) »,

Les Cahiers du journalisme, Vol. 22/23, Automne 2011, pp. 134-143.

FESTINER, William L., « The emergence and transformation of disputes: Naming, Blaming,

Claiming”, Law and Society Review, Vol. 15, n° 3/4, 1980, pp. 631-654.

385 Bien que publié dans un média « grand public » - OWNI -, cet article a été placé dans la partie « références » en raison de son caractère universitaire. Ecrit par un chercheur, disposant d’une bibliographie, il a par ailleurs stimulé une bonne partie de notre réflexion théorique sur l’aspect politique du data-journalisme, et « mérite » donc sa place ici.

Page 97: Mémoire de master 2 (CELSA) sur le data-journalisme

96

FRIENDLY, Michael, « The golden age of statistical graphics », Statistical Science, Vol. 23/4,

2008, pp. 502-535.

GAUDERAULT, André, MARION, Philippe, « Un média naît toujours deux fois ... », Sociétés et

représentations, n° 9, 2000, pp. 21-36.

GONTHIER, Frédéric, « Weber et la notion de « compréhension », Cahiers internationaux de

sociologie, n°116, 2004, pp. 35-54

JANOWITZ, Morris, « Professional Models in Journalism : The Gatekeeper and the Advocate. »,

Journalism Quarterly, Printemps 1975, pp. 618-626.

JEANNERET, Yves, « L’optique du sustainable : territoires médiatisés et savoirs visibles »,

Questions de communication, n°17, 2010, pp. 59-80

JEANNERET, Yves et SOUCHIER, Emmanuel, « Introduction. Internet vu du journalisme »,

Communication et langages, n° 129, 3e trimestre 2001, p. 36.

KNOX, John, « Visual-verbal communication on online newspaper home pages », Visual

communication, vol. 6(1), 2007, pp. 19-53

LABELLE, Sarah, « “La société de l’information” : Formule, récit et réquisition », in

CHOUTEAU, Marianne et NGUYEN, Céline (dir.), Mises en récit de la technique,

Éditions des Archives Contemporaines, 2011, pp. 33-44

LEMIEUX, Cyril, « La Révolution française et l’excellence journalistique au sens civique. Notes

de recherche », Politix, Vol. 5, n °19, 1992, pp. 31-36.

LEMIEUX, Cyril, « Les formats de l’égalitarisme : transformations et limites de la figure du

journalisme justicier dans la France contemporaine », Quaderni, n° 45, 2001, pp. 53-68

MARQUES de MELO (José), 2009, « Journalistic Thinking. Brasil’s Modern Tradition »,

Journalism, Vol 10/1, pp. 9-27.

NEVEU, Erik, « News without journalists : real threat or horror show », Brazilian Journalism

Research, Vol. 6/1, 2010, pp. 29-54.

PINSON, Gilles et SALA PALA, Valérie. « Peut-on vraiment se passer de l'entretien en

sociologie de l'action publique ? », Revue française de science politique, Vol. 57, 2007,

pp. 555-597.

QUANDT, Thorsten, « News, Tuning, and Content Management : An Observation Study of Old

and News Routines in German Online Newsroom », in PATERSON, David et

Page 98: Mémoire de master 2 (CELSA) sur le data-journalisme

97

DOMINGO, Chris, Making online news. The ethnography of New Media Production,

2008, pp. 76-97.

QUÉRÉ, Louis, « Les boîtes noires de Bruno Latour ou le lien social dans la machine », Réseaux,

1989, Vol. 7, n°36, pp. 95-117.

RASTIER, François, « Le silence de Saussure ou l’ontologie refusée », in BOUQUET,

Simon, Saussure, L’Herne, 2003, pp. 23-51.

RASTIER, François, « Ontologie(s) », Revue des sciences et technologies de l’information,

Vol.18/1, 2004, pp. 15-40.

REBILLARD, Franck, « Le journalisme participatif : de l’idéologie à la pratique », Argumentum,

n° 6, 2006, pp. 11-23.

REBILLARD, Franck, « Du traitement de l’information à son retraitement. La publication de

l’information journalistique sur l’internet », Réseaux, n° 137, pp. 31-68.

ROSENTAL, Paul-André, « La nouveauté d’un genre ancien : Louis Henry et la fondation de la

démographie historique », Population, Vol. 58/1, 2003, pp. 103-136.

SINGER, Jane B., « Who are these guys ? The online challenge to the notion of journalistic

profesionalism », Journalism, Vol. 4/2, 2003, pp. 139-163

SOUCHIER, Emmanuel, « L’image du texte. Pour une théorie de l’énonciation éditoriale », Les

cahiers de la médiologie, n° 6, 1998, pp. 138-145

TREDAN, Olivier, « Le journalisme citoyen en ligne : un public réifié », Hermès, n° 47, 2007 pp.

115-122.

Thèse et mémoires

GOETA, Samuel, Open data : qu’ouvre-t-on avec les données publiques ?, Mémoire de master 2

en Sciences de l’Information et de la Communication, CELSA, 2011.

MITROPOULOU, Eléni, Médias, multimédia et interactivité : jeux de rôle et enjeux sémiotiques.

Thèse de doctorat en sémiotique, Université de Limoges, 2007.

QUINTARD, Marlène, Le datajournalisme, un nouveau genre journalistique. Ou comment

rendre accessible une base de données complexe, Mémoire de master 1 en Journalisme,

CELSA, 2012.

Page 99: Mémoire de master 2 (CELSA) sur le data-journalisme

98

Orales

Actes de colloques

GARRISON, Bruce, « Newspaper size as a factor in use of computer-assisted reporting », in

Communication Technology and Policy Division of the Association for Education in

Journalisme and Mass Communication, [disponible en ligne :

http://com.miami.edu/car/baltimore1.htm], consulté le 31 août 2012, Baltimore, août

1998.

JEANNERET, Yves, « Autre chose qu’un discours, davantage qu’un accompagnement, mieux

qu’une résistance », in La communication entre libéralisme et démocratie, Terminal, n°

75, été 2011, L’Harmattan, pp. 107-117.

PEUGEOT, Valérie, « Les enjeux publics, économiques et citoyens de l’ouverture des données :

l’expérience britannique », in Document numérique et société, [disponible en

ligne :http://laborange.academia.edu/Val%C3%A9riePeugeot/Papers/343143/Les_enjeux_

publics_economiques_et_citoyens_de_louverture_des_donnees_lexperience_britannique],

consulté le 31 août 2012, IEP d’Aix en Provence, Aix en Provence, 15-16 novembre 2010

PROULX, Serge, « Les militants du code : la construction d’une culture technique alternative »,

in Le logiciel libre en tant que modèle d’innovation socio-technique. Pratique et

développement de coopération dans les communautés, [disponible en ligne :

http://www.psaume.infini.fr/IMG/pdf/les_militants_du_code_SProulx.pdf], consulté le 31

août 2012, Congrès de l’ACFAS, Université Mc Gill, Montréal, 16 mai 2006.

REBILLARD,   Franck,   «  L’information   journalistique   sur   l’internet,   entre   diffusion   mass-­‐

médiatique   et  circulation  réticulaire  de   l’actualité  »,   in   BROUDOUX,   Evelyne   et  

CHARTRON   Ghilsaine   (dir.),   Document   numérique   et   société   –   Actes   du   colloque  

DocSoc  06,  ADBS  Editions,  2006,  pp.  213-­‐226.  

TREDAN, Olivier, « Quand le journalisme se saisit du web : l’exemple du datajournalism », in 1e

colloque international – Les Mutations structurelles du journalisme, [disponible en ligne :

http://recherche.telecom-bretagne.eu/labo_communicant/surlejournalisme/wp-

content/uploads/2011/05/Datajournalism-Tr%C3%A9dan.pdf], consulté le 31 août 2012,

Organisé par l’Université de Brasilia, Brasilia, 25-28 avril 2011, p. 2.  

Page 100: Mémoire de master 2 (CELSA) sur le data-journalisme

99

Cours

AÏM, Olivier, « Introduction », in Les médias dans les sciences de l’information et de la

communication, organisé par CELSA, Département « Médias et Communication »,

Neuilly-sur-Seine, 21 septembre 2011.

CANDEL, Etienne, « Éléments de définition », in La « réalité » une approche

communicationnelle, organisé par CELSA, Master 2 « Médias Informatisés et Stratégies

de Communication », Neuilly-sur-Seine, 10 janvier 2012.

DENIS, Jérôme, « Les figures de l’usager », in Sociologie des usages, organisé par CELSA,

Master 2 Médias Informatisés et Stratégies de Communication, Neuilly-sur-Seine, 20

octobre 2011.

GOMEZ MEJIA, Gustavo, « La quête d’un point de vue communicationnel sur le web », in

Poétique et usages du web, organisé par CELSA, Master 2 « Médias Informatisés et

Stratégies de Communication », Neuilly-sur-Seine, 25 janvier 2012.

JEANNERET, Yves, « Figures politiques de la trivialité : le symbolique, le populaire, et le

public », in Économie politique de la trivialité, organisé par CELSA, Département

« Médias et Communication », Neuilly-sur-Seine, 11 octobre 2011

JEANNERET, Yves, « Entre héritages et ruptures, la dynamique de l’obsolescence», in

Économie politique de la trivialité, organisé par CELSA, Département « Médias et

Communication », Neuilly-sur-Seine, 8 novembre 2011

Vidéos

MARTIN, Olivier, « La vérité des chiffres : une illusion ?. Débat entre entre Alain Blum,

démographe, et Olivier Martin, sociologue. », La Vie des idées, [disponible en ligne :

http://www.laviedesidees.fr/La-verite-des-chiffres-une.html], publié le 12 novembre 2009,

consulté le 21 août 2012.

Page 101: Mémoire de master 2 (CELSA) sur le data-journalisme

100

Corpus d’étude

Ouvrages

APPELBAUM, Richard P., CARR, Deborah, DUNEIER, Mitchell, et GIDDENS, Antony,

Essentials of sociology, 3e éd., W. W. Norton & Company, 2010, 499 p.

BOUNEGRU, Liliana, CHAMBERS, Lucy et GRAY, Jonathan, Data Journalism Handbook,

O’Reilly, juillet 2012, [disponible en ligne :

http://datajournalismhandbook.org/1.0/en/introduction_0.html], consulté le 31 août 2012.

CORTAZAR, Julio, Marelle, Gallimard, coll. « L’imaginaire », 1979, 570 p.

JOANNÈS, Alain, Data journalism. Bases de données et visualisation de l’information, Éditions

du CFPJ, Décembre 2010, 169 p.

LASCOUMES, Pierre (dir.), Favoritisme et corruption à la française. Petits arrangements avec

la probité, Presses de Sciences Po, 2010, 283 p.

MC CANDLESS, David, Information is beautiful, Collins, 2011, 256 p.

MEYER, Philip, The New Precision Journalism, 4e Éd (1973), Rowman   &   Littlefield  

Publishers,  2002,  304  p.  

MILLER, Merle, Plain speaking : an oral biography of Harry S. Truman, Berkeley Publishing

Corporation, 1974, 448 p.

RAISSON, Virginie, 2033, Atlas des futurs du monde, Robert Laffont, 2010, 204 p.

ROGERS, Simon, Facts are Sacred : The power of data, Guardian Books, 2001, 92 p.

ROSNAY (DE), Joël, La révolte du pronétariat. Des mass média aux média des masses, Fayard,

coll. « Transversales », 2006, 250 p.

Page 102: Mémoire de master 2 (CELSA) sur le data-journalisme

101

Articles

Signés

ARTHUR, Charles, « Analysing data is the future, says Time Berners-Lee », The Guardian,

[disponible en ligne : http://www.guardian.co.uk/media/2010/nov/22/data-analysis-tim-

berners-lee], publié le 22 novembre 2010, consulté le 31 août 2012.

BADOUARD, Thibault, « Introduction au data-journalisme », Uppercult, [disponible en ligne :

http://uppercult.fr/2012/02/introduction-au-data-journalisme/], publié le 27 février 2012,

consulté le 31 août 2012.

BARRINGER, Matt, « Where do the world’s most entrepreunarial women live », CNN,

[disponible en ligne http://edition.cnn.com/interactive/2012/04/world/leading.women/],

publié en avril 2012, consulté le 31 août 2012.

BAYET, Antoine et DUCHAMP, Agathe, « Les nouveaux habits du journalisme dans le monde

du déluge des données », Regards Sur Le Numérique, [disponible en ligne :

http://www.rslnmag.fr/post/2011/3/10/les-nouveaux-habits-du-journalisme-dans-le-

monde-du-deluge-des-donnees.aspx], publié le 10 mars 2011, consulté le 31 août 2012.

BETANCOURT, Leah, « How Programmer-Journalists are changing the news », Mashable,

[disponible en ligne : http://mashable.com/2009/12/11/programmer-journalists/], publié le

11 décembre 2009, consulté le 31 août 2012.

BERENS, Michael. J., « How we linked methadone to powerty », The Seattle Times, [disponible

en ligne : http://seattletimes.nwsource.com/html/localnews/2016987143_silenthow.html],

publié le 10 décembre 2011, consulté le 31 août 2012.

BLANC, Sabine, « Journaliste-programmeur : le mutant parfait ? », OWNI, [disponible en ligne :

http://owni.fr/2010/02/23/journaliste-programmeur-le-mutant-parfait/], publié le 23

février 2010, consulté le 31 août 2012.

BOYER, Brian, DARDRICK, Hal, GERMUSKA, Joe et RYAN, Mark, « City Council’s $3,7

million allowance : how aldermen spent taxpayer money », The Chicago Tribune,

[disponible en ligne : http://councilexpenses.apps.chicagotribune.com/], publié le 7 avril

2010, consulté le 31 août 2012.

Page 103: Mémoire de master 2 (CELSA) sur le data-journalisme

102

BRIN, David, « The transparent society », Wired, [disponible en ligne :

http://www.wired.com/wired/archive/4.12/fftransparent.html], publié le 4 décembre 1996,

consulté le 31 août 2012.

CASTELLI, Elodie, « Le data-journalisme peine à se développer en France », Journalismes,

[disponible en ligne : http://www.journalismes.info/Le-data-journalisme-peine-a-se-

developper-en-France_a2527.html], publié le 24 janvier 2010, consulté le 31 août 2012.

CHANTREL, Flavien, « Le data-journalisme, enjeux et perspectives : interview de Nicolas

Kayser-Bril », Le blog du modérateur, [disponible en ligne :

http://www.blogdumoderateur.com/le-datajournalisme-enjeux-et-perspectives-interview-

de-nicolas-kayser-bril/], publié le 18 mars 2011, consulté le 31 août 2012.

CHIGNARD, Simon, « En finir avec le mythe de la donnée brute », Données ouvertes,

[disponible en ligne : http://donneesouvertes.info/2012/06/01/en-finir-avec-le-mythe-de-

la-donnee-brute/], publié le 1e juin 2012, consulté le 31 août 2012.

DAUSSY, Laure, « Australie / passeports : homme, femme et “indéterminé” », Arrêt sur images,

[disponible en ligne : http://www.arretsurimages.net/vite.php?id=12032], publié le 15

septembre 2011, consulté le 31 août 2012.

DESAUTEZ, Ludovic, « “Data Tuesday”, c’est parti », Les Echos, [disponible en ligne :

http://blogs.lesechos.fr/echosopendata/data-tuesday-c-est-parti-a7392.html], publié le 6

novembre 2011, consulté le 31 août 2012.

DESAUTEZ, Ludovic, « Avec le 1e “data Tuesday”, la data se fait plus “sexy” », Les Echos,

[disponible en ligne : http://blogs.lesechos.fr/echosopendata/avec-le-1er-data-tuesday-la-

data-se-fait-sexy-a7558.html], publié le 17 novembre 2011, consulté le 31 août 2012.

EPELBOIN, Fabrice, « Le journalisme de données, les données ouvertes et la dictature de la

transparence », ReadWriteWeb, [disponible en ligne :

http://streisand.trollab.org/www.fr.readwriteweb.com/2009/10/19/a-la-une/data-

journalism-journalisme-de-donnee-ouvertes-dictature-transparence/index.html], publié le

19 octobre 2009, consulté le 31 août 2012.

FANEN, Sophian, « Les journalistes à data sur les données », Libération, [disponible en ligne :

http://www.liberation.fr/medias/01012380956-les-journalistes-a-data-sur-les-donnees],

publié le 3 janvier 2012, consulté le 31 août 2012.

Page 104: Mémoire de master 2 (CELSA) sur le data-journalisme

103

FANEN, Sophian, « Les Américains défricheurs du déchiffrage », Ecrans, [disponible en ligne :

http://www.ecrans.fr/Les-Americains-defricheurs-du,13808.html], publié le 4 janvier

2012, consulté le 31 août 2012.

GIRARD, Quentin, « Toi aussi, fais gagner trois députés au PS », Slate, [disponible en ligne :

http://www.slate.fr/story/7581/toi-aussi-d%C3%A9coupe-tes-circonscriptions], publié le

3 juillet 2009, consulté le 31 août 2012.

GONTIER, Fabrice, « Database journalism : “un renversement de perspective” (itw) », Esprit

Blog, [disponible en ligne : http://www.espritblog.com/index.php/2009/07/04/database-

journalism-un-renversement-de-perspective-itw/], publié le 4 juillet 2009, consulté le 31

août 2012.

GOULARD, Caroline, « Le database journalism pour nous sauver du “frogboiling” », Database

journalism, [disponible en ligne : http://databasejournalism.wordpress.com/2009/11/10/le-

database-journalism-pour-nous-sauver-du-%C2%AB-frogboiling-%C2%BB/, publié le 10

novembre 2009, consulté le 31 août 2012.

GOULARD, Caroline, « Assez d’articles, on veut des contenus ! », OWNI, [disponible en ligne :

http://owni.fr/2009/11/17/assez-d%E2%80%99articles-on-veut-des-contenus/], publié le

17 novembre 2009, consulté le 31 août 2012.

GOULARD, Caroline, « Ce qu’aurait pu être le Sarkomètre du Nouvel Obs », OWNI, [disponible

en ligne : http://owni.fr/2010/02/10/ce-qu%E2%80%99aurait-pu-etre-le-sarkometre-du-

nouvel-obs/], publié le 10 février 2010, consulté le 31 août 2012.

GOULARD, Caroline, « Data journalism : pourquoi les médias français ne s’y mettent pas ? »,

OWNI, [disponible en ligne : http://owni.fr/2010/03/08/data-journalism-pourquoi-les-

medias-francais-ne-s’y-mettent-pas/], publié le 8 mars 2010, consulté le 31 août 2012.

GOULARD, Caroline, « La fabrique du data-journalisme », OWNI, [disponible en ligne :

http://owni.fr/2010/03/20/la-fabrique-du-datajournalism/], publié le 20 mars 2010,

consulté le 31 août 2012.

GOULARD, Caroline, « Les quatre voies du datajournalism », OWNI, [disponible en ligne :

http://owni.fr/2010/04/07/quatre-voies-du-datajournalism/], publié le 7 avril 2010,

consulté le 31 août 2012.

Page 105: Mémoire de master 2 (CELSA) sur le data-journalisme

104

GRAY, Norman, « Data is a singular noun », [disponible en ligne :

http://nxg.me.uk/note/2005/singular-data/], publié le 2 janvier 2005, consulté le 31 août

2012.

GUILLAUD, Hubert, « Open data (1/4) : Où en est-on ? », InternetActu, [disponible en ligne :

http://www.internetactu.net/2012/05/30/open-data-14-ou-en-est-on/#commentaires],

publié le 30 mai 2011, consulté le 31 août 2012.

GUILLAUD, Hubert, « Les données pour comprendre le monde », InternetActu, [disponible en

ligne : http://www.internetactu.net/2011/07/19/les-donnees-pour-comprendre-le-monde/],

publié le 19 juillet 2011, consulté le 31 août 2012.

GUILLAUD, Hubert, « Big data : les progrès de l’analyse de données », InternetActu,

[disponible en ligne : http://internetactu.blog.lemonde.fr/2011/10/03/big-data-les-progres-

de-lanalyse-des-donnees/], publié le 3 octobre 2011, consulté le 31 août 2012.

HANNE, Isabelle, « “Internet reste un objet étrange dans les rédactions françaises”. Interview de

Bertrand Pecquerie », Libération, [disponible en ligne :

http://www.liberation.fr/medias/2012/05/29/internet-reste-un-objet-etrange-dans-les-

redactions-francaises_822274], publié le 29 mai 2012, consulté le 31 août 2012.

HAUSHALTER, Louis, « Le journalisme Excel », Medias[2], [disponible en ligne :

http://medias2.revue-medias.com/event/86/innovations/tr-nsitions/tr-nsitions--5--le-

journalisme-excel], consulté le 31 août 2012.

HOLOVATY, Adrian, « A fundamental way newspapers need to change », Holovaty.com,

[disponible en ligne : http://www.holovaty.com/writing/fundamental-change/], publié le 6

septembre 2006, consulté le 31 août 2012.

INIZAN, Maël, « Chicago : de la prohibition au data-journalisme », Sillicon Maniacs, [disponible

en ligne : http://www.siliconmaniacs.org/chicago-de-la-prohibition-au-data-journalisme/],

publié le 24 mars 2011, consulté le 31 août 2012.

INIZAN, Maël, « L’open data appliqué au journalisme », Sillicon Maniacs, [disponible en ligne :

http://www.siliconmaniacs.org/wikileaks-lopen-data-appliquee-au-journalisme/], publié le

23 octobre 2011, consulté le 31 août 2012.

JEANIARD, Lucille, « Grâce au journalisme de données, les professionnels de l’information

retrouvent leur rôle de médiateur », Horizons Médiatiques, [disponible en ligne :

http://horizonsmediatiques.wordpress.com/2012/04/05/grace-au-journalisme-de-donnees-

Page 106: Mémoire de master 2 (CELSA) sur le data-journalisme

105

les-professionnels-de-linformation-retrouvent-un-role-de-mediateur/], publié le 5 avril

2012, consulté le 31 août 2012.

KALOUGUINE, Tatiana, « Les données ouvertes, nouvel eldorado du data-journalisme », La

voix du dodo, [disponible en ligne : http://www.lavoixdudodo.info/2010/02/05/les-

donnees-ouvertes-futur-eldorado-du-journalisme/], publié le 5 février 2010, consulté le 31

août 2012.

KAYSER-BRIL, Nicolas, « Le data-journalisme pour incarner l’histoire », OWNI, [disponible en

ligne : http://owni.fr/2009/09/25/le-datajournalism-pour-incarner-lhistoire/], publié le 25

septembre 2009, consulté le 31 août 2012.

KAYSER-BRIL, Nicolas, « On l’a pas en format ordinateur », ActuVisu, [disponible en ligne :

http://blog.actuvisu.fr/%C2%AB-on-l%E2%80%99a-pas-en-format-ordinateur-

%C2%BB/], publié le 15 décembre 2009, consulté le 31 août 2012.

KAYSER-BRIL, Nicolas, « La fabrique du data #2 », OWNI, [disponible en ligne :

http://owni.fr/2010/05/25/la-fabrique-du-data-2/], publié le 25 mai 2010, consulté le 31

août 2012.

KAYSER-BRIL, Nicolas, « Prix de l’eau : libérons nos données », OWNI, [disponible en ligne :

http://owni.fr/2011/03/22/prix-de-l-eau-crowdsourcing/], publié le 22 mars 2011, consulté

le 31 août 2012.

KAYSER-BRIL, Nicolas, « Le data-journalisme, vecteur de sens et de profit », OWNI,

[disponible en ligne : http://owni.fr/2011/04/17/le-datajournalisme-vecteur-de-sens-et-de-

profits/], publié le 17 avril 2011, consulté le 31 août 2012.

KELLER, Thiery, « La révolution hacker », OWNI, [disponible en ligne :

http://owni.fr/2012/04/17/enfin-une-revolution-cool/], publié le 17 avril 2012, consulté le

31 août 2012.

KIRKPATRICK, Marshall, « What can you do with Government data ? Bust politicans that’s

what », ReadWriteWeb, [disponible en ligne :

http://www.readwriteweb.com/archives/what_can_you_do_with_government_data.php],

publié le 12 juillet 2009, consulté le 31 août 2012.

LAPOIX, Sylvain, « Mon data-journalisme à l’heure Sarkozy », OWNI, [disponible en ligne :

http://owni.fr/2012/01/14/lapoix-data-journalisme-donnees-sarkozy/], publié le 14 janvier

2010, consulté le 31 août 2012.

Page 107: Mémoire de master 2 (CELSA) sur le data-journalisme

106

LEDUC, Caroline, « Le data journalisme a désormais sa bible », Journalismes, [disponible en

ligne : http://www.journalismes.info/Le-Data-journalism-a-desormais-sa-

bible_a3082.html], publié le 5 décembre 2010, consulté le 31 août 2012.

LEON, Yann et ORMAN, Évelyne, « La ronde des chiffres du journalisme de données », La

Croix, [disponible en ligne : http://www.la-croix.com/Culture-

Loisirs/Culture/Actualite/La-ronde-des-chiffres-du-journalisme-de-donnees-_NG_-2010-

10-22-557596], publié le 22 octobre 2010, consulté le 31 août 2012.

LESSIG, Lawrence, « Against Transparency. The perils of openness in government », The New

Republic, [disponible en ligne : http://www.tnr.com/article/books-and-arts/against-

transparency], publié le 9 octobre 2009, consulté le 31 août 2012.

MENTRÉ, Marc, « La programmation : l’avenir du journalisme ? », OWNI, [disponible en ligne :

http://owni.fr/2010/07/30/la-programmation-lavenir-du-journalisme/], publié le 30 juillet

2010, consulté le 31 août 2012.

METTOUT, Eric, « Les renforts du Guardian », L’Express, [disponible en ligne :

http://blogs.lexpress.fr/nouvelleformule/2009/06/19/attention_sujet_complexe_sensi/],

publié le 19 juin 2009, consulté le 31 août 2012.

METTOUT, Eric, « Pourquoi le data-journalisme c’est l’avenir en marche », L’Express,

[disponible en ligne :

http://blogs.lexpress.fr/nouvelleformule/2010/04/07/elle_sappelle_caroline_goulard/],

publié le 7 avril 2010, consulté le 31 août 2012.

METTOUT, Eric, « Pourquoi nous classons les lycées (réponse à Thomas Legrand) », L’Express,

[disponible en ligne : http://blogs.lexpress.fr/nouvelleformule/2012/04/06/pourquoi-nous-

classons-les-lycees-reponse-a-thomas-legrand/], publié le 6 avril 2012, consulté le 31 août

2012.

PATTE, Nicolas, « Datagenèse », OWNI, [disponible en ligne :

http://datablog.owni.fr/2012/06/10/datagenese/], publié le 10 juin 2012, consulté le 31

août 2012.

PONCET, Guerric, « Le streaming écrase le peer-to-peer : Hadopi dépassée », Le Point,

[disponible en ligne : http://www.lepoint.fr/actualites-technologie-internet/2009-10-15/le-

streaming-ecrase-le-peer-to-peer-hadopi-depassee/1387/0/386175], publié le 15 octobre

2009, consulté le 31 août 2012.

Page 108: Mémoire de master 2 (CELSA) sur le data-journalisme

107

RAPHAËL, Benoît, « Propublica : journalisme à (très) haut coût, financé par des dons », OWNI,

[disponible en ligne : http://owni.fr/2010/11/18/propublica-journalisme-a-tres-haut-cout-

finance-par-des-dons/], publié le 18 novembre 2010, consulté le 31 août 2012.

RENÉ-WORMS, Pablo, « Les coulisses du journalisme de données », Le Point, [disponible en

ligne : http://www.lepoint.fr/high-tech-internet/les-coulisses-du-journalisme-de-donnees-

01-12-2010-1269442_47.php], publié le 1e décembre 2010, consulté le 31 août 2012.

ROGERS, Simon, « Wikileaks’ Afghan war logs : how our datajournalism operation work », The

Guardian, [disponible en ligne :

http://www.guardian.co.uk/news/datablog/2010/jul/27/wikileaks-afghanistan-data-

datajournalism#_], publié le 27 juillet 2010, consulté le 31 août 2012.

ROGERS, Simon, « How can we get our map colours right ? How open journalism helped us

better », The Guardian, [disponible en ligne :

http://www.guardian.co.uk/news/datablog/2012/apr/13/mapping-colours-open-journalism-

storify], publié le 13 avril 2012, consulté le 31 août 2012.

ROGERS, Simon, « Anyone can do it. Data journalism is the new Punk », The Guardian,

[disponible en ligne : http://www.guardian.co.uk/news/datablog/2012/may/24/data-

journalism-punk], publié le 24 mai 2012, consulté le 31 août 2012.

ROMERA, Pierre, « Le data-journalism notre religion », OWNI, [disponible en ligne :

http://owni.fr/2011/08/30/le-datajournalisme-notre-religion/], publié le 30 août 2011,

consulté le 31 août 2012.

RICHÉ, Pascal, « OWNI se déchire (en deux) pour mieux redémarrer », Rue 89, [disponible en

ligne : http://www.rue89.com/2012/05/25/owni-se-dechire-en-deux-pour-mieux-

redemarrer-232480], publié le 25 mai 2012, consulté le 31 août 2012.

SALAUN, Jean-Michel, « Singulière data », [disponible en ligne :

http://blogues.ebsi.umontreal.ca/jms/index.php/post/2012/04/10/Singuli%C3%A8re-data],

publié le 10 avril 2012, consulté le 31 août 2012.

SCHERER, Eric, « Données publiques et journalisme : une mine de richesses ! », OWNI,

[disponible en ligne : http://owni.fr/2010/07/07/donnees-publiques-et-journalisme-une-

mine-de-richesses/], publié le 7 juillet 2010, consulté le 31 août 2012.

Page 109: Mémoire de master 2 (CELSA) sur le data-journalisme

108

SCHERER, Eric, « Le journalisme augmenté en 10 points », OWNI, [disponible en ligne :

http://owni.fr/2010/11/07/le-%C2%AB-journalisme-augmente-%C2%BB-en-10-points/],

publié le 7 novembre 2010, consulté le 31 août 2012.

SÉNÉCHAL, Lorrain, « Le “fact checking” peine à s’imposer en France », OWNI, [disponible en

ligne : http://owni.fr/2010/11/18/le-fact-checking-peine-a-simposer-en-france/], publié le

18 novembre 2011, consulté le 31 août 2012.

SMITH, Evan, « Lessons for the Tribune’s First 6 Months », Texas Tribune, [disponible en ligne

: http://www.texastribune.org/texas-newspaper/texas-news/lessons-from-the-tribunes-

first-6-months/], publié le 10 mai 2010, consulté le 31 août 2012.

THIBAUT, Nirina, « Datajournalism : les chiffres nous parlent, écoutons les ! », YCAW,

[disponible en ligne : http://ygaw-bysiliconsentier.com/134-datajournalism-les-chiffres-

nous-parlent-ecoutons-les], publié le 6 juillet 2010, consulté le 31 août 2012.

TRAVIS, Alan et MULHOLLAND, Helen, « Online crime maps crash under weight of 18

million hits an hour », The Guardian, [disponible en ligne :

http://www.guardian.co.uk/uk/2011/feb/01/online-crime-maps-power-hands-people],

publié le 1e février 2011, consulté le 31 août 2012.

VALENCOT, Corentin, « Hack the Press #2 relance le data-journalisme en France », Horizons

Médiatiques, [disponible en ligne :

http://corentinvalencot.tumblr.com/post/15774554853/hack-the-press-2-relance-le-data-

journalisme-en-France], publié le 13 janvier 2012, consulté le 31 août 2012.

VAMBREMEERSH, Nicolas, « Pour un journalisme de données », Slate, [disponible en ligne :

http://www.slate.fr/story/8643/pour-un-journalisme-de-faits], publié le 30 juillet 2009,

consulté le 31 aout 2012.

VIDAL, Benoît, « Data, data, data », Database journalism, [disponible en ligne :

http://databasejournalism.wordpress.com/2010/01/24/data-data-data/], publié le 24 janvier

2010, consulté le 31 août 2012.

Page 110: Mémoire de master 2 (CELSA) sur le data-journalisme

109

Non signés

« A lire ailleurs du 22 juin au 9 juillet », Internet Actu, [disponible en ligne :

http://www.internetactu.net/2009/07/10/a-lire-ailleurs-du-22-juin-au-9-

juillet/#commentaires], publié le 10 juillet 2009, consulté le 31 août 2012.

« Le discours de Séverin Naudet au congrès i-expo », Les Echos, [disponible en ligne :

http://blogs.lesechos.fr/echosopendata/document-le-discours-de-severin-a5830.html],

publié le 22 mai 2011, consulté le 31 août 2012.

« Explorer les discours des candidats à la présidentielle », Le Monde, [disponible en ligne :

http://www.lemonde.fr/election-presidentielle-2012/visuel/2012/03/06/explorez-les-

discours-des-candidats-a-la-presidentielle-2007_1652570_1471069.html], publié le 6

mars 2012, consulté le 31 août 2012.

« L’affaire de Tarnac : “La fabrication d’une menace”. Tchat avec Daniel Dufresne », Libération,

[disponible en ligne : http://www.liberation.fr/societe/1201605-les-peripeties-de-l-affaire-

de-tarnac], publié le 16 mars 2012, consulté le 31 août 2012.

« Sarkozy, roi du “bobaromètre” (épisode 6)», Libération, [disponible en ligne :

http://desintox.blogs.liberation.fr/blog/2012/03/sarkozy-bilan-bobarom%C3%A8tre.html],

publié le 22 mars 2012, consulté le 31 août 2012.

« Seattle Times methadone investigation wins Pulitzer Prize », The Seattle Times, [disponible en

ligne : http://seattletimes.nwsource.com/html/localnews/2017994882_pulitzer17m.html],

publié le 16 avril 2012, consulté le 31 août 2012.

« Les data en forme », OWNI, [disponible en ligne : http://owni.fr/2012/04/17/les-data-en-forme-

episode28/], publié le 17 avril 2012, consulté le 21 août 2012

« Le journalisme de données récompensé », Courrier International, [disponible en ligne :

http://www.courrierinternational.com/article/2012/06/28/le-journalisme-de-donnees-

recompense], publié le 28 juin 2012, consulté le 31 août 2012.

« Datajournalisme : des données pour s’informer », Etalab, [disponible en ligne :

http://www.data.gouv.fr/Articles/Datajournalisme-Des-donnees-pour-s-informer], publié

le 11 juillet 2012, consulté le 31 août 2012.

Page 111: Mémoire de master 2 (CELSA) sur le data-journalisme

110

Audio et vidéo

CLARINI, Julie, « Le journalisme de données : nouveau journalisme ? », France Culture, Les

idées claires, [disponible en ligne : http://www.franceculture.fr/emission-les-idees-claires-

les-idees-claires-2011-02-10.html], diffusé le 10 février 2011, consulté le 31 août 2012.

PORTE (DE LA), Xavier, « Le “data-journalisme” ou comment faire du journalisme avec les

données », France Culture, Place de la Toile [disponible en ligne :

http://www.franceculture.fr/emission-place-de-la-toile-le-data-journalisme-ou-comment-

faire-du-journalisme-avec-les-donnees-2010], diffusée le 14 novembre 2010, consulté le

31 août 2012

MENARD, Robert, « L’avénement du data-journalisme signe-t-il un retour vers un besoin

d’objectivité ? », Medias[2], [disponible en ligne : http://medias2.revue-

medias.com/event/140/profession-journaliste/evolutions/l-avenement-du-datajournalisme-

signe-t-il-le-retour-vers-un-besoin-d-objectivite], publié en juillet 2012, consulté le 31

août 2012.

Mémoire

GOULARD, Caroline, Mutations des entreprises de presse liées au développement de leurs

activités numériques, Mémoire de master 1 en Management des organisations, Sciences

Po Rennes, 2009.

Pages internet

http://app.owni.fr/ou-habitez-vous-vraiment/ (consulté le 31 août 2012)

http://www.bnf.fr/fr/evenements_et_culture/anx_auditoriums/f.rencontres_labo.html?seance=122

3907481771 (consulté le 31 août 2012)

http://www.citypayments.org (consulté le 31 août 2012)

http://databasejournalism.wordpress.com/ (consulté le 31 août 2012)

Page 112: Mémoire de master 2 (CELSA) sur le data-journalisme

111

http://datablog.blog.lemonde.fr/ (consulté le 31 août 2012),

http://datajournalismawards.org/ (consulté le 31 août 2012)

http://driven-by-data.net (consulté le 31 août 2012)

http://www.datamasher.org/ (consulté le 31 août 2012)

http://www.datavis.ca/milestones/ (consulté le 31 août 2012)

http://www.etalab.gouv.fr/pages/Atelier_de_travail_du_13_Octobre_2011_Datajournalisme-

5913723.html (consulté le 31 août 2012)

http://fr.slideshare.net/gaetangab/visualisation-de-donnes-les-leons-de-lhistoire-13139160

(consulté le 31 août 2012)

http://fr.wikipedia.org/wiki/Journalisme#Les_genres_journalistiques (consulté le 31 août 2012)

http://www.gapminder.org/ (consulté le 31 août 2012)

http://www.insee.fr/fr/themes/indicateur.asp?id=29&page=indic_sip.htm (consulté le 31

août 2012)

http://monecranradar.blogspot.fr/ (consulté le 31 août 2012)

http://www.nosdeputes.fr/ (consulté le 31 août 2012)

http://opendata.paris.fr/opendata/jsp/site/Portal.jsp?document_id=61&portlet_id=102 (consulté le

31 août 2012)

http://projects.washingtonpost.com/congress/112/ (consulté le 31 août 2012)

http://www.revolution-fiscale.fr/simulez-votre-propre-reforme-fiscale (consulté le 31 août 2012)

http://www.usatoday.com/news/911/plus_me/index.html, (consulté le 31 août 2012)

http://well-formed-data.net (consulté le 31 août 2012)

http://wikiproject.oii.ox.ac.uk/mapping_wikipedia/ (consulté le 31 août 2012)

Page 113: Mémoire de master 2 (CELSA) sur le data-journalisme

112

Table des matières

 

REMERCIEMENTS  ..................................................................................................................................................  2  

INTRODUCTION  .....................................................................................................................................................  3  CONTEXTUALISATION  ................................................................................................................................................................  4  CONSTRUCTION  DE  L’OBJET  DE  RECHERCHE  .........................................................................................................................  5  La  donnée  comme  production  humaine  ......................................................................................................................  6  Pour  une  dé-­‐ontologie  du  journalisme  .........................................................................................................................  7  

PROBLEMATIQUE  ........................................................................................................................................................................  9  METHODOLOGIE  ......................................................................................................................................................................  11  L’analyse  de  discours  .........................................................................................................................................................  12  Une  sémiologie  graphique  et  linguistique  ................................................................................................................  12  Des  entretiens  semi-­‐directifs  dans  une  démarche  compréhensive  ................................................................  13  

HYPOTHESES  ET  ANNONCE  DU  PLAN  ...................................................................................................................................  15  

I.  LE  DATA-­‐JOURNALISME  COMME  ACTION  COLLECTIVE  ......................................................................  17  A.  DES  SIGNIFIES  MULTIPLES  :  L’IMPOSSIBLE  APPROCHE  ESSENTIALISTE  ....................................................................  18  1.  Les  approches  «  disciplinaires  »  ...............................................................................................................................  18  2.  Les  approches  «  culinaires  »  ......................................................................................................................................  20  3.  Des  idéaux-­‐types  insatisfaisants  ..............................................................................................................................  22  

B.  UNE  EXPRESSION  INVESTIE  ET  PROMUE  PAR  DES  ACTEURS  EXTERIEURS  AU  JOURNALISME  ................................  23  1.  En  France,  une  «  réquisition  »  par  des  entrepreneurs  web  ..........................................................................  24  2.  Une  prétention  abusive  à  la  nouveauté  ................................................................................................................  26  3.  Une  injonction  à  agir  ....................................................................................................................................................  28  

C.  UNE  DE-­‐ONTOLOGIE  DU  DATA-­‐JOURNALISME  :  LES  RICHES  CONNOTATIONS  DU  MOT  «  DATA  »  .........................  30  1.  La  «  data  »  au  cœur  de  la  terminologie  française  ...........................................................................................  31  2.  Un  sentiment  de  multitude  .........................................................................................................................................  32  3.  Le  rattachement  à  une  bannière  «  data  »  ...........................................................................................................  34  

II.  LE  DATA-­‐JOURNALISME  COMME  MEDIATION  PROFESSIONNELLE  ...............................................  37  A.  UNE  PRETENTION  A  L’IMPARTIALITE,  DANS  UN  AMALGAME  ENTRE  «  FAIT  »  ET  «  DONNEE  »  ............................  38  1.  Une  sacralisation  des  faits  ..........................................................................................................................................  38  2.  L’  «  évidence  »  du  chiffre  .............................................................................................................................................  41  

Page 114: Mémoire de master 2 (CELSA) sur le data-journalisme

113

3.  Le  «  fact-­‐checking  »  comme  aboutissement  .......................................................................................................  43  B.  LA  «  DATA  MODELEE  »  OU  LE  MYTHE  DE  LA  DONNEE  BRUTE  ....................................................................................  46  1.  La  naturalisation  des  nomenclatures  ...................................................................................................................  47  2.  Le  processus  d’élaboration  :  une  «  boîte  noire  »  éludée  ................................................................................  49  3.  Une  visualisation  éditorialisée  des  données  .......................................................................................................  51  

C.  LE  «  DATA-­‐JOURNALISTE  »  :  UN  PROFESSIONNEL  DU  TRAITEMENT  DES  DONNEES  ...............................................  55  1.  Une  médiation  nécessaire  ...........................................................................................................................................  55  2.  Un  nouveau  rapport  aux  médias  informatisés  ..................................................................................................  57  3.  Des  lignes  de  fractures  entre  promoteurs  ...........................................................................................................  60  

III.  LE  DATA-­‐JOURNALISME  COMME  PROJET  POLITIQUE  DE  «  REINITIALISATION  »  DU  

JOURNALISME  ......................................................................................................................................................  63  A.  LA  PROMESSE  D’UNE  TRANSPARENCE  DEMOCRATIQUE  RADICALE  ...........................................................................  65  1.  Une  surveillance  démocratique  par  les  données  ..............................................................................................  65  2.  La  réactualisation  de  la  figure  du  «  journaliste-­‐justicier  »  ..........................................................................  67  3.  La  transparence  «  nue  »  en  question  .....................................................................................................................  69  

B.  DES  DISPOSITIFS  PENSES  POUR  L’ACTION  INDIVIDUELLE  ...........................................................................................  72  1.  La  carte  «  zoomable  »  comme  dispositif  phare  .................................................................................................  72  2.  Un  travail  de  mise  en  perspective  fragilisé  .........................................................................................................  75  3.  Des  outils  d’aide  à  la  décision  rationnelle  ...........................................................................................................  77  

C.  LA  «  DATA  »,  LEVIER  D’UNE  ORGANISATION  «  DECLOISONNEE  »  DES  MEDIAS  .......................................................  79  1.  Un  journaliste  chef  de  projet  web  ...........................................................................................................................  79  2.  L’internaute  expert  mobilisé  .....................................................................................................................................  82  3.  Un  «  nouvel  esprit  du  journalisme  »  ?  ....................................................................................................................  84  

CONCLUSION  .........................................................................................................................................................  87  RECOMMANDATIONS  ..............................................................................................................................................................  89  Ouvrir  la  boîte  noire  ..........................................................................................................................................................  89  Mettre  l’égocentrisme  au  service  du  collectif  .........................................................................................................  90  

PERSPECTIVES  DE  RECHERCHE  .............................................................................................................................................  91  Le  modèle  économique  du  data-­‐journalisme  ..........................................................................................................  91  Un  rapport  ambigu  à  la  temporalité  ..........................................................................................................................  92  

BIBLIOGRAPHIE  ..................................................................................................................................................  93  REFERENCES  UNIVERSITAIRES  ..............................................................................................................................................  93  Ouvrages  .................................................................................................................................................................................  93  

Page 115: Mémoire de master 2 (CELSA) sur le data-journalisme

114

Articles  .....................................................................................................................................................................................  94  Thèse  et  mémoires  ..............................................................................................................................................................  97  Orales  .......................................................................................................................................................................................  98  

CORPUS  D’ETUDE  ...................................................................................................................................................................  100  Ouvrages  ...............................................................................................................................................................................  100  Articles  ...................................................................................................................................................................................  101  Audio  et  vidéo  .....................................................................................................................................................................  110  Mémoire  ................................................................................................................................................................................  110  Pages  internet  .....................................................................................................................................................................  110  

TABLE  DES  MATIERES  ....................................................................................................................................  112  

RESUME  ET  MOTS-­‐CLES  .................................................................................................................................  115  

Page 116: Mémoire de master 2 (CELSA) sur le data-journalisme

115

Résumé et mots-clés

Résumé

Ce travail s’intéresse au phénomène émergent de « data-journalisme », ou « journalisme

de données », en interrogeant son articulation avec les repères et imaginaires du journalisme

professionnel. En prenant au sérieux les discours des principaux promoteurs, qui défendent la

richesse de données supposées « nouvelle génération », il est possible d’apporter des éléments de

réponse. Le data-journalisme revendique une figure de médiateur professionnel dans la mise en

perspective et le traitement de données statistiques, qui n’est pas sans rappeler le travail

journalistique. Tant et si bien que certains journalistes professionnels défendent le journalisme

de donnée comme un moyen de « réconcilier » la profession avec le web. L’étude des racines

idéologiques du data-journalisme laisse pourtant entrevoir des points de tension. Plus que les

imaginaires du journalisme professionnel, le data-journalisme semble se nourrir des imaginaires

constitutifs d’internet : transparence, société en réseau, horizontalité, liberté. En voulant les

importer dans les organisations médiatiques, il fragilise la figure d’un journaliste professionnel au

service de la démocratie, et jouissant d’un statut « à part ».

Mots-clés : cartographie, chiffre, data, démocratie, dispositif, données, entrepreneurs, gestion de

projet, graphique, interactivité, journalisme, fact-checking, fait, gisement, hackers, imaginaires,

internet, liberté, médias informatisés, médiation, mouvement social, objectivité, ouverture,

participation, personnalisation, professionnel, réseau, statistiques, surveillance, sousveillance,

transparence, trivialité, visualisation.