Je vais vous faire une confidence:  je n’aime  pas les chiffres.  Prenez un paysage, les chiffres ressemblent  aux pierres : ils sont secs, durs alors que les mots me paraissent bien plus vivants. C’est une erreur je le sais. Et DataNews est ma thérapie. Ici nous allons essayer de jouer, d’informer, de surprendre tout ça avec des chiffres. Nous traiterons de l’actu data pour la décrypter et aussi du datajournalisme qui en est l’un des aspects.

Mi data es su data

On a de la chance : les chiffres sont à la mode. Et plus largement, on peut dire que les data ont la cote en ce moment. C’est un sujet qui anime une grande partie de la communauté active du web : chercheurs, journalistes, développeurs, citoyens, entreprises, tous dans un élan de gourmandise presque insatiable en réclament toujours plus. Les uns veulent plus de transparence, les autres plus d’émulation créatrice et ce lobbying d’intérêts convergents a permis d’obtenir une première grande victoire en mai 2009 lorsque le site data.gov a été lancé à l’initiative de l’administration Obama. Ce portail des données publiques américaines recense et diffuse des milliers d’informations. Avec data.gov.uk, les anglais leur ont emboîté le pas avec le soutien du Webgourou Tim Berners Lee. Et maintenant ce sont les villes françaises qui, une par une, libèrent désormais leurs informations : Rennes hier, Paris aujourd’hui, Nantes demain peut être l’Etat avec le projet Etalab.

DataNews, un Médialab dans la galaxie data

Mais l’ouverture des données n’est qu’une partie du mouvement qui anime la “data communauté” : d’autres thèmes, d’autres problèmes gravitent parmi lesquels le websémantique, les places de marché de données (datamarket, infochimps, Data Publica etc…), les visualisations de données ou encore le datajournalisme.
Ces deux derniers aspects nous concernent particulièrement. Outre l’actu data,  nous essaieront sur DataNews de parler de ces récents sujets et par la même occasion de les pratiquer. C’est la raison pour laquelle DataNews est aussi un médialab : autour de cette plateforme, nous ouvrirons le plus largement possible aux collaborations avec tous ceux qui voudront faire parler les données. Un autre espace restera ouvert 24h/24h intitulé DataLeaks pour tous les Bradley Manning en herbe.

Les stats c’est chic

Notre société abonde en informations diverses et variées. Et finalement ce sont ceux qui savent sélectionner, choisir et même exploiter cette somme de données qui s’en sortent le mieux. Les mathématiciens traders avec leur capacité à traiter des milliers d’informations à l’aide d’algorythmes divers ont déjà conquis Wall Street. Ailleurs, on prédit que les statisticiens seront sexy avec un job peu stressant ou bien que les Data Scientists seront les futures icônes de la Silicon Valley
En journalisme, c’est pareil : les datajournalistes ont en le vent en poupe. On parle beaucoup du Datablog du Guardian emmené par Simon Rogers. Même si en France on constate que le datajournalisme peine à se developper depuis un an nous devons à quelques jeunes téméraires de porter haut les couleurs de cette branche parmi lesquels Caroline Goulard et Nicolas Kayser-Bril.

Faire du vieux avec du vieux ou du neuf avec du neuf  ?

Mais on ne va pas se mentir et Nicolas Kayser-Bryl le rappelle ici , le datajournalisme n’est pas nouveau : quand dans les années 60, Phil Meyer utilise les premiers ordinateurs pour réaliser une enquête statistique sur les émeutes de Détroit, il est le précurseur du datajournalisme. A l’époque on appelle ça le CAR (Computer Assisted Reporting)
Le fait est que travailler avec les données est de plus en plus courant, voire une nécessité, pour savoir traiter des informations en grande quantité de plus en plus complexes (tels que les documents dévoilés par Wikileaks sous format sql). Les journalistes ont toujours manipulé des données aussi cette “nouveauté” peine à convaincre certains journalistes ou lecteurs (voir article et commentaires ici) mais la vraie nouveauté réside sans doute dans l’outil web qui offre, grâce aux développeurs, une nouvelle manière de raconter les histoires et d’y impliquer les internautes. Reste que ce n’est pas non plus une révolution, mais un nouveau champ d’expérimentation interdisciplinaire fait de nouveaux regards, de nouvelles compétences et de nouveaux outils.

What you see is what you get

Dans ce nouveau champ du journalisme, qui n’est pas encore un eldorado, on réalise que le journaliste doit parfois se transformer en chef de projet : à la fois pour récupérer les données comme dans les opérations de crowdsourcing où il lui faudra animer et coordonner une communauté de citoyens et aussi pour créer les outils de visualisation. Là, si le journaliste n’a pas de compétences informatiques, il lui sera difficile impossible de se passer d’un bon développeur et d’un graphiste. On peut moquer cette nouvelle vague de l’info(porno)graphie voire même lister ses pires excès.
Il n’en reste pas moins que la visualisation des données est un enjeu majeur à l’heure où les médias papiers effectuent leur migration (finale ?) vers des supports écrans où l’interactivité et l’ergonomie sera de mise.

L’art de mentir avec précision

Maintenant, le datajournalisme n’est pas une panacée, on peut faire dire n’importe quoi aux chiffres : ce sont comme des poupées que les (data or not data)journalistes ventriloques font parler. Voici un petit exemple amusant de croisement de données qu’on pourrait assimiler un peu rapidement à du datajournalisme. Ce tableau représente les courbes des taux de natalité et d’entrées de cinéma en France depuis 1946. Or surprise, ces courbes suivent exactement les mêmes tendances : doit-on en conclure qu’aller au cinéma provoque une envie irrépressible de procréer ? Ou bien que la procréation est bénéfique aux entrées en salles ? Ou tout simplement que l’appétit culturel est une mesure de bonheur connexe à la procréation.

On peut aussi bien considérer que ces tendances sont totalement décorélées et qu’il s’agit d’un hasard. Bref, le datajournalisme ici ne ferait que la moitié de son travail s’il n’allait pas enquêter, comparer de manière plus précise pour extraire la substantifique moelle de ces chiffres.

Datajournalisme, des exemples
Une des meilleurs explications de ce qu’est le journalisme à l’ère des données nous est largement expliqué dans ce documentaire. Plusieurs exemples d’articles de datajournalisme très intéressants ont fait également date, sans nécessairement faire appel à des techniques sophistiquées de visualisation : Ici une enquête sur le infirmières en Californie décryptée sur le blog monjournalisme.fr.

Le site Owni aussi bien sûr est à l’avant garde en France de ce nouveau champs d’expérimentation  : voici un exemple d’enquête et de visualisation sur les morts aux frontières de l’Europe.  L’ensemble de leurs enquêtes et applications sont disponibles ici.

Plus récemment la révolution égyptienne vue sur Twitter a été décryptée d’une façon originale.

Enfin, un mot pour finir sur le travail de David Maccandless qui est l’un des fers de lance du datajournalisme. Je vous invite  suivre une présentation vidéo de son travail ici.

Maintenant, place aux analyses, interviews et décryptage  : amis et ennemis des chiffres bienvenue !

Benjamin Gans aka Dataman

Crédit photo de Une: Lorenz Matzat / Flickr / CC

Previous postJournalism in the age of data, le doc qui vous update sur le datajournalisme Next postInterview de Cédric Favre, rédacteur du guide juridique des données publiques

What do you think?

Name required

Website