Rencontre avec Caroline Goulard, fondatrice de Dataveyes, qui nous explique comment naît et se construit un travail de datajournalisme avec “l’atlas des partis politiques” co-brandé avec l’Express.fr.

 

 

 
Data News: Comment es-tu tombée dans le datajournalisme et la datavisualisation ?

 

Caroline Goulard : Il y a une transformation fondamentale de notre paysage informationnel et les data sont en train de prendre un rôle important dans notre univers d’information. Ces données, on sait très mal les gérer et les appréhender, très mal les manier pour en extraire de l’information, donc il y a là un enjeu majeur en terme d’information. Il y a aussi une prise de conscience que nous sommes beaucoup trop centrés sur l’intelligence verbale notamment sur le web et cela va changer dans les prochaines années. La multiplication de tous les écrans, l’avènement des objets tactiles et de toutes les surfaces tactiles d’information vont nous amener à prendre en compte d’autres formes d’intelligence qui sont beaucoup plus visuelles et interactives. C’est une vraie révolution dans la façon d’appréhender l’information et de la faire passer. C’est ce qui me passionne et c’est pour cette raison que j’ai décidé de faire de la visualisation d’information et que j’ai fondé la société Dataveyes, née d’abord d’un projet étudiant non-profit.

 

Comment a commencé cette collaboration avec l’Express ? Qui a eu l’initiative ?

Une partie de mon équipe a eu la chance de pouvoir intégrer la rédaction web de l’express.fr pendant trois mois avec une mission assez générale sur le journalisme de données, sur la manière de valoriser les données éditoriales de la rédaction de l’express. C’était à la fois une mission journalistique  puisque nous étions en immersion dans la rédaction, que nous assistions aux conférences de rédaction qui nous a permis de voir comment les journalistes au quotidien pouvaient mettre en place des bonnes pratiques de journalisme de données. C’était aussi un travail organisationnel, c’est-à-dire étudier la manière de penser sur le long terme la valorisation des données, la mise en place d’une mémoire des données éditoriales, et enfin un travail de process aussi avec quelques missions de réalisation concrète. Ce projet d’atlas des partis en faisait partie, on a commencé à travailler au milieu de l’été dernier.

 

Naviguez dans la nébuleuse des mouvements politiques en cliquant sur l’image

 

Pourquoi ce sujet ?

C’est un sujet qui s’est imposé assez naturellement avec la rédaction car cela faisait partie de l’actualité de lété dernier autour du financement des micro-partis évoqués lors de l’affaire Woerth-Bettencourt notamment. Nous savions qu’il existait des données. Car la Cnccfp qui est la commission qui surveille le financement de la vie politique met à disposition sur son site les compte rendus d’examen qu’elle fait des comptes des partis, soit les bilans et les compte de résultat qu’elle scanne, qu’elle passe en pdf et qu’elle met en libre accès. Il y avait donc là pour nous énormément de données à exploiter. On avait à la fois un sujet très intéressant d’un point de vue éditorial et des données qui n’avaient pas été exploitées jusque là.

Comment on construit un article de datajournalisme comme celui-ci ?

Je ne suis pas sûre qu’”article” soit le mot approprié. Justement l’idée est de sortir de cette brique de base qui est l’article et qui permet d’habitude de traiter l’actualité pour se décentrer vers d’autres unités d’informations qui vont être les bases de données.

Si ce n’est pas un article, comment définirais-tu ce travail ?

C’est une visualisation, c’est comme ça qu’on en parle entre nous. Après c’est toujours un peu le problème sur le web et sur l’information en ligne de savoir où ça commence et où ça finit. Généralement, ça part d’une visualisation, ça rebondit dans les commentaires, ça se diffuse. Par exemple pour cette visualisation que nous avons réalisé pour l’express, on se retrouve avec trois éléments d’informations : la visualisation, l’article du journaliste qui vient éclairer les points les plus saillants de cette visualisation et lui donne aussi du contexte et il y a aussi l’article que nous avons pu faire sur le blog d’actuvisu qui explique comment on a fait la visualisation et fournit un autre contexte sur la méthodologie.

Tu dirais que c’est du datajournalisme car c’est un travail construit à partir d’une visualisation et qui se décline ensuite ?

C’est du datajournalisme car ce sont des données traitées avec un objectif journalistique d’information du public sur des sujets qui jusque là étaient mal traités ou pas traités de cette manière.

Comment se construit une telle visualisation ?

Comme pour n’importe quel travail journalistique, on part d’abord des données avec un angle éditorial. Là notre angle était de rendre plus facilement compréhensible l’incroyable diversité des partis et des structures politiques que nous avons en France. La plupart des gens ignorent qu’il y a près de 300 partis dans l’espace politique français et l’idée était à la fois de montrer cette diversité et permettre de rentrer dedans de façon simple et de pouvoir explorer ces partis, les comparer, montrer leurs différences, voir comment ils sont financés et où on les place sur l’échiquier politique. Après il a fallu examiner les données dont on disposait : on avait donc des données financières, des données de définition des partis et c’est ce qui a déterminé quel dispositif de visualisation on met en place. Il a fallu ensuite construire le dispositif qui permette de faire la médiation entre les données d’un côté et la compréhension du public de l’autre et c’est enfin ce dispositif qui doit être le plus percutant possible pour transmettre l’information.

C’est ce qui a motivé le choix des cercles ?

Oui, nous sommes passés par une métaphore de comparaison avec un planisphère et des planètes plus ou moins grosses qui gravitent autour de planètes plus importantes. C’est intéressant de voir ces clichés qui parlent spontanément au public. Donc quand il a fallu construire la visualisation et faire comprendre que de nombreux petits partis gravitaient autour d’autres plus grands, c’est cette image que nous avons retenue car cette métaphore visuelle correspondait à l’idée que nous voulions faire passer. Ensuite vient toute la réflexion sur l’ergonomie, les fonctionnalités, l’interaction, l’architecture de l’information…Quand le travail sur l’intention journalistique et les données est bien fait, la conceptualisation de la visualisation vient naturellement.

Combien de personnes ont travaillé sur cette visualisation ?

On a travaillé à trois sur cette visualisation même si dans l’idéal, il aurait fallu un graphiste en plus : il y avait un statisticien développeur qui a travaillé sur l’interface et qui a réalisé la carte, un développeur axé data qui a mis en place la base de données et qui a écrit le script qui a permis de récupérer les données et géré le développement côté serveur, et moi qui ai travaillé sur le côté éditorial, sur la collecte des données annexes à celles qui étaient disponibles sur le site de la cnccfp. J’ai également travaillé avec la rédaction pour positionner les partis sur l’échiquier et sur la création des fonctionnalités, savoir ce qui est pertinent de mettre en place pour que le public comprenne bien.

Tu t’es sentie chef de projet ?

Pas vraiment, surtout que lorsque l’on est que trois ça ne veut pas dire grande chose.  Et Léo le statisticien développeur avait plutôt le rôle d’intermédiaire entre moi qui était entrée sur les usages et les fonctionnalités et Antoine le développeur.

Ca représente combien de jours de travail ?

C’est un peu compliqué car on travaillait sur d’autres projets en parallèle. Je dirai que ça représente un mois de travail à trois avec la moitié du temps passée sur les données à la fois pour extraire les données des pdf mais également pour chercher à la main toutes les données qu’on n’avait pas au sujet des partis : leurs dates de création, leurs leaders, leurs sièges, leurs sites internet, plus les données de financement inter-partis qui n’étaient pas non plus dans les pdf et que nous avons du aller chercher auprès de la Cnccfp en bataillant un peu.

Quels outils avez-vous utlisés ?

D’abord Googlemap pour la partie que nous avons développé nous-mêmes, c’est-à-dire la carte la carte de France. On a utilisé une petite astuce qui a consisté à utiliser Googlemap pour avoir la fonctionnalité de zoom et pour pouvoir ajouter des zones cliquables sur une carte zoomable, on a ensuite collé par dessus googlemap notre propre carte des partis. C’était un peu challengeant car il fallait prendre en compte le zoom et donc découper notre image en plein de petites images, mettre aussi en place un moteur de recherche pour qu’on puisse trouver un parti et que la carte se centre automatiquement sur lui donc on a du géolocaliser à la main tous nos partis en fonction de leurs adresses. Du coup on a gagné beaucoup de temps.

Je crois que vous avez aussi utilisé le logiciel Tableau ?

Quand on a commencé ce projet, on avait plein d’idées de fonctionnalités et notamment celle de pouvoir comparer des partis entre eux et pour autant on n’avait pas de temps ni de ressources illimitées. Pour proposer cette fonctionnalité qu’on ne pouvait pas développer en interne, on a effectivement utilisé un outil qui s’appelle Tableau Public qui permet  de faire des graphiques interactifs avec des filtres à partir de n’importe quelle base de données et on l’a ensuite embeddé dans la visualisation.

Par les moyens qu’il mobilise, le datajournalisme n’est-il finalement pas un luxe que toutes les rédactions ne peuvent pas s’offrir ?

C’est vrai que trois personnes un mois sur un seul projet, c‘est quelque chose qu’on ne peut pas se permettre de faire sur tous les sujets maintenant il faut garder en tête que ce sont des investissements sur le long terme. Pour mettre à jour cette carte l’année prochaine, il ne faudra pas trois personnes pendant un mois, il  suffira de faire quelques mises à jour  et ça ne prendra que très peu de temps. Maintenant  si on compare cette carte des micropartis avec un reportage d’un grand reporter – sans se comparer à eux bien sûr – mais en comparant les coûts induits par leurs déplacements, ce n’est pas forcément abérrant. C’est de l’investissement de long terme et aussi de relation avec les internautes. Les commentaires postés à la suite de cette visualisation sont intéressants car certains disent « enfin du journalisme de qualité, qui montrent des choses qu’on ne voit pas ailleurs, qui apportent quelque chose qui est utile » donc c’est un vrai investissement en terme d’image et de confiance avec le lecteur.

Tu aurais trois règles de base pour faire un bon article, pardon une bonne visualisation, de data journalisme ?

D’abord, je dirai qu’il faut travailler sur les données de façon sérieuse avec un vrai regard et un angle de traitement pour apporter une information au public. Ensuite, il est nécessaire de travailler en groupe avec une équipe qui comprenne designers, statisticiens, développeurs. Il est difficile d’avoir tout seul l’ensemble des compétences indispensables pour faire une bonne visualisation. Enfin, je dirai qu’il faut penser à l’internaute qui va consulter la visualisation: tout le travail doit être mis au service de cette transmission d’information.

Avec l’objectif que ce soit interactif ?

Oui, il faut avoir comme objectif que la visualisation serve aux lecteurs et leur permette de trouver de l’information qu’ils n’avaient pas avant.

 

Previous postLes lobbies aiment le parlement français mais préfèrent nettement le parlement européen Next postEntretien avec Chris Taggart créateur d'Openlylocal, annuaire des données de collectivités au Royaume-Uni

What do you think?

Name required

Website