Passage en revue de quelques bonnes pratiques pour se mettre efficacement au datajournalisme en presse locale.
1. Maîtriser les statistiques
Les statistiques sont un langage à part, un autre code à ajouter aux codes informatiques avec lesquels les datajournalistes jonglent quotidiennement, mais qui ne doit en aucun cas être négligé.
Pourquoi cette insistance sur les statistiques ? Parce que la maîtrise du code, aussi léchée soit-elle, n'empêchera jamais des erreurs qui donneront une image faussée d'un très beau travail.
Connaître les différences entre médiane et moyenne, analyser un échantillon en déciles, comparer les variances, être tatillon sur la manière dont les données ont été collectées, se rappeler que les données traitées ne sont pas objectives, sont autant de connaissances qui empêcheront de faire de belles erreurs et donneront un résultat de meilleure qualité, aussi irréprochable sur le fond que sur la forme.
Plus concrètement
Pour s'y mettre en français, il y a comme bonnes ressources :
- les volumes 21 et 26 de la collection "Le monde est mathématique" (environ 10€ l'unité), consacrés respectivement aux probabilités et aux statistiques
- l'ouvrage de Nicolas Gauvrit, Statistiques : méfiez-vous !
2. Plus près vaut mieux que trop loin
La presse locale a souvent une image de grande proximité avec son lectorat, contrairement à la presse nationale qui insiste sur des enjeux beaucoup plus globaux.
La même chose se vérifie sur Internet, où il est assez évident que les internautes marseillais (hors diaspora de l'Est) ne se connecteront pas en masse sur le site du Républicain Lorrain. Un des intérêts du datajournalisme en presse locale est évidemment d'éclairer des problématiques proches de son lectorat.
Plutôt que d'exploiter le même nouveau jeu de données de datagouv sur lequel vont se ruer quelques géants de Paris, il vaut mieux donc trouver quelque chose qui parle plus à ses lecteurs, quitte à changer son angle d'attaque.
Plus concrètement
Ce qui nous amène directement au point suivant :-)
3. Varier ses sources de données
C'est le défi perpétuel du journaliste de données de presse locale : trouver des fichiers exploitables à la bonne échelle.
Certains gros stocks comme ceux de datagouv peuvent convenir, à partir du moment où ils sont plus précis que l'échelle départementale. On peut par exemple citer les résultats d'une élection par commune, idéaux pour filtrer uniquement celles qui nous intéressent.
Mais sinon ? Il y a, mais c'est loin d'être le cas partout, les portaux Open Data. Ces derniers peuvent mettre à disposition des données pas forcément trouvables sur les stocks nationaux, mais ils perdent très vite de leur intérêt s'ils ne sont pas mis à jour régulièrement.
On peut également citer des organisations officielles qui ne chargent pas forcément leurs données sur datagouv. Même si ce dernier s'étoffe de plus en plus, il en reste un paquet !
Plus concrètement
Voir le point suivant (promis, c'est la dernière fois ;-)).
4. Contacter dès qu'on le peut des spécialistes
Les spécialistes ont une connaissance très poussée de données exploitables, même s'ils ne les ont pas produites eux-mêmes. Il peut donc être intéressant de les interroger dessus avant toute publication, notamment pour :
- trouver des données complémentaires
- avoir un éclairage sur la manière dont les données ont été collectées
- préciser un maximum ce qu'elles reflètent
Plus concrètement
- je me suis un jour lancé dans des cartes centrées sur la sauvegarde du grand hamster d'Alsace. J'avais trouvé un paquet de matière à exploiter sur le site de la DREAL Alsace, et je me suis dit qu'il pourrait être intéressant de demander son avis à un responsable d'une association écologiste. Ce dernier a commencé par relativiser le nombre de terriers répertoriés, en expliquant que les zones de recherche était très limitées, et qu'on ne fouillait pas certains sentiers où pouvaient potentiellement se trouver l'un ou l'autre de ces petits animaux. Autrement dit, on pouvait dire qu'il y avait au moins tant de terriers, sans être catégorique. Aussi officielles qu'étaient les données citées, elles avaient donc leurs propres limites !
- bien plus récemment, j'ai écrit sur le patrimoine périphérique de Strasbourg. J'ai interrogé le président d'une association spécialisée sur l'ensemble du patrimoine de la ville à propos de ma carte faite à partir d'un jeu de données régional. Il a alors rappelé que les lieux cités étaient des monuments classés, et qu'on ne pouvait du coup pas en parler comme d'un patrimoine "global". Une précision très utile qui m'a permis de corriger mon papier avant publication. Et cerise sur le gâteau, j'ai même eu un lien vers des sources complémentaires :-)
5. Adapter des exemples
C'est une option incontournable des grandes librairies de cartographie et traitement de données : proposer un tour d'horizon avec des exemples et le code qui va avec.
Il est beaucoup plus facile d'essayer d'adapter ces exemples que de digérer une doc épaisse en espérant ensuite que l'inspiration fasse le reste.
Après tout, regarder des exemples, c'est déjà chercher l'inspiration :-) !
Plus concrètement
Cette carte que j'ai réalisée pour Rue89S est en fait un mix de cet exemple, de celui-ci, de celui-ci et de celui-ci.
6. Discuter des projets en cours avec des confrères
Avoir régulièrement le nez dans les données peut faire prendre de bonnes habitudes, mais demander leur avis à des confrères avant publication ne coûte rien et peut rapporter beaucoup, notamment en :
- proposant des améliorations esthétiques ou fonctionnelles
- réfléchissant à comment mieux "angler" ses illustrations
Plus concrètement
Là encore, j'ai deux anecdotes qui me reviennent :
- lorsque je me suis lancé dans la cartographie de l'abstention aux européennes dans la circonscription Est, j'avais d'abord appliqué un coloriage séquentiel pour illustrer tout ça. J'ai demandé son avis à un ami et ancien collègue qui m'a dit de but en blanc qu'il trouvait ce résultat "baveux", et qu'il valait mieux tenter la chose avec un coloriage divergent. Ce qui a rendu le tout effectivement bien plus lisible
- c'est en discutant d'une première mouture de carte avec la rédaction en chef de Rue89S que j'ai eu l'idée d'y ajouter les tracés des deux balades, balades qui constituaient précisément l'angle de mon papier
7. La forme suit la fonction
Ce principe, particulièrement appliqué dans l'industrie, est décrit sous l'angle des infographies dans l'excellent The Functional Art. Alberto Cairo y explique que la forme que prend une infographie suit assez naturellement sa fonction explicative.
De la même façon, je crois qu'il faut considérer une visualisation de données, aussi poussée techniquement soit-elle, que comme une illustration augmentée. Elle doit servir l'angle que l'on a choisi éventuellement en analysant des données, pas l'inverse.
Plus concrètement
Il n'y a rien de pire, dès lors que l'on a passé du temps et de la sueur à produire une dataviz, que de la balancer seule dans un article, sans autre explication, en se disant que les lecteurs comprendront d'eux-mêmes les secrets qu'elle renferme.
Ça ne marche que dans des cas bien précis, et il ne faut jamais s'affranchir d'une bonne analyse qui viendra compléter la performance technique.
En bon exemple d'une thématique que l'on peut avoir dans une rédaction, le journal canadien La Presse a livré un super boulot sur les accidents de la route au Québec. Le truc en plus ? L'option "Faits saillants", qui montre un vrai travail d'analyse.
8. Appliquer le rasoir d'Ockham
Le principe du rasoir d'Ockham peut se résumer ainsi : si on peut faire simple, il faut éviter autant que possible de faire compliqué.
Ça paraît assez évident dit comme ça, mais dans la pratique, la tentation de compliquer, surtout quand on découvre un nouveau jeu de données qu'on ne maîtrise pas encore, est souvent présente.
Plus concrètement
Pour illustrer une évolution d'un indice dans le temps, qu'est-ce qui est le plus optimal ? Un diagramme en barres décrivant cet indice à des années précises, ou une carte choroplèthe ultra soignée ?
Le rasoir d'Ockham vous dira de préférer la première option, et à mon avis à raison. Après tout, il arrive que les cartes ne soient pas la meilleure manière d'illustrer !
9. Le diable est dans les détails
Plus concrètement
En termes de dataviz, les détails peuvent faire toute la différence.
Couleurs, légendes, échelle, zoom, fenêtres interactives, affichage sur support mobile (trop souvent négligé), tout doit être testé et interrogé pour d'éventuels changements.