Le gourou n°1 du web, Tim O’Reilly, vient de publier un très intéressant billet (Journalism through computer programming) dans lequel il revient sur le cas d’Adrian Holovaty qui prône la fabrication (et l’exploitation) de bases de données à des fins journalistiques.
Adrian Holovaty sait de quoi il parle puisqu’il est à l’origine du célèbre mashup Chicago crime et plus récemment dans ses fonctions au sein du Washington Post de Faces of the fallen sur les soldats américains tués en Irak et en Afghanistan ainsi que de la base de données des détenus de Guantanamo.
Holovaty est un journaliste devenu développeur informatique. Fan de jazz manouche, il est à l’origine d’un environnement de développement baptisé Django destinés aux « perfectionnistes soumis à des deadlines ». Il s’agit d’une sorte de meta-CMS (content management system) qui peut s’adapter à toute forme de base de données.
Adrian Holovaty, qui prêchait quasiment dans le désert depuis des années, commence à être entendu par les éditeurs américains. Il suggère d’embaucher des développeurs et de les intégrer dans les rédactions pour ne pas les cantonner aux services informatiques. Et si l’on en croit Mediashift, il commence à être entendu.
L’idée centrale de Holovaty est simple. Une information structurée peut être entrée dans une base de données et extraite ensuite en fonction de critères que l’on définit. Exemple avec la dernière réalisation en date du Washington Post sur les votes des parlementaires américains qui donne un aperçu de l’absentéisme et des lois votées au milieu de la nuit.
La conviction de Holovaty est double:
- Il existe des informations structurées qui ne sont pas exploitées et qui peuvent être utiles pour le public (l’exemple de Chicago crime l’illustre puisque les données sur les interventions policières existaient dans les journaux mais elles n’étaient pas compilées dans une base de données pour permettre des recherches [géographique, par âge, par sexe, par mode d’agression, etc])
- Il existe des informations qui peuvent être structurées (si les journalistes collectent les données nécessaires) et être ensuite exploitées dans des bases de données
Il n’est pas question pour le pionnier du journalisme assisté par ordinateur de prétendre que cette forme d’information va remplacer le journalisme « à l’ancienne ». Toutes les informations ne sont pas structurables et l’article tel que nous le connaissons n’est pas voué à disparaître. En revanche, à côté des articles, il existe des gisements d’information inexploités que l’informatique permet de traiter pour lui donner un sens et en faciliter l’accès.
Adrian Holovaty développe sa vision sur son blog. Il insiste sur un avantage de la démarche qui est difficilement pris en compte par les journalistes, c’est la ré-exploitation de l’information. Les amateurs de sport l’ont compris depuis bien longtemps, eux qui sont férus de statistiques. Si les résultats des matchs sont correctement saisis dans une base de données avec le nom des buteurs, la minute à laquelle les buts ont été marqués, les cartons jaunes, les cartons rouges, etc, alors il devient possible d’en extraire toute une série d’informations au-delà des simples scores et classements (Quelle équipe l’emporte le plus souvent à l’extérieur? Quelle équipe est la plus sanctionnée? Quels sont les buteurs qui marquent le plus souvent en fin de match? etc, etc.) La logique peut s’étendre à d’autres domaines.
La démarche des journalistes repose alors sur la définition initiale de la granularité et de la modularité de l’information (voir ce billet précédent) qui peut également permettre aux internautes de contribuer massivement à nourrir une base de données.
Reste la question: est-ce encore du journalisme?
Adrian Holovaty a décomposé le processus de fabrication de l’information dans les médias.
- Rechercher et rassembler les informations
- Exercer son jugement éditorial pour choisir et trier les informations pertinentes
- Rédiger et mettre en forme
Pour lui, les trois phases sont présentes dans son travail de constitution et exploitation de bases de données à des fins journalistiques.
- Identification des informations nécessaires et de leur fiabilité
- Choix des critères de tri de ces informations
- Mise en forme et présentation des résultats pour l’internaute
La piste ouverte par Holovaty s’annonce prometteuse. Il prône l’intégration de développeurs dans les rédactions. J’y suis favorable. Pour ma part, je pense qu’il faut également que les journalistes fassent un pas en direction des développeurs. Le dialogue entre deux métiers, deux cultures aussi différents est tout sauf évident. C’est d’ailleurs l’une des composantes de la spécialisation multimédia des étudiants en journalisme du CFJ.
Mise à jour:
En Grande-Bretagne également, le journalisme assisté par ordinateur a du mal à prendre, rapporte journalism.co.uk
D'accord, d'accord Philippe. C'est effectivement une voie intéressante pour utiliser les ressources disponibles sur le net et les prendre comme un véritable champ recherche d'informations. Mais, est-ce que tout cela rend suffisamment compte de la réalité ? Est-ce que la désincarnation du réel -très perceptible sur le net, dès que l'on aborde certains sujets- n'éloigne pas le journaliste de l'objet de sa recherche d'informations ?
Comme le dit simplement l'écrivain américain Toni Morrison (citée par Ségolène Royal dans son entretien aux Inrrocks de cette semaine) : "aujourd'hui, on sait tout, mais on ne comprend rien"…
David,
Il s'agit bel et bien de trier des masses d'informations et de tenter de leur donner un sens.
Si le site Chicago crime permet de constater qu'il y a une concentration d'homicides dans un secteur donné de la ville, cela vaut le coup d'aller y faire un reportage pour tenter de comprendre pourquoi.
Si le site Faces of the fallen met en évidence qu'un grand nombre de soldats américains tués en Irak viennent d'une ville particulière, cela mérite le déplacement.
C'est aussi un élément de réponse au "on ne comprend rien" de Toni Morrisson en essayant de tirer des enseignements de masses de données.
Cela ne remplace pas le reportage ou les autres formes traditionnelles du journalisme, c'est simplement un outil supplémentaire.