Le gourou n°1 du web, Tim O’Reilly, vient de publier un très intéressant billet (Journalism through computer programming) dans lequel il revient sur le cas d’Adrian Holovaty qui prône la fabrication (et l’exploitation) de bases de données à des fins journalistiques.
Adrian Holovaty sait de quoi il parle puisqu’il est à l’origine du célèbre mashup Chicago crime et plus récemment dans ses fonctions au sein du Washington Post de Faces of the fallen sur les soldats américains tués en Irak et en Afghanistan ainsi que de la base de données des détenus de Guantanamo.
Holovaty est un journaliste devenu développeur informatique. Fan de jazz manouche, il est à l’origine d’un environnement de développement baptisé Django destinés aux « perfectionnistes soumis à des deadlines ». Il s’agit d’une sorte de meta-CMS (content management system) qui peut s’adapter à toute forme de base de données.
Adrian Holovaty, qui prêchait quasiment dans le désert depuis des années, commence à être entendu par les éditeurs américains. Il suggère d’embaucher des développeurs et de les intégrer dans les rédactions pour ne pas les cantonner aux services informatiques. Et si l’on en croit Mediashift, il commence à être entendu.
L’idée centrale de Holovaty est simple. Une information structurée peut être entrée dans une base de données et extraite ensuite en fonction de critères que l’on définit. Exemple avec la dernière réalisation en date du Washington Post sur les votes des parlementaires américains qui donne un aperçu de l’absentéisme et des lois votées au milieu de la nuit.
La conviction de Holovaty est double:
- Il existe des informations structurées qui ne sont pas exploitées et qui peuvent être utiles pour le public (l’exemple de Chicago crime l’illustre puisque les données sur les interventions policières existaient dans les journaux mais elles n’étaient pas compilées dans une base de données pour permettre des recherches [géographique, par âge, par sexe, par mode d’agression, etc])
- Il existe des informations qui peuvent être structurées (si les journalistes collectent les données nécessaires) et être ensuite exploitées dans des bases de données
Il n’est pas question pour le pionnier du journalisme assisté par ordinateur de prétendre que cette forme d’information va remplacer le journalisme « à l’ancienne ». Toutes les informations ne sont pas structurables et l’article tel que nous le connaissons n’est pas voué à disparaître. En revanche, à côté des articles, il existe des gisements d’information inexploités que l’informatique permet de traiter pour lui donner un sens et en faciliter l’accès.
Adrian Holovaty développe sa vision sur son blog. Il insiste sur un avantage de la démarche qui est difficilement pris en compte par les journalistes, c’est la ré-exploitation de l’information. Les amateurs de sport l’ont compris depuis bien longtemps, eux qui sont férus de statistiques. Si les résultats des matchs sont correctement saisis dans une base de données avec le nom des buteurs, la minute à laquelle les buts ont été marqués, les cartons jaunes, les cartons rouges, etc, alors il devient possible d’en extraire toute une série d’informations au-delà des simples scores et classements (Quelle équipe l’emporte le plus souvent à l’extérieur? Quelle équipe est la plus sanctionnée? Quels sont les buteurs qui marquent le plus souvent en fin de match? etc, etc.) La logique peut s’étendre à d’autres domaines.
La démarche des journalistes repose alors sur la définition initiale de la granularité et de la modularité de l’information (voir ce billet précédent) qui peut également permettre aux internautes de contribuer massivement à nourrir une base de données.
Reste la question: est-ce encore du journalisme?
Adrian Holovaty a décomposé le processus de fabrication de l’information dans les médias.
- Rechercher et rassembler les informations
- Exercer son jugement éditorial pour choisir et trier les informations pertinentes
- Rédiger et mettre en forme
Pour lui, les trois phases sont présentes dans son travail de constitution et exploitation de bases de données à des fins journalistiques.
- Identification des informations nécessaires et de leur fiabilité
- Choix des critères de tri de ces informations
- Mise en forme et présentation des résultats pour l’internaute
La piste ouverte par Holovaty s’annonce prometteuse. Il prône l’intégration de développeurs dans les rédactions. J’y suis favorable. Pour ma part, je pense qu’il faut également que les journalistes fassent un pas en direction des développeurs. Le dialogue entre deux métiers, deux cultures aussi différents est tout sauf évident. C’est d’ailleurs l’une des composantes de la spécialisation multimédia des étudiants en journalisme du CFJ.
Mise à jour:
En Grande-Bretagne également, le journalisme assisté par ordinateur a du mal à prendre, rapporte journalism.co.uk