Branchez-Vous a lancé au début du mois un analyseur de contrats publics québécois, outil web sensé permettre aux journalistes de données de s’y retrouver dans le Système électronique d’appel d’offres (SEAO) publié depuis le printemps sur le portail de données ouvertes du gouvernement québécois, et de ce fait, consultable par tous. Un outil qui comporte cependant certaines limites.

Branchez-Vous a lancé au début du mois un analyseur de contrats publics québécois, outil web sensé permettre aux journalistes de données de s’y retrouver dans le Système électronique d’appel d’offres (SEAO) publié depuis le printemps sur le portail de données ouvertes du gouvernement québécois, et de ce fait, consultable par tous. Un outil qui comporte cependant certaines limites.

Par Hélène Roulot-Ganzmann

«Lorsque les données du SEAO ont été libérées au printemps, je suis allé les regarder, explique Jean-Hugues Roy, ex-journaliste à Radio-Canada, aujourd’hui professeur à l’École des médias de l’Uqàm et grand défenseur des données ouvertes. J’ai plongé dans cette base de données pour me rendre compte à quel point elle est sale. Il fallait vraiment la nettoyer et c’est le travail qu’a fait Banchez-Vous. Un travail colossal, remarquable… sauf qu’ils semblent ne l’avoir fait que pour les organismes publics, donneurs de contrats, non pour les fournisseurs, ceux qui remportent les appels d’offres!»

Une base de données «sale» dans le langage des datajournalistes, signifie ici, que l’orthographe des noms n’est pas uniformisée. Ainsi, dans le cas du SEAO, on dénombre une douzaine de façons différentes d’orthographier la «Ville de Montréal» et quelques-unes également pour «Longueuil», si l’on tient compte notamment des fautes et des majuscules.

«Résultat, poursuit Jean-Hugues Roy, lorsqu’on fait une recherche sur les contrats octroyés par telle ou telle ville, on obtient qu’une partie des réponses, en fonction de l’orthographe que l’on utilise. Ainsi, en faisant une recherche avec le mot-clé «Bell», vous tombez sur plusieurs orthographes pouvant correspondre à Bell Canada. Même chose avec «Lavalin». C’est au journaliste d’être attentif et d’additionner les montants. Bref, c’est un outil intéressant qui demanderait à être amélioré. En l’état actuel, du fait de ces différents bugs, on ne peut pas l’utiliser en toute confiance.»

Rudimentaire

Même discours du côté de Jean-François Parent, journaliste chez Finance et Investissement.

«L’outil de Branchez-Vous n’est pas mal du tout, estime-t-il. Il permet notamment de déceler des tendances dans le temps, concernant l’octroi de contrats par telle ou telle municipalité, tel ou tel ministère. Mais il est à prendre avec des pincettes parce qu’il comporte des erreurs. On va dire que je prêche pour ma paroisse, mais l’outil développé par Nicolas Roberge, qui a remporté le premier hack journalisme montréalais que j’avais co-organisé en juin dernier, me semble plus performant et plus user friendly.»

Un  Nicolas Roberge qui acquiesce. Selon lui, l’outil de Branchez-Vous est «rudimentaire».

«Sans même parler des erreurs au niveau de l’orthographe, qui obligent à faire des regroupements et des calculs pour avoir un portrait juste de la situation, l’outil ne permet en fait que de faire des recherches. Le mien sera beaucoup plus poussé au niveau de l’analyse.»

«Sera», parce qu’il est encore en développement, M. Roberge travaillant dessus en partenariat avec un éditeur, confie-t-il à Projet J, sans vouloir dire lequel, ni même avancer une date de sortie.

[node:ad]

Mais au-delà de cet outil en devenir, Jean-François Parent tire son chapeau à Nicolas Roberge et à son mouvement Québec ouvert, grâce auquel, notamment, les données du SEAO sont accessibles à tous.

Des journalistes à la traine

«On est capable de savoir aujourd’hui, pour les municipalités, pour les sociétés parapubliques, pour l’essentiel de l’appareil gouvernemental finalement, quel genre de contrats, le nombre, leur valeur et les soumissionnaires qui ont remporté l’appel d’offres. J’ai par exemple dégoté toutes sortes d’histoires sur les assureurs de Lac-Mégantic. Ça m’a donné un angle différent par rapport à ma concurrence sur ce dossier.»

Pour cela, Jean-François Parent n’a pas eu besoin d’outil, il est allé fouiller par lui-même dans la base de données du SEAO.

«Le problème avec les journalistes qui attendent après ce genre d’outils, c’est qu’ils sont souvent à la traine. Et puis, il vaut toujours mieux aller le plus à la source possible car ceux qui développent ce genre d’outils le font d’abord pour leurs propres besoins ou en fonction de leurs intérêts. C’est déjà une première manipulation des données. Cela dit, tous les journalistes ne sont pas capables de mettre les deux mains dans une base de données.»

Steve Proulx, fondateur de 37e Avenue, en est, quant à lui, tout à fait capable et il en a même fait son business. Selon lui, même si ce genre d’outils peut s’avérer pratique, le principal problème réside dans la pertinence des informations qui s’y trouvent.

«Parce qu’il faut savoir que l’appel d’offres n’est souvent pas le montant payé en fin de compte…», note-t-il.

À voir aussi:

Bienvenue dans l’ère du journalisme de données

37e Avenue: aborder l’information de façon créative

Un guide pour se lancer dans le journalisme de données