Making-of de l’enquête « L’Open Data est-il de gauche ou de droite ? »

L’enquête

http://datajournalismelab.fr/lopen-data-est-il-de-gauche-ou-de-droite

Thème général 

Open Data, les collectivités locales jouent-elles le jeu?

Idée de départ

A l’heure où les collectivités s’ouvrent de plus en plus à l’OpenData, les partis politiques sont-ils tous aussi investis dans la démarche?

Déroulé

Nous avons décidé de faire un état des lieux de la démarche OpenData à l’échelle nationale, en s’intéressant à toutes les entités du territoire, du niveau local (mairie) au niveau régional (conseil régional).

Pour cela, nous sommes partis de trois bases de données:

Ces bases de données recensent tous les portails ou/et démarches Open Data présents sur le territoire français. Le principe a donc été le même pour les trois bases de données : nous devions trier toutes les informations afin de ne conserver que la liste des collectivités institutionnelles françaises. Il a par exemple fallu enlever tout ce qui était le fruit d’une entreprise privée ou d’une association départementale…

Les informations sur Open Data Soft et Open Data France étaient déjà présentées sous forme de données. Pour Data Gouv, nous avons utilisé la technique du “scraping” pour transformer les 36 pages d’informations en un tableur de données.

Une fois les trois tableurs créés, nous les avons fusionnés, afin d’éviter les doublons. En effet, une collectivité pouvait avoir été recensée par les deux ou trois bases de données. Au final, notre tableur récapitulatif recense 119 collectivités territoriales françaises. Nos données concernent les mairies, les métropoles, les communautés de région, les conseils généraux et régionaux.

Nous voulions connaître la date de mise en ligne de leurs données (sur leur propre portail ou sur un portail mutualisé), afin de retrouver la personnalité politique en place à cette époque là, ainsi que son appartenance politique.

Recherche de données

Nous n’avons pas rencontré de problèmes particuliers dans la recherche de nos données, toutes étant disponibles et accessibles directement en ligne. La partie la plus fastidieuse a probablement été celle des appels dans les 119 collectivités locales. Nous y avons passé deux jours entiers.

Mise en forme des données

Nous faisons trois graphiques différents.

Le premier graphique montre la typologie des collectivités qui ont entamé une démarche Open Data. Ainsi on peut voir que les conseils régionaux sont proportionnellement la collectivité la plus engagée dans la libération des données.

Le deuxième démontre l’évolution de l’Open Data en France par les collectivités. Le graphique montre clairement que l’ouverture des données publiques est en constante progression.

Le troisième graphique se concentre sur la corrélation entre étiquette politique et démarche Open Data. L’ensemble comprend en réalité trois graphiques. Le premier est une synthèse plus générale sur la différence entre “la gauche”, “la droite” et “le centre”. On constate que les collectivités détenues par “la gauche” sont deux fois plus nombreuses à s’être engagées dans une démarche Open Data que “la droite”. Le PS est le parti nettement majoritaire à s’engager dans la libération des données. A partir de ce constat, nous avons voulu interpréter ce résultat concernant la prédominance des collectivités de gauche dans la démarche. Nous avons donc trouver plusieurs interlocuteurs pour qu’ils nous aident à donner un sens à ses résultats.

Interlocuteurs

 

Camille Humbert, Anaïs Moran, Salomé Parent.