Chapitre 3. Agir sur l’accessibilité grâce à des données ouvertes de haute qualité

Ce chapitre donne une vue d’ensemble des actions entreprises par les membres de l’OCDE, les pays partenaires et les autres économies pour encourager la publication de données ouvertes de haute qualité. Il s’attache à montrer l’importance de l’élaboration d’instruments comme des lignes directrices et des normes pour aider les organisations du secteur public à préparer leurs données avant publication, ainsi que des actions contribuant à une interopérabilité et à un partage accrus de ces données au sein du secteur.

    

La Lituanie n’était pas membre de l’OCDE à l’époque de la préparation de la présente publication. Par conséquent, elle n’apparaît pas sur la liste des membres de l’OCDE, et n’est pas comptabilisée dans les agrégats relatifs à la zone OCDE.

Les données statistiques concernant Israël sont fournies par et sous la responsabilité des autorités israéliennes compétentes. L’utilisation de ces données par l’OCDE est sans préjudice du statut des hauteurs du Golan, de Jérusalem-Est et des colonies de peuplement israéliennes en Cisjordanie aux termes du droit international.

Introduction

Le développement, dans le monde entier, des actions concernant les données publiques ouvertes a eu lieu en même temps que la transformation numérique des activités commerciales et que l’augmentation du nombre de citoyens connectés et interconnectés, 24 heures sur 24 et 7 jours sur 7. Dans le contexte de la Quatrième révolution industrielle (c’est-à-dire la fusion entre les sphères physique, numérique et biologique ;1 Schwab, 2015), les données se trouvent au cœur de l’intelligence artificielle et sont de plus en plus considérées comme l’élément central pour accroître l’intelligence du secteur public. Au vu de ces tendances, l’accessibilité accrue à des données de haute qualité représente un avantage concurrentiel.

La qualité des données – y compris des données ouvertes – est déterminée par un ensemble de caractéristiques qui ont en outre une incidence sur l’utilité potentielle globale de ces données pour leurs réutilisateurs. Un exemple des actions menées par le passé pour clarifier le concept de qualité des données et ses implications est celui des « huit principes relatifs à l’ouverture des données publiques », qui ont été définis et présentés pour examen aux administrations en décembre 2007, lors d’une réunion d’un groupe de travail sur le gouvernement ouvert à Sebastopol (Californie, États-Unis). Cette réunion, à laquelle avaient participé 30 partisans des données publiques ouvertes, avait été organisée par l’organisation Public.Resource.Org – avec le soutien de Sunlight Foundation, Google et Yahoo –, et avait abouti à la définition de principes qui, s’ils sont respectés, permettent d’établir que des données publiques sont ouvertes (par exemple : rapidité de diffusion et lisibilité par machine) (Ubaldi, 2013).

Tandis que les administrations du monde entier reconnaissent de plus en plus la réutilisation des données comme une condition essentielle de la création de valeur, il fait de moins en moins de doute que la qualité des données publiques requiert des efforts de plus grande ampleur en matière d’amélioration de la gouvernance des données et de la gestion de leur chaîne de valeur. Par voie de conséquence, la disponibilité – ainsi que l’accessibilité – de données de haute qualité doit s’appuyer sur des modèles d’infrastructure de données et d’informatique intégrés pouvant encourager la transformation numérique et axée sur les données de l’administration ainsi que les réformes du secteur public (par exemple l’amélioration du partage automatique et de l’intégration des données). L’existence d’une infrastructure de données est indispensable pour assurer une adoption réussie des technologies émergentes, qui dépend dans une large mesure de la disponibilité de données de haute qualité.

Renforcer l’intelligence du secteur public ainsi que les capacités des organisations de ce secteur à gérer la chaîne de valeur globale des données nécessite l’existence d’un ensemble de facteurs propices à la mise en place de modèles de gestion des données publiques efficaces. Ces facteurs sont notamment la conception d’instruments d’action comme des lignes directrices et des normes pouvant favoriser une mise en œuvre efficace et efficiente de la politique publique (en permettant d’améliorer la qualité des données publiques ouvertes avant qu’elles ne soient publiées).

Ce chapitre présente les actions entreprises par les pays pour concevoir des outils de gouvernance efficients favorisant l’accessibilité, la qualité et l’utilité des données publiques ouvertes, afin de permettre une plus grande réutilisation de ces données. Il décrit, entre autres, les instruments d’action et les exigences mis en place par les pays pour assurer la protection de la vie privée, accroître la disponibilité des catalogues de données et encourager la publication des métadonnées, l’interopérabilité des données, ainsi que l’adoption de régimes de licence et de modèles de tarification ouverts par défaut.

La mise en œuvre et l’utilisation de certains de ces instruments sont décrites plus en détail dans le chapitre 5.

Encadré 3.1. Qualité/Qualités des données

Les utilisateurs de données n’ont souvent aucun doute quant à l’importance d’un accès à des données de haute qualité, mais ils ne sont pas toujours d’accord sur ce que sont concrètement des données de « haute qualité ».

S’agissant de données, le concept de qualité peut être compris comme un ensemble de caractéristiques distinctes – les qualités fondamentales – qui, ensemble, peuvent contribuer à la valeur et l’utilité globales des données pour l’utilisateur final. Si le degré d’importance de ces qualités fondamentales peut varier selon les groupes d’utilisateurs, la présence de ces qualités transforme les données en un atout de base qui peut être efficacement internalisé dans le cadre de modèles économiques fondés sur les données, afin d’en extraire la valeur et de contribuer à la réalisation d’objectifs bien précis.

La haute qualité des données peut être déterminée par la somme des qualités fondamentales suivantes :

  • Exhaustivité : Tous les éléments ou points de données sont disponibles. Rien ne manque et n’empêche l’analyse ou l’utilisation des données.

  • Précision : Tous les éléments ou points de données correspondant à l’objet, l’événement ou la situation du monde réel sont inclus dans l’ensemble de données et permettent d’utiliser les données comme prévu.

  • Rapidité (y compris la fréquence des mises à jour) : La version la plus récente de l’ensemble de données est mise à disposition sans délai excessif. Les données représentent donc l’état actuel de l’objet, l’événement ou la situation du monde réel.

  • Intelligibilité (y compris des métadonnées) : Toutes les informations pertinentes relatives aux données sont fournies pour s’assurer que les utilisateurs les comprennent facilement. Cela inclut toutes les métadonnées permettant aux utilisateurs de comprendre les données.

  • Exactitude : Les valeurs des données sont fiables et représentent de façon claire les caractéristiques de l’objet, l’événement ou la situation du monde réel.

  • Cohérence : Les données ne contiennent pas de contradictions pouvant nuire à la précision de leur analyse et donc rendre leur utilisation impossible.

  • Validité : Les données sont actualisées afin de s’assurer que les données les plus récentes sont présentées.

  • Unicité : Les éléments ou points de données ne sont présents qu’une seule fois dans l’ensemble de données.

En revanche, il n’est pas possible de disposer de données de bonne qualité lorsque celles-ci sont cloisonnées, c’est-à-dire non partagées et accessibles principalement par un groupe d’utilisateurs unique ou limité. Par conséquent, dans le contexte de la transformation numérique des modèles économiques, les données de bonne qualité doivent également présenter les caractéristiques suivantes pour faciliter l’utilisation de modèles de gestion et de gouvernance des données plus élaborés établissant les conditions de leur partage, leur intégration et leur consolidation :

  • Accessibilité (données de base, catalogues de données) : Degré de facilité avec lequel les données ou autres types d’informations sont accessibles sur le portail des données publiques ouvertes ou auprès des organismes publics. Les catalogues de données sont utilisés par l’administration ainsi que pour accroître l’accessibilité des données des différents ministères et organismes officiels.

  • Lisibilité par machine : Possibilité pour les informations ou les données présentées dans un format structuré d’être traitées par un ordinateur sans intervention humaine (ou le minimum) et sans perte de sens. Les formats numériques ne sont pas lisibles automatiquement par une machine (par exemple les documents de texte au format PDF ou Word).

  • Interopérabilité (normes, sémantique, identifiants communs) : Caractéristique d’un produit ou d’un système dont les interfaces sont conçues pour travailler avec d’autres produits ou systèmes. L’interopérabilité d’un système correspond à l’utilisation des mêmes formats et normes logicielles par les différents ministères/organismes publics. L’interopérabilité sémantique correspond au regroupement de différentes informations dans la même rubrique.

  • Protection (par exemple de la vie privée et des registres de données) : Mesures prises pour garantir la confidentialité des données et la préservation des normes de sécurité.

Lorsque des données sont divulguées en tant que données ouvertes, de nouvelles qualités sont ajoutées à la liste pour que ces données puissent répondre au critère de qualité. En fait, ces qualités conditionnent l’accessibilité et la réutilisation sans restriction des données ouvertes :

  • Octroi d’une licence : Document administratif officiel autorisant l’accès aux données publiques ainsi que leur téléchargement, copie, distribution et utilisation.

  • Gratuité : Aucune redevance n’est prélevée pour la consultation, le téléchargement, la copie, la distribution et l’utilisation des données publiques.

  • Format non propriétaire : Format pris en charge par plusieurs développeurs et accessible par différents systèmes logiciels. Le format non propriétaire XML (eXtensible Markup Language) est très courant pour les archives publiques. Par opposition, un format propriétaire n’est géré et reconnu que par un seul développeur (par exemple le format DOC de Microsoft Word).

  • État brut : Se dit des données qui n’ont pas été traitées, organisées, nettoyées, analysées ou préparées. Des données brutes sont généralement des données non structurées, non classées et non formatées.

  • Granularité : Niveau de détail des données. La granularité des données fait référence au degré de déconstruction des données, qui fournit un niveau de détail supplémentaire (par exemple : une heure décomposée en minutes, puis en secondes, etc.). Le niveau maximum de granularité correspond au niveau maximum de déconstruction qui peut être atteint par un ensemble de données.

  • Ventilation : Possibilité de séparer les éléments constitutifs des données. Celles-ci peuvent par exemple être ventilées en fonction du sexe, de l’âge, du groupe socio-économique, de l’appartenance ethnique, de la localisation géographique ainsi que d’autres caractéristiques socio-économiques.

  • Inclusivité (visualisations des données) : Mise à disposition des données de telle sorte que tous les utilisateurs (ayant ou non des compétences techniques) puissent les comprendre, les analyser et les réutiliser. Les outils de visualisation permettent la démocratisation des données : celles-ci sont présentées de telle façon que l’utilisateur moyen (sans compétence particulière) puisse les comprendre.

Sources : Création de l’auteur à partir de différentes sources dont Commission européenne (2014), « La qualité des données et métadonnées ouvertes », Module de formation 2.2, Open Data Support, https://www.europeandataportal.eu/sites/default/files/d2.1.2_training_module_2.2_open_data_quality_fr_edp.pdf (consulté le 2 juillet 2018) et Melissa (s.d.), « 6 Key Data Quality Dimensions », page web, www.melissadata.com/enews/articles/1007/2.htm (consulté le 2 juillet 2018).

Les efforts accomplis par les pays sont mesurés à l’aide du pilier 2 de l’indice OURdata sur les données publiques ouvertes, utiles et réutilisables (voir la section « Rappels : l’indice Ourdata de l’OCDE : des données ouvertes, utiles et réutilisables »), à l’exception de la protection des données et de la vie privée, qui sont mesurées dans le cadre du pilier 1. Le pilier 2 de l’indice compare les actions stratégiques entreprises par les membres de l’OCDE et les pays partenaires pour garantir l’accessibilité et l’utilité des données publiques ouvertes avant leur publication. Cela inclut notamment l’élaboration d’exigences formelles afin de s’assurer que les données publiques sont publiées avec une licence ouverte, qu’elles sont accompagnées des métadonnées pertinentes et qu’elles possèdent le format – ouvert et non propriétaire – qui convient. Parmi ces exigences figure également l’obligation de fournir les données gratuitement, rapidement et sous forme ventilée (voir l’Encadré 3.2).

Encadré 3.2. Comment l’indice OURdata 2017 mesure l’existence d’exigences formelles relatives à la qualité des données

La protection des données et de la vie privée est mesurée dans le cadre du pilier 1 de l’indice, baptisé Disponibilité des données.

  • Le sous-pilier 1.1, Contenu de la politique d’« ouverture par défaut », évalue l’existence d’exigences formelles visant à rendre les données anonymes avant de les publier.

Les métadonnées sont mesurées dans le cadre du pilier 2 de l’indice, baptisé Accessibilité des données.

  • Le sous-pilier 2.1, Contenu de la politique d’accès sans restriction aux données, évalue l’existence d’exigences formelles et de conseils concernant les métadonnées.

  • Le sous-pilier 2.3, Mise en œuvre, évalue la fourniture effective de métadonnées ainsi que leur contenu.

La rapidité est mesurée dans le cadre du pilier 2 de l’indice, baptisé Accessibilité des données.

  • Le sous-pilier 2.1, Contenu de la politique d’accès sans restriction aux données, évalue l’existence d’exigences formelles concernant la mise à disposition rapide et sans délai excessif des données.

L’octroi d’une licence est mesuré dans le cadre du pilier 2 de l’indice, baptisé Accessibilité des données.

  • Le sous-pilier 2.1, Contenu de la politique d’accès sans restriction aux données, évalue l’existence d’exigences formelles imposant aux ministères et organismes compétents de mettre à disposition les données publiques avec une licence ouverte, ainsi que les opérations pouvant être effectuées par les utilisateurs de ces données.

Les modèles de tarification sont mesurés dans le cadre du pilier 2 de l’indice, baptisé Accessibilité des données.

  • Le sous-pilier 2.1, Contenu de la politique d’accès sans restriction aux données, évalue l’existence d’exigences formelles imposant aux ministères et organismes compétents de mettre à disposition des données publiques gratuitement, ainsi que les opérations pouvant être effectuées par les utilisateurs de ces données.

La ventilation des données est mesurée dans le cadre du pilier 2 de l’indice, baptisé Accessibilité des données.

  • Le sous-pilier 2.1, Contenu de la politique d’accès sans restriction aux données, évalue l’existence d’exigences formelles imposant, le cas échéant, de publier les données de façon ventilée.

Principales lignes directrices et normes applicables à la publication des données

La capacité des organisations du secteur public à internaliser et incorporer par défaut des données ouvertes dans leurs stratégies sectorielles et institutionnelles est un indicateur de la maturité des politiques d’ouverture des données publiques. Cela dit, un tel niveau de sophistication est souvent empêché par l’absence de capacités suffisantes ainsi que par le manque de compréhension et de connaissance de la valeur des données ouvertes dans le secteur public au sens large (voir les chapitres 1 et 2).

Les récents travaux de l’OCDE sur l’administration numérique et les données ouvertes ont montré que, malgré la transformation numérique du secteur public qui a lieu dans certains pays (voir, par exemple, OCDE, 2017a et 2016a), il arrive que le projet d’ouverture des données publiques de l’organisme de coordination de la politique (par exemple le bureau de l’administrateur général des données) n’ait rien à voir avec celui des organisations du secteur public. Par conséquent, les conseils et le soutien fournis par l’organisme central de coordination de la politique – en particulier lors des premières phases de maturité de la politique – sont d’une importance capitale pour sensibiliser l’ensemble du secteur public à l’utilité de l’ouverture des données publiques, ainsi que pour accroître les capacités institutionnelles de mise en œuvre d’initiatives d’ouverture de ces données.

Les pays membres et partenaires de l’OCDE reconnaissent la nécessité de mettre au point, dans le cadre de leur stratégie d’ouverture des données publiques, des instruments d’aide et de conseil afin de faciliter la mise en œuvre de leurs politiques de données ouvertes. La fourniture d’un soutien et de conseils stratégiques est essentielle dans les pays où l’expérimentation et l’innovation dans le domaine des technologies numériques ont lieu de façon isolée et en marge du secteur public. Par conséquent, l’objectif central des instruments d’orientation est non seulement de créer des capacités, mais aussi de développer des connaissances sur les tendances technologiques et sur leur utilité pour atteindre les objectifs de politique générale et accompagner la transformation numérique globale du secteur public. L’adoption de la Charte internationale sur les données ouvertes est également considérée comme un engagement en faveur des données, leur publication exhaustive et leur interopérabilité.

Les efforts visant à améliorer le processus de publication des données doivent compléter les actions ayant été entreprises pour aborder les données en tant qu’infrastructure (voir le chapitre 4). Les pays doivent s’assurer que les données publiques qui sont fournies en tant que données ouvertes répondent à certaines exigences s’ils veulent qu’elles servent d’infrastructure et de plateforme pour la création de valeur publique.

La qualité des données repose surtout sur des éléments comme la rapidité de publication et la fréquence des mises à jour, la création automatique de liens entre les données, ainsi que la clarté et la durabilité de leur publication. Selon les résultats de la troisième version de l’Enquête sur l’ouverture des données publiques (réalisée en 2016/17 auprès des membres de l’OCDE, des pays partenaires et d’autres économies), les critères de qualité des données privilégiés par la plupart des pays sont l’octroi de licences de réutilisation, la publication des données publiques sous un format lisible par la machine et sans contrepartie financière, ainsi que l’élaboration de lignes directrices sur la publication des données (voir le Graphique 3.1).

Graphique 3.1. Aspects de la qualité du processus de publication des données privilégiés dans les stratégies d’ouverture des données publiques des administrations
Graphique 3.1. Aspects de la qualité du processus de publication des données privilégiés dans les stratégies d’ouverture des données publiques des administrations

Note : Les résultats correspondent à la moyenne des notes attribuées par les pays à chaque aspect de la qualité du processus de publication des données qui est privilégié dans les stratégies de leur administration centrale/fédérale, en fonction des options de réponse proposées dans la question (sur une échelle de 1 [priorité élevée] à 8 [priorité faible]). Pour faciliter la visualisation, les résultats sont affichés de 8 [priorité élevée] à 1 [priorité faible]).

Source : Indications fournies par 32 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 2, question 41 : « Veuillez indiquer quels aspects de la qualité du processus de publication des données sont considérés comme des priorités dans la stratégie de votre administration centrale/fédérale : - Clarté et durabilité du processus de publication (par exemple, existence de lignes directrices normalisées concernant la publication des données) - Inventaire des données - Fréquence des mises à jour - Disponibilité en grandes quantités - Licence ouverte - Publication des informations du secteur public sous un format de base, lisible par machine (par exemple CSV) - Gratuité des données - Liens entre les données ».

De la protection de la confidentialité des données personnelles à l’anonymisation des données

Dans le contexte de la transformation numérique rapide des sociétés, des économies et des secteurs publics, il est primordial de trouver le bon équilibre entre l’ouverture par défaut et la protection des données sensibles (y compris, par exemple, des données personnelles ou de celles relatives à la confidentialité commerciale). Il est donc très important de s’assurer que les individus ont connaissance de la manière dont leurs données sont partagées et avec qui et qu’ils y donnent leur consentement, ainsi que de prendre des mesures pour protéger l’accès aux données sensibles, que ce soit au sein du secteur public ou avant la publication des données (par exemple en rendant ces dernières anonymes). Cela est vrai non seulement dans le contexte des politiques d’ouverture des données publiques, mais aussi dans le cadre d’un élargissement de l’accès aux données (par exemple aux données du secteur privé).

La collecte, le partage et l’utilisation des données personnelles par les administrations suscitent souvent des inquiétudes en termes de confiance de l’opinion publique. Il est par conséquent recommandé, pour aborder les questions de confiance de la population et pour exposer clairement les responsabilités des pouvoirs publics au regard de la protection de la vie privée, de souligner que les pouvoirs publics sont les dépositaires – et non les propriétaires – des données personnelles (voir l’Encadré 3.3). Les pouvoirs publics sont donc dans l’obligation de prendre des mesures et d’adopter des pratiques de traitement des données conçues à partir de modèles de gestion des données fondée sur les risques, régies par des instruments de gouvernance des données et de protection de la vie privée, et soutenues par des cadres de gouvernance institutionnelle bien conçus.

Encadré 3.3. Les pouvoirs publics, propriétaires ou dépositaires des données personnelles des citoyens

Il est primordial de faire la différence entre la propriété des données et le rôle de dépositaires joué par les pouvoirs publics à l’égard des données des citoyens si l’on veut s’assurer de la confiance de la population dans la capacité de l’administration à gérer et utiliser correctement les données personnelles et sensibles, mais aussi responsabiliser les citoyens et obliger les pouvoirs publics à rendre des comptes.

En tant que dépositaires des données, les pouvoirs publics ont le droit de collecter, stocker, gérer, partager et utiliser les données des citoyens ; toutefois, la propriété de ces données reste entre les mains des citoyens, ce qui autorise ces derniers à placer des restrictions ou à donner leur consentement à l’utilisation de leurs données par l’administration.

Le Règlement général sur la protection des données de l’UE (RGPD) suit le même principe, à savoir que les pouvoirs publics sont les dépositaires des données des citoyens. Les articles 18 à 22 de ce règlement décrivent une série de droits – de propriété et de contrôle – qu’ont les personnes concernées (c’est-à-dire les citoyens) sur les données à caractère personnel détenues par les pouvoirs publics.

L’article 18 établit que, dans des circonstances particulières, une personne concernée a le droit de limiter le traitement de ses données. Si, par exemple, cette personne conteste l’exactitude de ses données à caractère personnel, le traitement de ces données sera limité jusqu’à ce que leur exactitude soit vérifiée.

De la même manière, l’article 17 prévoit que, dans des conditions particulières, une personne concernée a le droit de demander l’effacement, dans les meilleurs délais, de données à caractère personnel. Le responsable du traitement a alors l’obligation d’effacer ces données dans les meilleurs délais.

La distinction entre les dépositaires et les propriétaires des données est donc capitale pour garantir la réutilisation des données tout en préservant – voire en renforçant – la confiance des citoyens dans les pouvoirs publics.

Les pouvoirs publics doivent, globalement, mettre en place un environnement qui leur permette de gérer et d’utiliser les données des citoyens sans menacer la sécurité, la sûreté et la confidentialité de ces données. Cela signifie qu’ils doivent créer un cadre leur permettant de faire le meilleur usage possible des données des citoyens tout en autorisant ces derniers, en tant que propriétaires de plein droit de leurs données personnelles, à en limiter l’utilisation.

Source : L’auteur, sur la base des informations du Parlement européen et du Conseil de l’Union européenne (2016), « Règlement général sur la protection des données », Règlement (UE) 2016/679, https://eur-lex.europa.eu/legal-content/FR/ALL/?uri=CELEX:32016R0679.

À la lumière des récents scandales internationaux causés par la mauvaise gestion des données personnelles par le secteur privé, et suite à l’entrée en vigueur du Règlement général sur la protection des données de l’UE (RGPD) le 25 mai 2018, les pouvoirs publics conçoivent de plus en plus des instruments d’action favorisant et garantissant une gestion éthique des données par les entités publiques et privées.

Globalement, ces instruments contribuent à l’établissement d’un cadre de gouvernance solide (pour en savoir plus, voir le chapitre 1) et aident à la mise en place d’une base institutionnelle, politique, juridique et réglementaire pour gagner durablement la confiance des citoyens. Ils peuvent, par exemple, rassurer les citoyens sur la façon dont leurs données personnelles sont gérées et partagées au sein du secteur public – par exemple en les anonymisant (dans le cadre du processus de traitement) avant de les publier – et souligner le rôle des pouvoirs publics en tant que dépositaires des données des citoyens.

Dans le cadre des politiques d’ouverture des données, les administrations centrales ont mis au point un ensemble d’instruments formels favorisant la protection de la confidentialité des données. Le but était d’orienter et/ou d’aider les organisations du secteur public dans le processus d’anonymisation des données avant leur publication ou dans celui de restriction de l’accès public aux données sur la base de contrôles d’accès sélectifs.

Dans les résultats de la troisième version de l’Enquête sur l’ouverture des données publiques, seuls deux pays (le Pérou et la Turquie) font état de l’absence d’exigences formelles imposant aux organisations du secteur public d’anonymiser les données avant leur publication. Dans la plupart des pays, des lois sur la liberté de l’information, la protection de la confidentialité des données et/ou la transparence régulent, régissent et/ou limitent l’accès aux données personnelles. Cette situation résulte soit de l’évolution des données publiques ouvertes – née d’une volonté d’accroître l’accès aux informations du secteur public (Ubaldi, 2013) –, soit du fait que dans de nombreux pays, la politique d’ouverture des données publiques est l’une des composantes des politiques de transparence du secteur public. Cela dit, à mesure que l’ouverture de l’administration (ainsi que celle des données publiques) s’accroît, il existe un sentiment de plus en plus vif que les pouvoirs publics sont tenus de publier les données, à condition de développer et de mettre en œuvre des modèles de protection des données personnelles.

La protection des données personnelles, privées et sensibles passe par la conception d’instruments d’action (lignes directrices, normes techniques, par exemple), afin de s’assurer que dans la pratique, seules des données anonymisées sont mises en accès public. On passe donc de textes d’orientation (par exemple des lois sur la protection des données et de la vie privée) à l’action (l’anonymisation des données).

En France et en Norvège, par exemple, les autorités de protection des données ont mis au point des lignes directrices sur l’anonymisation des données par les organismes publics avant leur publication. Au Royaume-Uni, le document « Anonymisation Code of Practice » de l’Information Commissioners Office (ICO) donne des conseils pour anonymiser les données, dans le respect de la loi britannique sur la protection des données. Le pays a également élaboré un cadre d’utilisation éthique des données, afin d’aider les fonctionnaires publics à traiter les données de façon éthique, ouverte et responsable (voir l’Encadré 3.4). Enfin, l’ICO a conçu une évaluation d’impact de la protection des données pour aider les organisations à appliquer les dispositions du RGPD.

Au Mexique, un guide de mise en œuvre de la politique d’ouverture des données présente les exigences de base ainsi que les méthodes utilisables pour anonymiser les données avant leur publication en tant que données ouvertes. En Colombie, le Département national des statistiques a mis au point des lignes directrices sur l’anonymisation des données incluant des protocoles d’anonymisation des microdonnées et décrivant des exercices de collecte et de publication de données dans le cadre du système éducatif et sanitaire national.

Encadré 3.4. Le cadre d’utilisation éthique des données du Royaume-Uni

Le cadre d’utilisation éthique des données (ou « Data Ethics Framework ») conçu par le Royaume-Uni a pour but d’aider les fonctionnaires publics en leur fournissant des outils pour utiliser les données. Ce cadre énonce toute une série de principes relatifs à la gestion et l’utilisation des données dans le secteur public. Son objectif est de faire en sorte que la création de valeur résultant de l’utilisation des données aille de pair avec le respect des normes les plus strictes en matière de transparence et de responsabilité.

Ce cadre contient les sept principes suivants :

  1. 1. Commencer par cerner clairement les besoins des utilisateurs et les bienfaits pour la population : Ce principe souligne qu’il est important de définir clairement les besoins des utilisateurs et les bienfaits attendus pour la population d’une solution répondant à un besoin précis.

  2. 2. Connaître la législation et les codes de bonne pratique applicables : Ce principe souligne l’importance de la connaissance, par les fonctionnaires publics, des lois et codes de bonne pratique existants qui ont trait à l’utilisation et au partage des données (par exemple le « Code of Practice for Statistics » ou le Règlement général sur la protection des données de l’UE).

  3. 3. Utiliser des données correspondant au besoin des utilisateurs : Ce principe indique que l’utilisation des données doit rester proportionnée, et donc qu’une quantité minimale de données (personnelles ou non) doit être utilisée pour atteindre l’objectif souhaité.

  4. 4. Comprendre les limitations applicables aux données : Ce principe souligne que l’utilisation des données peut faire l’objet de limitations (autres que les obstacles juridiques) qui doivent être prises en compte par les fonctionnaires publics. Il peut s’agir – mais pas uniquement – d’erreurs dans les données, de distorsions, de métadonnées incomplètes ou de la source des données.

  5. 5. Adopter des méthodes de travail robustes et se limiter à son domaine de compétence : Ce principe insiste sur l’importance de choisir des méthodes de travail appropriées et de travailler sur des données relevant du domaine de compétence du fonctionnaire. Les méthodes recommandées sont notamment le travail en équipes pluridisciplinaires, la vérification de la fiabilité des algorithmes, la définition de performances types acceptables ou l’expérimentation du modèle dans des conditions variées.

  6. 6. Faire preuve de transparence et de responsabilité : Ce principe insiste sur la nécessité pour les fonctionnaires publics d’être transparents et clairs (par exemple en employant des termes simples) au sujet des outils, des données et des algorithmes qu’ils utilisent (ainsi que sur leur processus de développement) dans le cadre de leurs activités. L’objectif de ce principe est de responsabiliser les fonctionnaires lorsqu’ils utilisent des données.

  7. 7. Utiliser les données de façon responsable : Ce principe fait référence à l’utilisation responsable des informations ou des résultats provenant de l’analyse des données. Cela suppose l’élaboration d’un plan de mise en œuvre ainsi que de méthodes d’évaluation éprouvées pour assurer le suivi des politiques s’appuyant sur l’analyse des données.

Outre ces principes, le cadre fournit des conseils d’application pour chacun d’eux, ainsi qu’un manuel pour aider les organisations du secteur public à les intégrer dans leurs projets.

Source : UK Department for Digital, Culture, Media and Sport (2018), « Data Ethics Framework », Londres, www.gov.uk/government/publications/data-ethics-framework.

Si la plupart des pays ont pris des mesures pour assurer la protection des données personnelles, les flux transnationaux de données et la transformation numérique de l’économie accroissent la nécessité de concerter les actions aux niveaux régional et mondial (voir l’Encadré 3.5). Au niveau européen, les directives et les instruments de l’UE tels que le Règlement général sur la protection des données (RGPD) (UE 2016/679) montrent que la mondialisation des réseaux de partage de données a conduit à la nécessité de redonner le contrôle aux citoyens de l’UE.

Encadré 3.5. Le partage transnational de données dans la région de la Scandinavie/Baltique

Les travaux de l’OCDE sur l’administration numérique ont montré la nécessité de mener des actions multinationales concertées au sujet du partage transnational de données. L’un des aspects qui ressort de ces travaux est le manque d’homogénéité entre les politiques et les objectifs des différents pays en matière d’administration numérique ; or, en dépit d’une volonté politique, ce manque d’homogénéité empêche de progresser plus rapidement sur le plan de la collaboration transnationale.

Les examens de l’OCDE de 2015 sur la gouvernance publique de l’Estonie et de la Finlande mettent en évidence, au vu de la transformation numérique des sociétés et des économies, la nécessité d’un partage transnational des données. Ces examens se sont conclus par un ensemble de recommandations concernant les actions qu’il convient d’envisager pour encourager les partages de données et les prestations de services transnationaux :

  • Repérer les domaines prioritaires dans lesquels une coopération transnationale peut être nécessaire.

  • Faire participer les utilisateurs et les parties prenantes à la sélection des priorités en ce qui concerne les services transnationaux.

  • Élaborer des prototypes de services transnationaux et les expérimenter sur les utilisateurs potentiels.

  • Établir un lien entre la prestation de services et le partage de données transnationaux et les priorités locales, nationales et supranationales.

  • Adapter la réglementation nationale afin de permettre la libre circulation des données au-delà des frontières.

  • Mettre au point des mécanismes de gouvernance appropriés pour faciliter le partage de données et les prestations de services transnationaux (par exemple des types de projets communs pour le suivi, le compte rendu et la mise en œuvre de services transnationaux ; la mise en relation entre les propriétaires et les gestionnaires de services situés dans des pays partenaires ; une gestion des infrastructures et un développement de mécanismes de gouvernance en partenariat ; la conception et la gestion conjointes des infrastructures telles que les couches d’interopérabilité.

  • Examiner et exploiter les synergies entre les intérêts locaux, nationaux et bilatéraux dans différents domaines d’action.

Le fait que le dispositif estonien X-Road se mette aujourd’hui en place en Finlande permet d’accroître la compatibilité entre les systèmes estoniens et finlandais, et donc d’améliorer l’interopérabilité et le partage des données entre les deux pays grâce à l’adoption du principe de la transmission unique d’informations – cher à la Commission européenne – comme vecteur de convergence.

Le partage transnational de données peut cependant être entravé par des problèmes de compatibilité entre les réglementations. L’examen de 2017 sur la gouvernance publique de la Norvège a mis en évidence que la législation norvégienne – telle que la loi sur les archives et celle sur la gestion comptable – limite la gestion et le partage de données transnationaux, ce qui a pour effet de restreindre le stockage transfrontière des données ainsi que de freiner le développement de services basés sur le nuage pouvant nécessiter le stockage des données sur des serveurs situés à l’étranger. Au niveau supranational, ces conditions ont limité la coopération scandinave dans le domaine.

Source : OCDE (2017a), Digital Government Review of Norway: Boosting the Digital Transformation of the Public Sector, OECD Digital Government Studies, Éditions OCDE, Paris, https://doi.org/10.1787/9789264279742-en ; OCDE (2015), OECD Public Governance Reviews: Estonia and Finland: Fostering Strategic Capacity across Governments and Digital Services across Borders, OECD Public Governance Reviews, Éditions OCDE, Paris, https://doi.org/10.1787/9789264229334-en.

Les catalogues de données

Le concept de « catalogue de données » est l’un des plus mal compris par les pays membres et partenaires de l’OCDE. De manière générale, les réponses à la troisième version de l’enquête de l’OCDE sur l’ouverture des données publiques montrent qu’un catalogue de données est considéré comme l’équivalent du portail centralisé de données ouvertes, c’est-à-dire comme le principal registre de données du secteur public. Il n’est pas étonnant que CKAN soit l’un des outils les plus communément utilisés pour gérer les données publiques ouvertes. En revanche, le catalogue de données est rarement considéré comme un instrument de gestion et de gouvernance des données qui, tout en étant lié à la publication de données publiques ouvertes, peut être utilisé pour mettre en place un secteur public fondé sur les données (voir l’Encadré 3.6).

Encadré 3.6. Qu’est-ce qu’un catalogue de données ?

Un catalogue de données est un emplacement où des informations (données et métadonnées) sont enregistrées de façon centralisée afin d’être plus faciles à rechercher et à partager, tout en étant compréhensibles. Avec ces catalogues, les données sont placées au cœur de la transformation numérique et élevées au rang d’atouts pour une organisation.

Pour citer un exemple, le catalogue de données d’une administration centrale/fédérale contient, lorsqu’il est complet, l’ensemble des données publiques dont dispose cette administration ou ayant trait au domaine d’action des pouvoirs publics. Bien que ces données puissent demeurer à leurs emplacements respectifs, les catalogues peuvent permettre de savoir qui en sont les détenteurs et fournir un lien pour y accéder.

Les catalogues de données permettent aux utilisateurs de rechercher, de comprendre et d’utiliser facilement les données dont disposent toutes les organisations du secteur public car ils offrent une plateforme facilitant la recherche et la compréhension des données en fournissant des informations pertinentes à leur égard.

Lorsqu’ils sont exhaustifs, les catalogues de données représentent aussi des bases de connaissances sur les données dont dispose le secteur public. Ils peuvent aider les fonctionnaires publics à mieux savoir quelles sont les données disponibles au sein de leur organisation et, plus généralement, dans l’ensemble du secteur public. Cette visibilité accrue peut à la fois encourager la publication des données publiques en tant que données ouvertes – car elles sont sollicitées par des réutilisateurs mieux informés –, mais aussi promouvoir la réutilisation des données publiques au sein des administrations.

Les catalogues de données peuvent alors jouer un rôle primordial dans l’incitation aux réformes et à l’innovation axées sur les données au sein du secteur public. Ils peuvent réduire les éventuels cloisonnements existant dans le secteur, accélérer le processus de réutilisation en permettant aux organisations de rechercher et de trouver les données dont elles ont besoin, et servir de plateformes dans l’optique de la publication des données publiques.

Pour être efficients, les catalogues de données nécessitent l’accord des organisations du secteur public concernant les métadonnées. En fait, l’interopérabilité entre les données et les métadonnées qui les accompagnent est indispensable si l’on veut qu’un catalogue de données central/fédéral permette une gestion efficiente des données au sein des organisations du secteur public et entre elles.

Idéalement, les catalogues de données doivent aussi, pour être efficients, permettre aux organisations du secteur public de réviser les métadonnées et de les enrichir si besoin est. Ils deviennent alors une plateforme de collaboration entre lesdites organisations dans le but d’améliorer la compréhension générale des données. Pour encourager les approches fondées sur les données, les pouvoirs publics ont besoin de créer les infrastructures adéquates, dont un élément central est l’existence d’un catalogue de données exhaustif au niveau central/fédéral.

Source : L’auteur, à partir de différentes sources dont Underwood, J. (2017), « Why you need a data catalog and how to select one », www.jenunderwood.com/2017/08/30/need-data-catalog-select-one/ (consulté le 10 juillet 2018) ; Le Big Data (2018), « Data Catalog définition : tout savoir sur les catalogues de données », www.lebigdata.fr/data-catalog (consulté le 10 juillet 2018) ; Microsoft Azure (2018), « Data Catalog Documentation », https://docs.microsoft.com/en-us/azure/data-catalog/ (consulté le 10 juillet 2018).

Les résultats de la troisième version de l’enquête de l’OCDE sur l’ouverture des données publiques de 2016/17 mettent en évidence d’importants écarts entre les pays membres en ce qui concerne l’existence d’un catalogue de données au niveau de l’administration centrale/fédérale. Seuls 7 pays sur 34 font état de l’existence d’un tel catalogue, alors que la plupart des pays (18 sur 34) ne disposent d’aucun catalogue au niveau central/fédéral.

Par conséquent, malgré l’impulsion claire des pays en faveur de la publication des données publiques, la plupart d’entre eux n’ont toujours pas créé de catalogue de données, un outil essentiel pour la gestion et la gouvernance de la chaîne de valeur des données. Cela peut avoir des conséquences non négligeables en ce qui concerne l’efficacité de la gestion de cette chaîne de valeur dans le secteur public, dont les données ouvertes ne sont pas les seules composantes.

Les pays devraient déployer davantage d’efforts pour comprendre les différents éléments qui entrent en ligne de compte dans la gouvernance de la chaîne de valeur des données, et repérer les plus importants afin de permettre une gestion efficace des données. Cela pourrait avoir une incidence majeure sur la disponibilité, l’accessibilité et la réutilisation des données publiques, à la fois au sein et en dehors du secteur public.

Au niveau institutionnel, 23 membres de l’OCDE sur 32 ainsi que 3 pays partenaires ou autres signalent l’existence d’exigences formelles en ce qui concerne l’élaboration de catalogues de données par les organisations du secteur public, exigences nécessaires pour harmoniser et guider la publication des données publiques (voir le Graphique 3.2). Cela dit, les pouvoirs publics devraient produire et présenter ces efforts comme des étapes stratégiques clés précédant la mise en place d’un secteur public fondé sur les données. L’interopérabilité des catalogues de données institutionnels (par exemple grâce à l’utilisation d’une même sémantique et de normes communes en matière de métadonnées) contribuerait alors à un meilleur partage des données au sein du secteur public.

Graphique 3.2. Existence d’exigences formelles pour l’élaboration de catalogues de données institutionnels dans les pays membres et partenaires de l’OCDE
Graphique 3.2. Existence d’exigences formelles pour l’élaboration de catalogues de données institutionnels dans les pays membres et partenaires de l’OCDE

Source : Indications fournies par 32 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 12 : « Existe-t-il, au niveau central/fédéral, des exigences formelles imposant aux ministères/organismes publics de gérer une base de données (par exemple un catalogue de données) ? ».

Les métadonnées et l’interopérabilité

Les métadonnées fournissent des informations sur les données ayant été collectées, et leur harmonisation facilite les opérations de recherche et d’accès à ces données. Les métadonnées aident à normaliser les définitions de données ; elles permettent aussi d’améliorer la comparabilité et l’interopérabilité des données, ainsi que leur compréhension (Ubaldi, 2013).

Les métadonnées servent à définir d’autres données, en fournissant des informations contextuelles sur leur contenu et leur nature. Elles indiquent par exemple l’origine des données et la façon dont elles ont été recueillies, ou fournissent des documents pouvant être utiles pour trouver et comprendre les données elles-mêmes. En rendant les données claires et utiles, et en facilitant leur partage et leur interopérabilité, les métadonnées contribuent à leur clarté et leur accessibilité.

Pour garantir le partage et l’interopérabilité des données, l’une des priorités majeures pour les pays membres et partenaires de l’OCDE est de veiller à ce que les ensembles de données ouvertes s’accompagnent de métadonnées homogènes et fondamentales et soient fournis sous un format lisible par l’homme et par la machine. Dans la pratique, les efforts en matière d’interopérabilité incluent également l’adoption de normes ouvertes et homogènes concernant les formats et la structure des données, ainsi que la possibilité d’utiliser, par exemple, une sémantique et des identifiants communs lors de la collecte, du partage et de la publication des données.

Les réponses à la troisième version de l’enquête de l’OCDE sur l’ouverture des données publiques montrent que les pays membres et partenaires de l’OCDE prennent de plus en plus conscience de l’importance de l’interopérabilité des données et des métadonnées. La plupart des pays ont élaboré des normes concernant les données ainsi que des lignes directrices sur la publication et la réutilisation des données, dont des normes relatives aux métadonnées afin de faciliter l’interopérabilité et l’accessibilité. En tout, 30 membres de l’OCDE, pays partenaires et autres économies (Colombie, Lituanie et Pérou) font état de l’existence d’exigences formelles globales imposant la publication des données ouvertes avec les métadonnées correspondantes. Deux membres de l’OCDE – la Belgique et la France – indiquent que seuls quelques ministères ont adopté de telles exigences. Le Danemark, la Suède et la Turquie sont les seuls pays de l’OCDE où ces exigences n’existent pas. Parmi les 30 pays signalant l’existence d’exigences formelles globales, la plupart (hormis la Lituanie, la Norvège et le Portugal) précisent quelles informations doivent être fournies par les métadonnées.2

Pour citer des exemples, aux États-Unis, le Bureau de la gestion et du budget (OMB) de la Maison-Blanche a conçu et publié en 2013 un guide – incluant un schéma de métadonnées – sur la publication des données par les organismes publics. Le Royaume-Uni a lui aussi élaboré une série de lignes directrices et de normes concernant les données ouvertes, qui sont disponibles publiquement sur le portail centralisé des données publiques ouvertes.3 On peut également citer les exemples suivants :

  • Au Mexique, l’organe de coordination de la stratégie numérique nationale – qui fait partie du Cabinet présidentiel – a élaboré en 2015 (avec une mise à jour en 2017) un guide de mise en œuvre de la politique d’ouverture des données4 (Guía de Implementación de la Política de Datos Abiertos) pour aider les organismes publics à concevoir leurs propres plans d’ouverture des données et à ouvrir l’accès à leurs données. Ce guide promeut l’interopérabilité des données en exigeant l’utilisation de la gamme de caractères ASCII 6 pour les noms de fichiers et les URL, ainsi que le langage DCAT pour les métadonnées.5 Le Bureau national mexicain de la statistique (INEGI) a joué un rôle essentiel à cet égard en mettant au point la norme technique d’ouverture des données applicable aux informations d’intérêt national et son guide de mise en œuvre, qui traite également des normes relatives aux métadonnées et des formats des données ouvertes (OCDE, 2016a).

  • Au Canada, le Secrétariat du Conseil du Trésor a émis à l’intention des ministères et des organismes publics fédéraux des lignes directrices sur la mise en œuvre des métadonnées, avec des schémas de métadonnées normalisés à l’échelon fédéral et un vocabulaire commun pour faciliter l’interopérabilité. Le Profil d’application de métadonnées du gouvernement ouvert, qui présente les exigences et les bonnes pratiques en matière de métadonnées, est mis à la disposition des ministères concernés.

  • En Italie, les lignes directrices nationales pour l’amélioration des informations du secteur public6 établies par l’Agence numérique italienne indiquent aux organismes publics comment s’y prendre pour assurer l’interopérabilité et la normalisation des données et des métadonnées. La même agence a également publié d’autres lignes directrices fournissant des conseils sur l’interopérabilité sémantique et les liens entre les données ouvertes.7

  • En Norvège, l’Agence de la gestion publique et de l’administration électronique (Difi) a élaboré, dans le cadre du modèle de gouvernance des informations de l’administration norvégienne, des normes sur les métadonnées et des lignes directrices sur la publication des données publiques ouvertes (OCDE, 2017a).

  • En Espagne, une norme technique d’interopérabilité a été mise au point pour la réutilisation des ressources en matière d’information. L’objectif est de définir des lignes directrices concernant la réutilisation des documents et des informations publics. Cette norme établit notamment un ensemble de critères communs à utiliser pour repérer, sélectionner et décrire les informations réutilisables.8

  • En Slovénie, le portail national sur le cadre d’interopérabilité permet aux différentes parties prenantes du secteur public de publier en ligne des normes et des lignes directrices sur l’interopérabilité à tous les niveaux (juridique, organisationnel, sémantique ou technique), afin d’encourager l’utilisation des mêmes dispositifs et méthodologies sémantiques. Il existe également dans le pays un réseau de responsables de l’interopérabilité provenant de différentes organisations du secteur public, qui se réunissent régulièrement pour discuter de l’interopérabilité des données dans l’administration publique.9

Cela étant, l’approche adoptée par chaque pays dépend de facteurs organisationnels ayant une incidence sur la culture du secteur public. En Estonie, par exemple, il n’existe pas d’exigences formelles à proprement parler, mais des recommandations en faveur de l’interopérabilité des données et de l’utilisation d’un langage simple pour les métadonnées. En revanche, dans d’autres pays de l’OCDE comme la Finlande, la France, la Corée, la Pologne, le Portugal et la Lituanie, des approches plus strictes ont été adoptées pour assurer l’interopérabilité des données et des métadonnées dans l’ensemble du secteur public, à savoir des obligations légales et/ou réglementaires.

Les résultats de la troisième version de l’enquête de l’OCDE sur l’ouverture des données publiques montrent que dans la pratique, les pays ont privilégié la publication de métadonnées sur la terminologie (les termes clés), la période couverte et l’objectif de la collecte des données (voir le Graphique 3.3). De nombreux pays ont mis en œuvre des normes pour garantir la publication de métadonnées lisibles par machine (par exemple aux formats DCAT et JSON), ce qui contribue à la qualité, l’accessibilité et l’interopérabilité des données publiques ouvertes, ainsi qu’à l’utilité des portails centralisés où ces données sont publiées (voir le chapitre 5). En revanche, peu de pays fournissent des informations complémentaires ou des métadonnées concernant les limitations applicables aux données ou les méthodes de collecte des données.

Graphique 3.3. Informations fournies par les métadonnées accompagnant les données ouvertes publiées sur les portails centralisés dans les pays membres et partenaires de l’OCDE
Nombre de pays
Graphique 3.3. Informations fournies par les métadonnées accompagnant les données ouvertes publiées sur les portails centralisés dans les pays membres et partenaires de l’OCDE

Source : Indications fournies par 32 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 75b : « Sur le portail à guichet unique de l’administration centrale/fédérale, quelles sont les informations généralement fournies par les métadonnées ? ».

La publication rapide des données

L’une des caractéristiques déterminant la qualité des données ouvertes est la rapidité avec laquelle elles sont publiées. Cela dit, cet aspect est souvent géré par une approche réglementaire (par exemple l’élaboration d’exigences formelles) dont la mise en application et le suivi peuvent s’avérer difficiles.

Sur les 34 pays membres et partenaires de l’OCDE interrogés, 19 font état de l’existence d’exigences particulières concernant la publication rapide des données ouvertes, et 13 indiquent qu’ils imposent formellement aux organisations du secteur public de préciser systématiquement les dates d’actualisation des ensembles de données dans les métadonnées qui les accompagnent.

En Corée, le décret d’application de la loi sur l’ouverture des données stipule que les organismes publics doivent pourvoir à la publication rapide des données dont elles sont dépositaires, et les lignes directrices en matière de gestion des données ouvertes fixent à un an le délai de mise à jour de toutes les données publiées sur le portail centralisé. En Norvège et en Nouvelle-Zélande, la rapidité de publication et l’actualisation des données publiques ouvertes sont considérées comme des principes de base de la gestion et la publication des données. Dans d’autres pays comme l’Allemagne, la République slovaque et les États-Unis, le délai de publication des données est régi par les lois sur la liberté de l’information.

Garantir la publication rapide des données ouvertes est un aspect particulièrement important dans le contexte de l’automatisation de la publication et du partage des données en temps réel (par exemple en utilisant des interfaces de programmation API), ainsi que de la nécessité d’assurer un flux continu de données une fois que celles-ci sont internalisées et réutilisées dans le cadre des modèles économiques des acteurs des secteurs public, privé et associatif.

En Australie, par exemple, la déclaration d’intention du gouvernement australien au sujet des données publiques enjoint les organismes publics à mettre en place un système d’automatisation pour la publication et l’actualisation des données publiques ouvertes. En France, la loi pour une République numérique demande aux organisations du secteur public de publier leurs données qui revêtent un intérêt économique, social, sanitaire ou environnemental. Bien que cette loi ne fournisse pas plus de détails sur les catégories de données devant être publiées, les ensembles de données sont supposés être automatiquement actualisés en fonction de leur importance relative. Par ailleurs, en France également, l’Institut national de la statistique et des études économiques (INSEE) publie au titre de données ouvertes le répertoire SIRENE, qui est le registre des entreprises immatriculées en France. Ce répertoire doit également être actualisé quotidiennement et sans délai excessif.

L’octroi de licences

La consultation, la réutilisation et l’ouverture par défaut des données publiques requièrent la définition de conditions d’octroi des licences permettant d’assurer un accès, un partage et une réutilisation sans restriction de ces données. En fixant et en respectant ces conditions d’octroi des licences, les organisations du secteur public et les utilisateurs garantissent la traçabilité des données jusqu’à leur origine (en reconnaissant la source des données) et contribuent à l’avènement d’une société (ouverte) fondée sur le savoir.

Dans la zone OCDE, les régimes d’octroi de licences sont bien avancés. À l’exception de la Pologne, du Portugal, de la Suède et de la Turquie, 31 pays sur 35 membres de l’OCDE et pays partenaires fixent des exigences particulières imposant de publier les données publiques ouvertes conformément à des régimes de licences favorisant l’accessibilité et la réutilisation (voir l’Annexe 3.A) – par exemple en concevant des licences nationales ouvertes telles que la licence du gouvernement ouvert au Canada,10 la licence ouverte d’Étalab (la mission chargée de l’ouverture des données) en France,11 les conditions d’utilisation normalisées au Japon, les conditions de libre réutilisation au Mexique,12 et la licence du gouvernement ouvert (« Open Government License ») au Royaume-Uni.13 D’autres pays (comme l’Australie, la Finlande, l’Irlande, la Nouvelle-Zélande, la Norvège, le Portugal, la Slovénie et les États-Unis) ont choisi de promouvoir l’utilisation de régimes de licences très connus et connaissant un grand succès tels que les Creative Commons et les licences réservées au domaine public (comme CC0, CC BY, PDDL et ODbL).

Les modèles de tarification

Les exigences formelles imposant la mise à disposition gratuite des données publiques permettent aux utilisateurs de demander, de consulter et d’utiliser les données publiques sans verser de contrepartie financière. Cette gratuité des données publiques est conforme à la définition même de l’ouverture ; elle réduit les obstacles conçus volontairement pour limiter l’accès aux données et accroît l’inclusivité de la politique d’ouverture des données dans son ensemble.

Le modèle de tarification choisi pour les données publiques doit en outre promouvoir le partage et la réutilisation des données dans l’ensemble des administrations, afin d’encourager la mise en place de secteurs publics fondés sur les données. Si les modèles de tarification internes peuvent conduire à la réutilisation des données publiques, ils peuvent aussi l’intensifier. Par conséquent, la libre consultation et la libre réutilisation des données publiques constituent le modèle de tarification idéal pour mettre en place des secteurs publics fondés sur les données.

La plupart des membres et partenaires de l’OCDE ont adopté une approche d’ouverture par défaut qui couvre les aspects financiers de l’ouverture ainsi que leur rapport avec la libre mise à disposition des données publiques ouvertes (Graphique 3.4) (voir le chapitre 4).

Graphique 3.4. Modèles de tarification appliqués pour la consultation et la réutilisation des données publiques dans les pays membres et partenaires de l’OCDE
Nombre de pays
Graphique 3.4. Modèles de tarification appliqués pour la consultation et la réutilisation des données publiques dans les pays membres et partenaires de l’OCDE

Source : Indications fournies par 31 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 2, question 59. « Quel est le principal modèle de tarification appliqué pour la consultation et la réutilisation des données publiques au niveau central/fédéral ? »

En France, par exemple, l’ouverture des données publiques est gratuite par défaut, mais la loi pour une République numérique a étendu le concept de gratuité en l’appliquant également au partage des données au sein de l’administration. Dans des pays comme le Chili, le Japon, le Mexique, la Norvège et la Suisse, le principe de « gratuité » est intégré aux normes techniques et/ou lignes directrices et manuels consacrés à la publication des données ouvertes. En Norvège, des exceptions existent à la règle de la gratuité, mais les institutions publiques doivent communiquer à l’avance les coûts du partage des données. Il ressort de l’enquête que ce modèle de tarification a été adopté par une majorité de pays. En fait, 24 pays sur 34 ont mis en œuvre un système permettant de consulter et de réutiliser gratuitement l’ensemble des données publiques ouvertes.

Il existe néanmoins quelques exceptions. Dans certains pays, les organisations du secteur public utilisent un modèle économique fondé en grande partie sur un système de redevances, qui est également appliqué dans le contexte de la réutilisation en interne des données partagées avec d’autres organismes publics et avec les citoyens. Dans ces pays, l’obligation de mettre à disposition toutes les données gratuitement représente une menace pour le modèle de financement des organisations publiques, et a donc rencontré une vive résistance.

Pour citer un exemple, dans une grande majorité de pays, les données cadastrales et géographiques continuent d’être facturées car les organisations du secteur public qui les fournissent se sont opposées à leur gratuité. C’est le cas en Autriche et en Suède, où les organisations facturent toujours la fourniture des données géographiques.14 En Suède, les informations du secteur public – dont les données publiques – sont par défaut gratuites et accessibles par tous. Néanmoins, s’agissant des données dont la diffusion est payante, les conditions de tarification sont réglementées. En Suède, par exemple, la vente de données constitue une part importante du budget des autorités chargées de la cartographie ainsi que de l’enregistrement foncier et cadastral, ce qui est l’une des raisons de l’opposition de ces autorités à la diffusion gratuite des données.15

Par conséquent, bien que les pouvoirs publics aient la possibilité d’instaurer des exigences formelles pour que les données publiques soient mises à disposition gratuitement, il sera essentiel pour eux de proposer aux organisations du secteur public des modèles économiques alternatifs qui compensent cette gratuité (voir l’Encadré 3.7).

De fait, pour encourager l’adoption d’un modèle de tarification permettant la diffusion gratuite des données publiques, des incitations adéquates devront être mises en place à l’intention des organisations du secteur public (voir le chapitre 4). Cela sera d’autant plus important dans le domaine des données géographiques, où les incitations à fournir ces données gratuitement sont rares. La directive européenne INSPIRE vise en vérité à encourager le partage des données géographiques détenues par des autorités publiques, mais la question de la gratuité du partage n’y est pas abordée (voir le chapitre 4).

Outre les obstacles que les modèles économiques des organisations du secteur public peuvent représenter, dans certains pays, des dispositions légales continuent d’empêcher la libre diffusion des données publiques. Dans certains pays européens, par exemple, la directive européenne ISP prévoit que les organisations peuvent prélever des redevances correspondant aux coûts marginaux de reproduction, de mise à disposition et de diffusion des données publiques.

En Espagne, l’article 7 de la loi sur la réutilisation des informations du secteur public énonce, conformément à la directive européenne ISP, les conditions dans lesquelles la fourniture de données publiques peut être payante.16 En Autriche, les données publiques diffusées au titre de données ouvertes sont gratuites, mais celles diffusées conformément à la directive européenne ISP peuvent être soumises à des redevances correspondant aux coûts marginaux d’extraction des données.17

Outre la création d’un environnement dans lequel les organisations du secteur public recevraient des incitations financières pour fournir gratuitement les données dont elles disposent, il serait judicieux que les pouvoirs publics établissent un cadre – juridique et d’action – favorisant la diffusion, la consultation et la réutilisation des données publiques sans contrepartie financière.

Encadré 3.7. Réalisation d’une étude de rentabilité sur l’accès gratuit aux données publiques au Danemark

Cherchant à promouvoir le partage et la réutilisation des données au sein des organisations publiques et entre elles, le gouvernement danois a présenté au secteur public les nombreux avantages de l’ouverture des données. Son objectif était, ce faisant, de susciter un engouement collectif dans l’ensemble du secteur public, afin d’inciter toutes les organisations à publier, partager et réutiliser les données publiques.

La réalisation d’une étude de rentabilité sur l’instauration d’un accès gratuit aux données publiques a été préférée à la seule mise en place d’obligations légales imposant l’ouverture gratuite de ces données. Cette étude s’appuyait sur la valeur des données en tant qu’atout stratégique pour encourager la modernisation du secteur public et accroître son efficience.

En faisant cette proposition sur la valeur des données ouvertes, le gouvernement cherchait à susciter l’intérêt des organisations du secteur public à fournir leurs données en tant que données ouvertes (autrement dit, il souhaitait créer une motivation intrinsèque à diffuser des données publiques ouvertes ; voir l’encadré 4.3 dans le chapitre 4).

En s’appuyant sur l’intérêt des organisations du secteur public et sur leur compréhension des avantages de l’ouverture des données, le gouvernement danois a encouragé lesdites organisations à adhérer au « Basic Data Programme », un programme axé sur la diffusion d’ensembles de données de grande valeur, afin d’accroître les bienfaits à la fois financiers et sociaux des données.

Le cas du Danemark est un exemple clair de la création d’une motivation intrinsèque à fournir des données publiques en tant que données ouvertes, plutôt que de mettre en place des exigences légales pour obliger les organisations du secteur public à le faire.

En suscitant une prise de conscience dans l’ensemble du secteur public et en mettant en œuvre une approche stratégique commune à l’égard des données publiques, le gouvernement danois a réussi à proposer un modèle économique alternatif qui compense la diffusion gratuite des données. Les organisations du secteur public ont été amenées à constater les avantages à long terme de l’ouverture des données publiques, par opposition aux avantages directs du partage payant de ces données.

Source : OCDE (2018a), Digital Government Review of Colombia: Towards a Citizen-Driven Public Sector, OECD Digital Government Studies, Éditions OCDE, Paris, https://doi.org/10.1787/ 9789264291867-en ; OCDE (2016a), Open Government Data Review of Mexico: Data Reuse for Public Sector Impact and Innovation, OECD Digital Government Studies, Éditions OCDE, Paris, http://dx.doi.org/10.1787/9789264259270-en.

La conservation des données

Le maintien dans le temps de l’accès aux anciennes versions des ensembles de données est un élément important pour permettre l’analyse des séries chronologiques et/ou des tendances. En fait, la conservation d’anciennes données aussi longtemps qu’elles sont utiles est très avantageuse pour les utilisateurs de données ouvertes. Le fait d’analyser et de réutiliser les mêmes données au fil du temps peut, par exemple, permettre de prévoir les capacités.

Il est important pour les pays de préserver l’accès à d’anciennes versions des ensembles de données aussi longtemps qu’elles présentent de l’intérêt pour les utilisateurs, car cela montre les avantages de l’ouverture des données publiques et favorise la réutilisation de ces données au fil du temps.

Les résultats de la troisième version de l’enquête de l’OCDE sur l’ouverture des données publiques indiquent que 40 % des pays ont mis en place des exigences formelles pour obliger l’ensemble des ministères/organismes publics centraux/fédéraux à maintenir systématiquement l’accès aux anciennes versions des ensembles de données aussi longtemps qu’elles présentent de l’intérêt pour les utilisateurs (voir le Graphique 3.5).

Graphique 3.5. Obligation de maintenir l’accès aux anciennes versions des ensembles de données dans les pays membres et partenaires de l’OCDE
Graphique 3.5. Obligation de maintenir l’accès aux anciennes versions des ensembles de données dans les pays membres et partenaires de l’OCDE

Source : Indications fournies par 32 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 15 : « Existe-t-il des exigences imposant aux ministères/organismes publics centraux/fédéraux de maintenir systématiquement l’accès aux anciennes versions des ensembles de données aussi longtemps qu’elles présentent de l’intérêt pour les utilisateurs ? ».

En Corée, par exemple, les données sont enregistrées par séries chronologiques et sont donc systématiquement conservées, hormis dans des circonstances particulières. Cela signifie que les utilisateurs ont accès à toutes les anciennes versions d’un ensemble de données, qui sont généralement conservées sur le portail des données publiques ouvertes. Dans le cas particulier où un ancien ensemble de données doit être retiré, l’organisation du secteur public qui est concernée doit obtenir préalablement l’autorisation officielle du Conseil en stratégie sur les données ouvertes. Tant que cet organe n’a pas pris sa décision, les données doivent être conservées sur le portail. S’il décide que les données doivent être retirées, l’organisation dépositaire doit les laisser accessibles pendant encore trois mois avant de les enlever.18

La situation est la même en Autriche, où – conformément au principe de durabilité (inscrit dans le cadre régissant les plateformes des données publiques ouvertes) –, lors de la mise à jour des données, la précédente version reste disponible en ligne pendant au moins trois mois. Les organisations publiques dépositaires signalent les changements apportés aux ensembles de données dans les métadonnées et les annoncent par les circuits de communication officiels.19

Au Royaume-Uni, seules les anciennes versions des données publiques considérées comme présentant une valeur historique doivent être conservées, autrement dit les versions susceptibles de promouvoir l’ouverture et la responsabilisation ainsi que de faciliter les travaux de recherche futurs.20 La loi sur les archives publiques établit que tous les ministères et organismes du gouvernement central doivent sélectionner les ensembles de données dont les anciennes versions devront rester accessibles jusqu’à ce que les données de base soient transférées aux Archives nationales ou dans tout autre lieu de conservation prédéterminé.21

Dans certains pays où les ministères et organismes publics ne sont pas tenus par des exigences formelles de maintenir l’accès aux anciennes versions des ensembles de données, les pratiques varient selon les organisations concernées. En Pologne, par exemple, la disponibilité de certaines anciennes versions sur le portail des données publiques ouvertes est laissée à la discrétion du dépositaire des données.22

En Irlande, seules quelques organisations du secteur public (comme le Bureau central des statistiques – Central Statistics Office – ou des organismes locaux) conservent actuellement d’anciennes versions de leurs ensembles de données. Toutefois, la stratégie relative à l’ouverture des données pour 2017-2022 (Open Data Strategy 2017-2022) prévoit qu’à l’issue de cette période, toutes les organisations du secteur public devront avoir adopté une approche durable de la gestion des données qui tienne également compte des questions d’archivage.23 Dans le cadre de cette approche, la participation d’acteurs comme les professionnels de l’information et les bibliothécaires devra être envisagée afin de tirer profit de leur expertise en matière de gestion des données et d’archivage, dans le but de mettre en place des administrateurs de données à toutes les étapes du cycle de gestion des données de recherche (Irish Department of Public Expenditure and Reform, 2017).

La ventilation et la granularité des données

La ventilation permet d’affiner le niveau de détail des ensembles de données et, par là-même, d’en tirer un plus large éventail d’informations, d’où la possibilité d’avoir une meilleure vue d’ensemble, de proposer des actions publiques ciblées et d’élargir le champ des réutilisations possibles.

En Belgique, des obligations légales imposent à l’ensemble des organismes fédéraux de fournir, dans la mesure du possible, des données ventilées par sexe. Les organisations du secteur public fédérales sont tenues d’assurer cette ventilation par sexe dans les activités de collecte et de traitement des données chaque fois qu’elles l’estiment pertinente. Cette obligation légale est, selon la Belgique, la première étape de la mise en évidence d’éventuelles disparités entre les hommes et les femmes.24

En Israël également, le Bureau des statistiques est soumis à l’obligation de fournir, chaque fois que c’est possible, des données ventilées par sexe. L’arrêté concerné impose en outre à ce Bureau de nommer une personne chargée de s’assurer que les données collectées et traitées par l’ensemble des organisations du secteur public sont ventilées par sexe.25

Ces dispositions sont le résultat et la traduction de la reconnaissance croissante, dans les milieux technologiques, du manque d’intégration des femmes dans ces secteurs. La ventilation par sexe est indispensable pour promouvoir, par exemple, la création d’applications mobiles visant à analyser les lacunes en matière d’intégration des questions de genre dans les différents domaines d’action des pouvoirs publics, et à encourager la réalisation d’analyses sur la problématique hommes-femmes. À cet égard, la ventilation par sexe des données publiques ouvertes est un point extrêmement positif pour aborder les questions d’égalité hommes-femmes, en collaboration avec l’écosystème des données ouvertes (voir l’Encadré 3.8).

Encadré 3.8. Les données publiques ouvertes et la problématique hommes-femmes

Un consensus croissant se dégage concernant le rôle important qui peut être joué par la technologie et les données au regard de la promotion de l’égalité et de la parité hommes-femmes, ainsi que de l’affectation des responsabilités en ce qui concerne la réalisation de ces objectifs. L’ouverture des données permet de mieux évaluer et traiter les impacts différenciés des politiques relatives à la santé, l’éducation, la sécurité ou l’économie sur les individus provenant de milieux différents.

Dans l’optique du renforcement des liens entre les initiatives d’ouverture des données et les objectifs en matière d’égalité hommes-femmes, la Recommandation de l’OCDE sur l’égalité hommes-femmes dans la vie publique (OCDE, 2016b) exhorte l’administration à recueillir, publier et diffuser largement les données publiques pertinentes – à tous les niveaux de l’administration – en les ventilant par sexe. Il est de plus en plus reconnu que ces données doivent prendre en compte, outre le sexe, d’autres facteurs identitaires comme l’âge, le handicap, l’orientation sexuelle et l’appartenance ethnique. La recommandation de l’OCDE ainsi que la panoplie d’instruments pour l’intégration systématique et la concrétisation de l’égalité hommes-femmes qui l’accompagne (OCDE, 2018b) encouragent en outre les consultations avec des acteurs non gouvernementaux dans le but de repérer d’éventuels problèmes ou disparités entre les hommes et les femmes et de recueillir des données complémentaires à ce sujet.

S’agissant de l’utilisation des données ouvertes pour mettre en évidence les problèmes touchant spécifiquement les femmes ainsi que les minorités, des exemples récents montrent que dans certains pays, les choses progressent :

  • Au Royaume-Uni, le gouvernement a demandé à un certain nombre d’organisations publiques et privées de publier les écarts de rémunérations entre hommes et femmes afin de permettre aux employeurs d’évaluer les inégalités qui ont cours dans leurs organisations respectives et de prendre les mesures qui s’imposent. Le gouvernement compte également, grâce à la diffusion de ces données, prendre des mesures pour améliorer l’égalité hommes-femmes via la fourniture des services publics. En avril 2018, plus de 9 000 employeurs (représentant plus de la moitié de la main-d’œuvre du Royaume-Uni) avaient publié des données sur les écarts de rémunérations entre hommes et femmes. Cela incluait les salaires et les primes versés au cours d’une année donnée.

  • En Sierra Leone, selon les informations du Partenariat pour un gouvernement ouvert, le gouvernement prévoit de publier des données publiques ouvertes sur les violences sexuelles et sexistes afin de rendre compte de ses efforts pour lutter contre ces violences. Des initiatives similaires ont été lancées au Brésil, où le gouvernement s’est engagé à publier en tant que données ouvertes des données publiques sur les homicides dont sont victimes les femmes.

Parallèlement à l’OCDE, d’autres organisations internationales mettent l’accent sur le rôle des femmes dans la technologie et les retombées bénéfiques que cela peut avoir :

  • Le Partenariat pour un gouvernement ouvert s’emploie à inclure les questions d’égalité entre les sexes dans les engagements au titre de l’ouverture de l’administration. En fait, la diffusion de données publiques ayant trait à ces questions est l’une des recommandations de cette organisation visant à accroître la responsabilité des administrations en matière d’égalité hommes-femmes.

  • La World Wide Web Foundation a fait savoir que les questions d’égalité entre les sexes devront être incluses dans la méthodologie future du Baromètre des données ouvertes, compte tenu du rôle important que jouent les données ouvertes à l’égard de la problématique hommes-femmes.

L’initiative Open Heroines est une communauté internet regroupant plus de 350 femmes du monde entier qui travaillent dans les domaines de l’administration ouverte, des données ouvertes et de la « civic tech ». Cette communauté, créée en 2015 lors du sommet du Partenariat pour un gouvernement ouvert au Mexique, était à l’origine un espace informel permettant aux femmes de se soutenir les unes les autres. Aujourd’hui, il s’agit d’un espace virtuel sécurisé (grâce au logiciel Slack) où les femmes peuvent faire connaissance avec d’autres femmes possédant les mêmes valeurs, partager leurs expériences et organiser des événements pour faire entendre leurs voix et faire connaître leur travail. Open Heroines est aussi un blog en ligne (https://openheroines.org/) permettant aux femmes de poster des articles.

Source : L’auteur, d’après des informations de l’OCDE (2018b), « OECD Toolkit for Mainstreaming and Implementing Gender Equality », OCDE, Paris, www.oecd.org/gender/governance/toolkit/toolkit-for-mainstreaming-and-implementing-gender-equality.pdf ; OCDE (2016b), Recommandation de 2015 du Conseil de l’OCDE sur l’égalité hommes-femmes dans la vie publique, Éditions OCDE, Paris, http://dx.doi.org/10.1787/9789264252875-fr ; OCDE (2017b), « OECD Open Government Data Survey 3.0 », non publié ; Partenariat pour un gouvernement ouvert (2018), « Gender », page web, www.opengovpartnership.org/theme/gender (consulté le 10 juillet 2018) ; World Wide Web Foundation (2017), « The case for gender and the Open Data Barometer », https://webfoundation.org/2017/09/the-case-for-gender-and-the-open-data-barometer/ (consulté le 10 juillet 2018). D’autres contributions proviennent d’Open Heroines et de l’Unité Politique des Genres et Justice de la Division des examens de la gouvernance et des partenariats (Direction de la gouvernance publique de l’OCDE).

Les pouvoirs publics pourraient également envisager des niveaux de ventilation plus poussés (par exemple le sexe et l’appartenance ethnique) afin de permettre une analyse plus fine et une meilleure compréhension des questions de fond en collaboration avec les acteurs non gouvernementaux, par exemple au moyen du portail des données publiques ouvertes.

Il existe généralement une grande disparité entre les pays membres de l’OCDE et ses pays partenaires en ce qui concerne l’existence d’exigences formelles concernant la publication des données ouvertes sous forme ventilée. En fait, 18 pays membres et partenaires sur 32 (soit 56 %) indiquent appliquer de telles exigences à l’ensemble des organisations du secteur public ; les 14 autres n’ont mis en œuvre aucune exigence de ce type (voir le Graphique 3.6).

Pourtant, la ventilation des données sera primordiale si les pouvoirs publics veulent mettre à profit les données publiques ouvertes pour détecter les problèmes spécifiques touchant des groupes particuliers, et ainsi élaborer des politiques plus adaptées – autrement dit s’ils veulent utiliser ces données pour repérer et cibler de manière plus appropriée et plus efficiente les problèmes touchant plus particulièrement certains groupes de population. Dans cette optique, toutes les organisations du secteur public devraient être soumises à l’obligation, le cas échéant, de publier systématiquement leurs données sous forme ventilée. Les pouvoirs publics pourraient également, si nécessaire, imposer une ventilation selon certains critères (par exemple par sexe, race ou âge) afin d’encourager un niveau accru d’analyse des données publiques diffusées en tant que données ouvertes et de permettre une compréhension plus fine des problèmes de fond et des tendances sociétales.

Ces mesures peuvent être très utiles en aidant les pouvoirs publics à mieux comprendre à quel point il est important de mettre en place des exigences techniques pour la collecte et le traitement des données publiques afin de favoriser des niveaux accrus d’analyse, de compréhension et de réutilisation ultérieure de ces données, dans le but de repérer et résoudre les problèmes de fond et sociétaux.

Graphique 3.6. Obligation de publier les données sous forme ventilée dans les pays membres et partenaires de l’OCDE
Graphique 3.6. Obligation de publier les données sous forme ventilée dans les pays membres et partenaires de l’OCDE

Source : Indications fournies par 32 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 5 : « Existe-t-il au niveau central/fédéral des exigences formelles imposant, le cas échéant, de publier les données sous forme ventilée ? ».

Références

Commission européenne (2016), Règlement (UE) 2016/679 du Parlement européen et du Conseil du 27 avril 2016 relatif à la protection des personnes physiques à l’égard du traitement des données à caractère personnel et à la libre circulation de ces données, et abrogeant la directive 95/46/CE (Règlement général sur la protection des données), https://eur-lex.europa.eu/ legalcontent/EN/ALL/?uri=CELEX:32016R0679.

Commission européenne (2014), « La qualité des données et métadonnées ouvertes », Module de formation 2.2, Open Data Support, https://www.europeandataportal.eu/sites/default/files/d2.1.2_training_module_2.2_open_data_quality_fr_edp.pdf (consulté le 2 juillet 2018).

Irish Department of Public Expenditure and Reform (2017), « Open Data Strategy », www.per.gov.ie/wp-content/uploads/Draft-Open-Data-Strategy-2017-2022.pdf.

Le Big Data (2018), « Data Catalog définition : tout savoir sur les catalogues de données », www.lebigdata.fr/data-catalog (consulté le 10 juillet 2018).

Melissa (sans date), « 6 Key Data Quality Dimensions », page web, www.melissadata.com/enews/articles/1007/2.htm (consulté le 2 juillet 2018).

Microsoft Azure (2018), « Data Catalog Documentation », https://docs.microsoft.com/en-us/azure/data-catalog/ (consulté le 10 juillet 2018).

OCDE (2018a), Digital Government Review of Colombia: Towards a Citizen-Driven Public Sector, OECD Digital Government Studies, Éditions OCDE, Paris, https://doi.org/10.1787/9789264291867-en.

OCDE (2018b), « OECD Toolkit for Mainstreaming and Implementing Gender Equality », OECD, Paris, www.oecd.org/gender/governance/toolkit/toolkit-for-mainstreaming-and-implementing-gender-equality.pdf.

OCDE (2017a), Digital Government Review of Norway: Boosting the Digital Transformation of the Public Sector, OECD Digital Government Studies, Éditions OCDE, Paris, https://doi.org/10.1787/9789264279742-en.

OCDE (2017b), « OECD Open Government Data Survey 3.0 », non publié.

OCDE (2016a), Open Government Data Review of Mexico: Data Reuse for Public Sector Impact and Innovation, OECD Digital Government Studies, Éditions OCDE, Paris, http://dx.doi.org/10.1787/9789264259270-en.

OCDE (2016b), Recommandation de 2015 du Conseil de l’OCDE sur l’égalité hommes-femmes dans la vie publique,, Éditions OCDE, Paris, https://doi.org/10.1787/9789264252875-fr.

OCDE (2015), OECD Public Governance Reviews: Estonia and Finland: Fostering Strategic Capacity across Governments and Digital Services across Borders, Examens de l’OCDE sur la gouvernance publique, Éditions OCDE, Paris, https://doi.org/10.1787/ 9789264229334-en.

Partenariat pour un gouvernement ouvert (2018), « Gender », page web, www.opengovpartnership.org/theme/gender (consulté le 10 juillet 2018).

Schwab, K. (2015), « The Fourth Industrial Revolution. What it Means and How to Respond », Foreign Affairs, 12 décembre, www.foreignaffairs.com/articles/2015-12-12/fourth-industrial-revolution.

Ubaldi, B. (2013), « Open government data: Towards empirical analysis of open government data initiatives », Documents de travail de l’OCDE sur la gouvernance publique, n° 22, Éditions OCDE, Paris, http://dx.doi.org/10.1787/5k46bj4f03s7-en.

UK Department for Digital, Culture, Media and Sport (2018), « Data Ethics Framework », Londres, www.gov.uk/government/publications/data-ethics-framework.

Underwood, J. (2017), « Why you need a data catalog and how to select one », www.jenunderwood.com/2017/08/30/need-data-catalog-select-one/ (consulté le 10 juillet 2018).

World Wide Web Foundation (2017), « The case for gender and the Open Data Barometer », https://webfoundation.org/2017/09/the-case-for-gender-and-the-open-data-barometer/ (consulté le 10 juillet 2018).

Annexe 3.A. Tableaux
Tableau d’annexe 3.A.1. Obligation de mettre à disposition les données publiques avec une licence ouverte dans les pays membres et partenaires de l’OCDE

Exigences formelles imposant aux ministères/ organismes compétents de mettre à disposition les données publiques avec une licence ouverte

Opérations autorisées sur les données publiques accompagnées d’une licence ouverte

Téléchargement

Copie

Utilisation

Distribution

Allemagne

Australie

Autriche

Belgique

Canada

Chili

Corée

Danemark

Espagne

Estonie

États-Unis

Finlande

France

Grèce

Irlande

Israël

Italie

Japon

Lettonie

Mexique

Norvège

Nouvelle-Zélande

Pays-Bas

Pologne

-

-

-

-

Portugal

-

-

-

-

République slovaque

République tchèque

Royaume-Uni

Slovénie

Suède

-

-

-

-

Suisse

Turquie

-

-

-

-

Exigences formelles imposant aux ministères/ organismes compétents de mettre à disposition les données publiques avec une licence ouverte

Opérations autorisées sur les données publiques accompagnées d’une licence ouverte

Téléchargement

Copie

Utilisation

Distribution

Total OCDE

Oui, des exigences globales s’appliquent à tous les ministères/organismes ●

22

Oui, des exigences ont été adoptées par certains ministères/organismes ■

6

Oui ♦

Non ○

4

Toutes les données (100 %) ▲

21

21

20

20

La plupart des données (50-99 %) ◊

6

6

7

7

Une partie des données (1-49 %) □

1

1

1

1

Aucune donnée (0 %) Х

0

0

0

0

Colombie

Lituanie

Х

Pérou

Source : Indications fournies par 32 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, questions 31 et 33. Ces questions étaient les suivantes : « Existe-t-il au niveau de l’administration centrale/fédérale des exigences formelles imposant aux ministères/organismes compétents de mettre à disposition les données publiques : - Gratuitement - Accompagnées d’une licence ouverte ? » et « Les exigences imposant de mettre à disposition les données publiques avec une licence ouverte permettent-elles aux utilisateurs d’effectuer les opérations suivantes avec les données : - Téléchargement - Copie - Utilisation - Distribution ? ».

Tableau d’annexe 3.A.2. Obligation de fournir les données publiques gratuitement dans les pays membres et partenaires de l’OCDE

Exigences formelles imposant aux ministères/ organismes compétents de fournir les données publiques gratuitement

Opérations autorisées sur les données publiques fournies gratuitement

Téléchargement

Copie

Utilisation

Distribution

Allemagne

Australie

Autriche

Belgique

Canada

Chili

Corée

Danemark

-

-

-

-

Espagne

Estonie

États-Unis

Finlande

France

Grèce

Irlande

Israël

Italie

Japon

Lettonie

Mexique

Norvège

Nouvelle-Zélande

Pays-Bas

Pologne

République slovaque

République tchèque

Royaume-Uni

Slovénie

Suède

Suisse

Turquie

Total OCDE

Oui, des exigences globales s’appliquent à tous les ministères/organismes ●

25

Oui, des exigences ont été adoptées par certains ministères/organismes ■

6

Oui ♦

Non ○

1

Toutes les données (100 %) ▲

19

19

17

17

La plupart des données (50-99 %) ◊

10

10

11

11

Une partie des données (1-49 %) □

2

2

3

3

Aucune donnée (0 %) Х

0

0

0

0

Exigences formelles imposant aux ministères/ organismes compétents de fournir les données publiques gratuitement

Opérations autorisées sur les données publiques fournies gratuitement

Téléchargement

Copie

Utilisation

Distribution

Colombie

Lituanie

Х

Pérou

Source : Indications fournies par 32 pays membres et 3 pays partenaires de l’OCDE ou autres (Colombie, Lituanie et Pérou) en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, questions 31 et 32. Ces questions étaient les suivantes : « Existe-t-il au niveau de l’administration centrale/fédérale des exigences formelles imposant aux ministères/organismes compétents de mettre à disposition les données publiques : - Gratuitement - Accompagnées d’une licence ouverte ? » et « Les exigences imposant de fournir les données publiques gratuitement permettent-elles aux utilisateurs d’effectuer les opérations suivantes avec les données : - Téléchargement - Copie - Utilisation - Distribution ? ».

Notes

← 1. Voir, par exemple : https://fr.weforum.org/agenda/2017/10/la-quatrieme-revolution-industrielle-ce-qu-elle-implique-et-comment-y-faire-face/.

← 2. Indications fournies par les pays membres et partenaires de l’OCDE en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, questions 36 et 36a.

← 3. Pour en savoir plus, voir http://guidance.data.gov.uk/.

← 4. Pour en savoir plus, voir www.dof.gob.mx/nota_detalle.php?codigo=5397117& fecha=18/06/2015.

← 5. Complément d’information fourni par le Mexique en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 37. Pour en savoir plus, voir www.dof.gob.mx/nota_detalle.php?codigo=5397117&fecha=18/06/2015.

← 6. Pour en savoir plus, voir www.dati.gov.it/content/linee-guida-nazionali-valorizzazione-patrimonio-informativo-pubblico.

← 7. Pour en savoir plus, voir www.agid.gov.it/sites/default/files/documentazione_ trasparenza/cdc-spc-gdl6-interoperabilitasemopendata_v2.0_0.pdf.

← 8. Complément d’information fourni par l’Espagne en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 37. www.boe.es/boe/dias/2013/03/04/pdfs/BOE-A-2013-2380.pdf.

← 9. Indications par la Slovénie à l’OCDE le 12 août 2018.

← 10. Pour en savoir plus, voir https://ouvert.canada.ca/fr/licence-du-gouvernement-ouvert-canada.

← 11. Pour en savoir plus, voir www.data.gouv.fr/fr/licences.

← 12. Pour en savoir plus, voir https://datos.gob.mx/libreusomx.

← 13. Pour en savoir plus, voir www.nationalarchives.gov.uk/doc/open-government-licence/ version/3/.

← 14. Indications fournies par les pays membres et partenaires de l’OCDE en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 2, question 59a.

← 15. Informations recueillies lors des missions de l’OCDE à Stockholm en novembre 2017 et mars 2018 dans le cadre de l’examen sur l’administration numérique de la Suède.

← 16. Indications fournies par l’Espagne en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 2, question 59a.

← 17. Indications fournies par l’Autriche en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 2, question 59a.

← 18. Indications fournies par la Corée en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 15.

← 19. Complément d’information fourni par l’Autriche en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 15. Pour en savoir plus, voir www.data.gv.at/wp-content/uploads/2013/08/Framework__for_Open_Government_ Data_Platforms_1.1.pdf.

← 20. Pour en savoir plus, voir www.nationalarchives.gov.uk/documents/records-collection-policy-2012.pdf.

← 21. Complément d’information fourni par le Royaume-Uni en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 15. Pour en savoir plus, voir www.nationalarchives.gov.uk/information-management/manage-information/selection-and-transfer/selecting-records/.

← 22. Complément d’information fourni par la Pologne en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 15.

← 23. Complément d’information fourni par l’Irlande en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 15. Pour en savoir plus, voir www.per.gov.ie/wp-content/uploads/Draft-Open-Data-Strategy-2017-2022.pdf.

← 24. Complément d’information fourni par la Belgique en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 5. Pour en savoir plus, voir http://igvm-iefh.belgium.be/fr/activites/gender_mainstreaming/application/statistiques_ et_indicateurs.

← 25. Complément d’information fourni par Israël en réponse à l’enquête de l’OCDE sur les données publiques ouvertes 3.0 (2017), section 1, question 5. Pour en savoir plus, voir www.cbs.gov.il/www/statistics_ordinance_e.pdf.

End of the section – Back to iLibrary publication page