Les ensembles de données de forte valeur (EDFV) sont des jeux de données détenus par les administrations publiques et jugés particulièrement importants en raison des avantages sociétaux et économiques qu'ils procurent. Le libre accès à ces ensembles peut favoriser la mise au point de solutions innovantes par les entreprises, la société civile et le secteur public, les systèmes d'IA notamment, ainsi que l'utilisation plus rationnelle des ressources publiques. Il contribue également à l'instauration d'un écosystème d'information ouvert et inclusif, permettant l'accès à des données et à des faits fiables pour éclairer des sujets essentiels tels que le changement climatique, les soins de santé et l'éducation. Les EDFV analysés ici correspondent à 82 ensembles de données répartis en 10 catégories définies par l'OCDE pour permettre une comparaison internationale pertinente de la mise en œuvre de l'ouverture des données. Cette liste non exhaustive est basée sur la Charte originale du G8 pour l'ouverture des données publiques et s'appuie sur des documents internationaux récents, comme la Directive de l'UE sur les données ouvertes.
Actuellement, 47 % des EDFV sont en libre accès dans les pays de l'OCDE. Sur les dix catégories évaluées, les EDFV les plus couramment fournis relèvent de la catégorie des données géospatiales et statistiques (67 %), suivie par celles relatives à l'observation de la Terre et l’environnement et de celles concernant la mobilité (56 % chacune). En revanche, les jeux de données sont moins accessibles dans le domaine de la météorologie (46 %), la santé et la protection sociale (42 %), la criminalité et la justice (39 %) et l’éducation (37 %). Les catégories les moins susceptibles d'être en libre accès sont "entreprises et structure d'actionnariat » (31 %) et « finances publiques et redevabilité de l’administration » (27 %). Elles comprennent notamment les ensembles de données relatifs aux registres des sociétés, à la propriété effective, aux résultats des élections et aux marchés publics. S'agissant de l'accessibilité, la plupart des EDFV en accès libre sont proposés dans des formats ouverts (88 %) et sont à jour (79 %). Par ailleurs, 66 % d'entre eux sont accessibles via des portails centraux de données publiques ouvertes. Toutefois, moins de la moitié sont accompagnés de métadonnées de haute qualité ou fournis par le biais d'interfaces de programmation d'applications (API) standard (Graphique 7.10).
Seuls 6 des 36 pays de l'OCDE (17 %) ont mis à disposition 70 % au moins de leurs EDFV : la France (82 %), la Corée (81 %), la Finlande (76 %), le Danemark (74 %), l'Espagne (72 %) et la Colombie (70 %). La plupart des pays de l'OCDE sondés (20 sur 36, soit 56 %) offrent un accès à moins de la moitié des leurs EDFV, et 7 sur 36 (19 %) à moins de 30 % d’entre eux. Des variations notables sont toutefois observées dans les pays selon la catégorie de données. La Finlande, par exemple, donne accès à 100 % de ses EDFV sur l'éducation et la mobilité, mais à 31 % seulement de ceux concernant les finances publiques et la redevabilité de l’administration, un pourcentage à peine supérieur à la moyenne de l'OCDE. Ces divergences soulignent des opportunités de réformes ciblées pour remédier aux faiblesses tout en capitalisant sur les atouts existants (Graphique 7.11).
Les pays de l'OCDE obtiennent généralement de meilleurs résultats en matière d'accessibilité. Dans 22 des 36 pays sondés (61 %), plus de la moitié des EDFV en accès libre respectent les cinq critères d'accessibilité évalués. Les pays les plus performants sont les Pays-Bas (77 % d’EDFV ouverts), le Canada (73 %) et la Norvège (73 %). Les plus fortes variations entre les différentes catégories de données sont observées au Costa Rica, au Chili et au Mexique. Ainsi, alors que le Mexique permet d'accéder librement à près de 80 % des EDFV par le biais d'un portail central, moins de 15 % d'entre eux sont assortis de métadonnées de qualité ou sont accessibles par l'intermédiaire d'interfaces de programmation (API). Ces résultats montrent que des efforts soutenus s'imposent pour améliorer l'accessibilité dans toutes les catégories (Graphique 7.12).