Gouverner avec l’intelligence artificielle

État des lieux et perspectives pour les fonctions essentielles de l’État

Rapport

18 septembre 2025

Disponible en:

English
français
español

Télécharger le PDF

L’IA dans l’évaluation des politiques publiques

Copier le lien de L’IA dans l’évaluation des politiques publiques

L’évaluation des politiques publiques fournit des données probantes essentielles pour aider les responsables de l’action publique à comprendre ce qui fonctionne, pour qui et dans quelles circonstances (OCDE, 2025[107] ; 2020[108]). L’IA peut jouer un rôle important à cet égard. L’augmentation exponentielle du volume de données produites à l’échelle mondiale, conjuguée au développement rapide de nouvelles technologies qui réduisent les coûts de stockage et de calcul, stimule l’innovation au service de techniques permettant d’extraire, d’analyser et de visualiser en temps réel les données stockées dans ces vastes référentiels pour enrichir les évaluations (Petersson et al., 2017[109]) (Rinaldi, Giuffrida et Negrete, 2017[110]). Cela peut avoir d’importantes conséquences pour la façon dont les évaluations sont menées et ce sur quoi elles portent.

L’IA a le potentiel d’accélérer et d’automatiser des tâches essentielles telles que la collecte et l’analyse de données, et d’aider les évaluateurs à mener à bien différentes tâches de gestion en leur permettant d’accéder à un large éventail de données internes et externes ou en synthétisant des résultats. Elle peut également faciliter les évaluations ex ante en fournissant des systèmes prédictifs et des simulations pour aider les responsables de l’action publique à anticiper les effets potentiels des mesures avant leur mise en œuvre (Bénassy-Quéré, 2022[111]). Toutefois, son utilisation à des fins d’évaluation au sein des administrations reste limitée et a progressé plus lentement que pour d’autres fonctions examinées dans ce chapitre.

État des lieux

Appui à la conception et à la mise en œuvre des évaluations

L’IA peut aider les évaluateurs des politiques publiques à traiter un grand volume de contenus pouvant être utiles à la conception et à la mise en œuvre des évaluations, qu’elles soient ex ante ou ex post. Elle peut ainsi venir à l’appui d’approches plus sophistiquées et structurées reposant par exemple sur la synthèse de données existantes, ou de fonctions plus élémentaires comme la production de résumés clairs de précédentes évaluations.

La synthèse de données probantes est particulièrement utile pour éclairer l’élaboration d’évaluations ex ante ou ex post. Elle consiste généralement à combiner les résultats de différentes études portant sur un même sujet de sorte à obtenir une vision plus globale. Dans le domaine de la synthèse de données probantes, l’exploration de texte et d’autres types d’outils d’IA sont utilisés depuis plus de 10 ans pour la recherche documentaire, le criblage de texte intégral, l’extraction de données et l’analyse. Les chercheurs du domaine ont cartographié une variété d’outils qui peuvent faciliter les différentes étapes de la synthèse de données probantes, en particulier pour les revues systématiques, et les rendre plus efficaces. On peut citer par exemple Rayyan pour le criblage de titres et de résumés, et Robot Reviewer pour l’évaluation de certains risques (Khalil, Ameen et Zarnegar, 2022[112]). Des orientations et des recommandations ont été élaborées pour garantir une utilisation responsable de l’IA dans le cadre de la synthèse de données probantes (« Responsible AI in Evidence Synthesis », RAISE), ce qui témoigne de l’intérêt croissant pour le recours à ces outils dans le domaine (Thomas et al., 2024[113]). Les avantages que présente l’utilisation de l’IA pour la synthèse de données probantes sont liés à la capacité des systèmes à accéder à un grand nombre de publications et à traiter les informations plus rapidement que les autres outils. En effet, le temps nécessaire pour synthétiser des données probantes est en moyenne de 15 mois, mais l’utilisation de l’IA peut fortement accélérer certaines étapes (Blaizot et al., 2022[114]). Par exemple, une évaluation du risque de biais dans l’analyse des données issues de 30 articles de type essai contrôlé randomisé peut être réalisée avec précision à l’aide d’un grand modèle de langage (GML) en 53 secondes en moyenne. Cette tâche prendrait infiniment plus de temps si elle était réalisée par un être humain : une étude récente a conclu qu’il faudrait environ 28 minutes pour chacune des études de la revue systématique en utilisant RoB 2, un outil conçu pour les essais randomisés désormais considéré comme étant la référence (Minozzi et al., 2020[115] ; Lai et al., 2024[116] ; Odell, 2024[117]). De même, grâce à l’exploration de texte et à l’IA, les évaluateurs de la Banque mondiale ont pu doubler la taille de la base de données probantes qu’ils utilisent pour prendre certaines décisions relatives aux programmes. Ils n’auraient probablement pas pu parvenir à ce résultat avec des méthodes traditionnelles de définition des portefeuilles, et cette approche a permis de préparer le terrain pour les évaluations de la pertinence et de l’efficacité qu’ils ont menées dans le cadre de l’analyse du portefeuille (Bohni Nielsen, Mazzeo Rinaldi et Petersson, 2024[118]).

Appui aux travaux d’analyse

L’IA peut faciliter le traitement de grands volumes de données et de textes longs, comme des rapports de documentation et des entretiens, en vue d’identifier des schémas, ce qui peut être particulièrement utile pour les évaluations. Grâce à l’exploration de texte fondée sur le traitement automatique du langage naturel, l’IA peut aider les évaluateurs à comprendre les conclusions et à produire des évaluations approfondies qui, autrement, leur demanderaient beaucoup de temps (Næss et al., 2025[119]).

Les applications de l’analyse quantitative de texte à l’appui de l’évaluation des programmes sont prometteuses, l’IA permettant d’analyser un grand nombre de documents plus rapidement que les outils classiques d’analyse de texte (Gatto et Bundi, 2025[120]). Par exemple, l’analyse des réponses à des questions ouvertes nécessaire pour reconstruire une théorie du programme pourrait reposer sur différentes méthodes chronophages, comme l’identification d’énoncés avec une structure syntaxique particulière et leur reformulation en propositions conditionnelles de type « si – alors » (Leeuw, 2003[121]), ce qui peut être facilité par des techniques novatrices telles que les modèles thématiques (Gatto et Bundi, 2025[120]). Si les méthodes classiques d’analyse de texte peuvent soutenir l’évaluation de plusieurs manières empiriques et conceptuelles, par exemple en mesurant les préférences des parties prenantes ou en identifiant les théories du programme sous-jacentes, l’analyse de texte quantitative fondée sur l’IA peut créer encore plus de possibilités. Par exemple, la Banque mondiale a eu recours à l’apprentissage automatique non supervisé pour analyser 392 rapports de projets dans 64 pays bénéficiant d’une aide au développement, ce qui a permis d’identifier de nouveaux facteurs pertinents ayant une incidence sur la réussite et l’échec des projets (Franzen et al., 2022[122]). En outre, l’analyse de texte fondée sur l’IA est particulièrement utile pour identifier des thèmes sous-jacents dans des programmes d’action ou rapports existants, en cela qu’elle cartographie les concepts clés intégrés dans la documentation pertinente, une technique connue sous le nom de modélisation thématique (Cintron et Montrosse-Moorhead, 2021[123]). Certaines de ces méthodes peuvent être employées pour comprendre les positions des différentes parties prenantes, ce qui apporte des perspectives utiles pour l’évaluation des politiques publiques. Dans certains pays, les acteurs pour lesquels c’est pertinent, comme les institutions supérieures de contrôle, adoptent des techniques d’analyse quantitative de texte pour réaliser des audits de performance dont plusieurs caractéristiques sont identiques à celles des évaluations des politiques publiques. Par exemple, la Norvège a eu recours à l’exploration de texte et à l’apprentissage automatique pour réaliser un audit de performance sur la gestion de la cybercriminalité par la police (Encadré 5.31). Dans le domaine des politiques de l’environnement, l’OCDE s’est associée à des instituts de recherche de premier plan pour réaliser, grâce à l’IA, la première évaluation exhaustive à l’échelle mondiale des mesures de politique environnementale, analysant plus de 1 500 interventions des pouvoirs publics dans quatre secteurs entre 1998 et 2022 dans 41 pays de six continents (Encadré 5.32).

Au-delà des techniques d’analyse de texte, l’IA a également le potentiel de renforcer l’inférence causale dans l’évaluation des politiques publiques : elle peut étayer des conceptions quasi expérimentales fondées sur des modèles probabilistes, en estimant certaines données manquantes nécessaires à l’application de méthodes statistiques avancées non paramétriques et à l’utilisation de variables instrumentales en vue de simuler différents scénarios d’impact. Cela peut aider à élargir les horizons de la recherche et à réaliser des évaluations beaucoup plus efficaces sans avoir besoin de recourir à des approches coûteuses fondées sur des essais contrôlés randomisés (Miller, 2020[124]).

Encadré 5.31. La Norvège recourt à l’exploration de texte et à l’apprentissage automatique pour mener des audits de la police

Copier le lien de Encadré 5.31. La Norvège recourt à l’exploration de texte et à l’apprentissage automatique pour mener des audits de la police

En 2018, le Bureau de l’Auditeur général de la Norvège a mis en place un Laboratoire d’innovation visant à intégrer la science des données dans les activités d’audit. Dans ce laboratoire, des experts en science des données spécialisés dans des domaines tels que l’évaluation/l’audit de performance, le codage et l’apprentissage automatique étaient chargés de fournir un appui aux auditeurs en automatisant certaines tâches, en les aidant à acquérir des données (extraction de données à partir de pages web, par exemple) et à les analyser (exploration de texte, par exemple), ainsi qu’en dispensant des formations internes au codage et aux outils d’analyse.

En 2021, le Bureau norvégien de l’Auditeur général a réalisé un audit de performance des efforts déployés par la police nationale pour lutter contre la cybercriminalité. L’objectif de cet audit était de déterminer si la police norvégienne avait gagné en efficacité à cet égard. Au cours de l’audit, la collaboration entre les experts en science des données et les auditeurs a été essentielle pour veiller à ce que les nouvelles méthodes soient employées judicieusement, tous ayant apporté des contributions dans leurs domaines de compétence respectifs. Les auditeurs se sont chargés de plusieurs tâches, telles que la conception des travaux de recherche, la collecte et l’analyse des données, et la rédaction ; quant à eux, les experts en science des données ont joué un rôle clé dans la mise en œuvre de méthodes avancées d’exploration de texte et d’apprentissage automatique pour classer les affaires pénales. Plus précisément, au cours de l’audit, 1 000 affaires codifiées ont été utilisées pour entraîner un système d’apprentissage automatique qui a employé des techniques d’exploration de texte en vue d’extraire le texte de 334 544 dossiers relevant de différents types de délits et crimes (par exemple, gains illicites/vols, trafics, violences, infractions financières). La tâche consistant à classifier les affaires pénales selon qu’elles relevaient ou non de la catégorie de la cybercriminalité s’est avérée cruciale pour évaluer la compréhension et la gestion de ces infractions par la police. Les données précédemment détenues par la police norvégienne n’étaient pas fiables et ne permettaient pas d’appréhender la portée des enquêtes et des règlements des affaires.

Source : (Næss et al., 2025[119]), https://www.adb.org/sites/default/files/publication/928976/governance-brief-052-digital-transformation-tax-administration-rok.pdf.

Encadré 5.32. L’évaluation de l’efficacité des politiques environnementales facilitée par l’IA

Copier le lien de Encadré 5.32. L’évaluation de l’efficacité des politiques environnementales facilitée par l’IA

Comprendre quelles mesures permettent réellement de réduire les émissions est un défi urgent pour les pouvoirs publics du monde entier. En partenariat avec le Potsdam Institute for Climate Impact Research (PIK), l’Université d’Oxford et l’Université de Victoria, l’OCDE a contribué à une étude utilisant l’IA pour évaluer l’efficacité des politiques environnementales dans 41 pays. Publiée dans Science, elle dresse le bilan de plus de 1 500 interventions des pouvoirs publics menées entre 1998 et 2022, et apporte des éclairages sans précédent sur les mesures efficaces de lutte contre le changement climatique.

L’étude se fondait sur le Cadre de mesure des actions et politiques climatiques (CMAPC) de l’OCDE. Reposant sur l’IA, elle a recensé 63 mesures ayant permis de réduire sensiblement les émissions. Cette approche reposant sur l’IA permet non seulement de mieux détecter les mesures efficaces, mais aussi de mettre en lumière des tendances et des panoplies de mesures qui, sinon, pourraient passer inaperçues. L’un des principaux constats est que les panoplies de mesures, et non les mesures isolées, sont les plus efficaces pour réduire les émissions, ce qui accroît l’importance de la conception stratégique de l’action publique.

Source : https://www.oecd.org/en/blogs/2025/01/what-works-groundbreaking-evaluation-on-the-effectiveness-of-climate-policies.html.

Appui à la gestion et à la communication

Les responsables d’évaluation peuvent mettre à profit divers outils fondés sur l’IA conçus pour faciliter les activités opérationnelles telles que les processus administratifs, la rédaction, la traduction et la recherche. En ce qui concerne la planification et la gestion, les évaluations gouvernementales sont souvent confiées à des évaluateurs externes, ce qui rend leur gestion plus complexe. Les fonctionnalités fondées sur l’IA des outils de gestion de projet, comme monday.com ou Asana, aident les évaluateurs à mieux gérer les ressources et les calendriers, par exemple en recommandant des stratégies optimales en termes d’effectifs et de planification à partir des évaluations précédentes, ou en vérifiant si l’allocation des ressources répond aux besoins prioritaires. Les deux plateformes recourent à l’IA pour fournir des éclairages et des fonctionnalités d’automatisation, comme l’automatisation des flux de travail, la planification prédictive des tâches ou les assistants fondés sur l’IA. Par ailleurs, l’IA générative peut faciliter la rédaction de cahiers des charges, ou d’autres tâches de gestion du même type (Jacob, 2025[125]).

Les outils utilisant des GML peuvent contribuer à améliorer la communication de résultats d’évaluations ; ils synthétisent rapidement des longs rapports, produisant des versions plus courtes qui peuvent être partagées avec les responsables de l’action publique ou avec le public. Par exemple, la Commission européenne a mis au point un outil fondé sur des GML qui peut produire des résumés et des notes de synthèse à partir de documents rédigés dans différentes langues (Encadré 5.33).

Enfin, les outils d’IA peuvent être utiles pour mettre au point des référentiels d’évaluation numériques et des outils de gestion des connaissances. Plusieurs pays de la zone OCDE ont établi des référentiels facilitant l’accès à l’ensemble des évaluations conduites, ou des plateformes permettant de décrire et d’harmoniser les activités d’évaluation menées à l’échelle de l’ensemble de l’administration. On peut citer l’exemple de la plateforme norvégienne Kudos1. Alors que la création manuelle de tels référentiels peut prendre du temps, les GML peuvent automatiser une grande partie du travail et permettent d’effectuer des recherches plus précises sur un grand volume de rapports. En France, l’Inspection générale des finances (IGF) utilise actuellement des GML pour développer un outil interne de génération augmentée par récupération (RAG) (Encadré 5.34) nommé Fragments, qui rassemble les rapports produits par l’IGF et la Cour des comptes depuis 2006 et permet d’effectuer des recherches précises dans tous ces documents.

Encadré 5.33. L’outil eSummary développé par la Commission européenne en soutien aux administrations publiques

Copier le lien de Encadré 5.33. L’outil eSummary développé par la Commission européenne en soutien aux administrations publiques

La Direction générale de la traduction de la Commission européenne a mis au point une série de services fondés sur l’IA visant à faciliter l’analyse des politiques, y compris l’évaluation des politiques publiques. Par exemple, l’outil eSummary parcourt le contenu d’un texte pour en produire une version abrégée. Il utilise des algorithmes d’IA pour déterminer quels sont les éléments les plus importants du document et en fournir une synthèse pertinente. eSummary est connecté à un outil de traduction fondé sur l’IA (eTranslation), ce qui lui permet de générer du texte dans toutes les langues de l’UE. Cet outil est accessible à divers acteurs de l’Union européenne, y compris les administrations publiques des États membres.

Source : https://language-tools.ec.europa.eu.

Encadré 5.34. La RAG appliquée aux GML

Copier le lien de Encadré 5.34. La RAG appliquée aux GML

La RAG est une technique mise au point pour améliorer la façon dont les GML, comme ceux utilisés par les agents conversationnels avancés et les assistants virtuels, traitent les informations. Pour différentes raisons, notamment lorsque les données utilisées sont obsolètes, il arrive que les GML fournissent des réponses incorrectes, et il n’est pas toujours aisé de comprendre comment une réponse spécifique a été générée. La RAG peut apporter des solutions à ces problèmes en permettant aux GML d’accéder à des sources de données supplémentaires en vue de tenir les informations à jour, cette technique étant particulièrement utile lorsqu’elle est appliquée à des secteurs ou domaines de connaissances spécialisés. Pour les acteurs publics, cela peut être un moyen efficace de sécuriser l’accès à leurs sources de données internes, tout en améliorant l’exactitude, la pertinence et la fiabilité des résultats produits par un modèle.

Avec cette technique, les documents pertinents sont identifiés, avant d’en extraire le texte essentiel. Ensuite, ce texte est décomposé en plus petites parties, qui sont transformées en un format que le modèle peut comprendre et stocker efficacement : les emboîtements. Ces informations sont conservées dans une base de données dédiée (base de données vectorielle). Lorsqu’une personne pose une question au modèle, il peut consulter cette base de données pour trouver des informations actualisées et exactes à ajouter à celles dont il dispose déjà avant de formuler une réponse.

Quand il est essentiel qu’un modèle fournisse des informations à jour et exactes, par exemple lors du traitement d’informations confidentielles ou quand un registre clair des sources de données doit être conservé, le manuel AI Playbook for the UK Government publié par le Royaume-Uni (Encadré 4.2) recommande d’utiliser la RAG. Cette approche peut contribuer à garantir que les réponses du modèle reposent sur des données fiables, ce qui la rend particulièrement utile pour les organisations qui s’attachent à maintenir des niveaux élevés d’exactitude et de redevabilité.

Source : (Ugale et Hall, 2024[89]).

Données probantes sur l’impact

L’utilisation de l’IA dans l’évaluation des politiques publiques n’en étant qu’à ses débuts, les effets de cette technologie sur ces pratiques restent limités et difficiles à mesurer. Une étude récente qui examinait les performances de 758 consultants du Boston Consulting Group (BCG) au regard d’un ensemble de 18 tâches de conseil complexes, réalistes et à forte intensité de connaissances (comme l’évaluation des politiques publiques) relevant des capacités connues de l’IA a conclu que, pour chacune de ces tâches, les consultants qui avaient eu recours à l’IA étaient nettement plus productifs. Par rapport au groupe témoin, ils ont accompli en moyenne 12 % de tâches en plus, les ont effectuées 25 % plus rapidement et ont produit des résultats d’une qualité supérieure de plus de 40 % (Dell’Acqua et al., 2023[126]). Toutefois, l’étude est parvenue à des conclusions différentes pour les tâches « au-delà des capacités actuelles de l’IA » : le groupe qui n’avait pas utilisé cette technologie a fait moins d’erreurs. D’autres études évaluant l’impact de l’IA sur la synthèse de données probantes ont conclu à des résultats prometteurs quant à l’utilisation de GML pour mener à bien certaines étapes des revues systématiques, par exemple les évaluations du risque de biais, le degré d’accord entre le jugement des humains et celui des systèmes d’IA allant de 41 % pour le jugement global à 71 % pour la mesure des résultats (Eisele et al., 2024[127]). Dans le même temps, l’étude souligne que le jugement de l’IA ne peut pour l’instant pas se substituer à l’évaluation humaine.

Gérer les risques et les défis

Si les recherches sur les risques et les défis liés à l’utilisation de l’IA dans l’évaluation des politiques publiques sont encore rares (Jacob, 2025[125]), elles ont permis, de même que les travaux de l’OCDE menés en collaboration avec les pouvoirs publics et l’analyse de cas d’utilisation individuels, d’identifier plusieurs risques associés et défis au niveau de la mise en œuvre de l’IA dans ce domaine.

Risques associés

Données insuffisantes ou biaisées dans les systèmes d’IA
Biais d’automatisation
Manque de transparence et d’explicabilité

L’utilisation de l’IA dans les processus d’évaluation peut aggraver certaines erreurs susceptibles d’apparaître à différents stades du processus de développement et d’utilisation du système d’IA. Le premier risque lié à l’utilisation de l’IA dans l’évaluation des politiques publiques découle de l’entraînement des algorithmes avec des données biaisées ou incomplètes. Cela peut produire des systèmes qui génèrent des prévisions erronées ou qui renforcent ou exacerbent des points de vue existants (Jacob, 2025[125]). Si ce risque ne concerne pas uniquement l’évaluation des politiques publiques, mais aussi potentiellement d’autres usages de l’IA dans le cadre de l’élaboration des politiques, il est particulièrement significatif dans ce domaine compte tenu de son incidence sur la poursuite ou l’arrêt d’interventions pouvant être bénéfiques ou préjudiciables (Marcucci et Verhulst, 2025[128]). Il est donc essentiel d’atténuer ce risque autant que possible en s’assurant que les données utilisées pour entraîner ces systèmes sont de bonne qualité et représentatives.

De nombreuses personnes considèrent les systèmes d’IA et leurs décisions comme étant neutres et impartiaux, ce qui les conduit à accepter leurs résultats sans les remettre en question, bien qu’ils puissent comporter des erreurs. Cette tendance des opérateurs humains à trop miser sur l’automatisation est connue sous le nom de « biais d’automatisation » (Horowitz, 2023[129] ; Alon-Barkat et Busuioc, 2022[130]). Une automatisation excessive pourrait réduire la place accordée au jugement humain et simplifier à l’excès des hypothèses sociales et économiques complexes. Cela pourrait amener les évaluateurs à accepter les recommandations proposées par l’IA sans examiner minutieusement les hypothèses ou les données sous-jacentes.

En outre, le manque de transparence de certains outils d’IA peut compliquer encore la tâche des responsables publics, qui doivent être en mesure de comprendre et d’expliquer les éclairages générés par l’IA. Cela peut être particulièrement problématique dans le cadre de l’élaboration des politiques, où une approche objective est nécessaire pour répondre de manière adaptée aux besoins de différents groupes de personnes et justifier les décisions prises.

Défis de mise en œuvre

Manque de données de qualité et incapacité à les partager
Déficits de compétences

Tandis que les pouvoirs publics sont confrontés à un certain nombre de difficultés dans la promotion de l’évaluation des politiques publiques, ils doivent également relever des défis spécifiques lorsqu’ils cherchent à utiliser l’IA dans ce domaine (OCDE/UNESCO, 2024[131]). La gouvernance inadaptée des données pose depuis longtemps des difficultés pour les évaluateurs, en cela qu’elle limite la capacité des pouvoirs publics à générer celles qui sont nécessaires à la production des données probantes et des évaluations (OCDE, 2020[108]). Ce problème persiste alors même qu’en adhérant à la Recommandation de l’OCDE sur l’évaluation des politiques publiques (2023[132]), tous les pays membres se sont engagés à assurer la disponibilité de données de performance, de résultat et administratives de grande qualité, récentes, accessibles, ventilées et réutilisables pour l’évaluation des politiques publiques.

La mise en œuvre de l’IA nécessite des compétences numériques et des capacités en calcul. Il n’est pas nécessaire que tous les membres d’une équipe d’évaluation soient experts en IA, mais il faut veiller à ce que l’ensemble des évaluateurs comprennent comment cette technologie peut faciliter l’évaluation des politiques publiques. Ils devraient donc recevoir un soutien adapté de la part des équipes spécialisées dans le numérique et la science des données, dont la mise en place est en cours, comme c’est le cas par exemple au sein de l’IGF en France. Les données montrent que les évaluateurs des politiques publiques se sont adaptés moins rapidement aux nouvelles évolutions de manière générale, même si certains pays ont adopté des pratiques avancées. Les formations visant à renforcer les compétences des évaluateurs en matière d’analytique des données massives et d’IA sont souvent limitées. C’est également le cas pour les évaluations réalisées au sein des administrations : les capacités d’analyse et compétences techniques internes étant souvent limitées, elles freinent l’élaboration d’évaluations de qualité (OCDE, 2020[108]).

La Boîte à outils de l’OCDE pour la mise en œuvre de la Recommandation sur l’évaluation des politiques publiques (2025[107]) fournit des informations sur la manière dont les pouvoirs publics peuvent évaluer leurs capacités actuelles en matière d’évaluation des politiques publiques, recense des bonnes pratiques et des cas d’utilisation provenant du monde entier, et donne des exemples concrets de solutions et outils pratiques que les responsables de l’action publique et les évaluateurs pourraient mettre en œuvre.

Potentiel inexploité et perspectives

Dans le domaine de l’évaluation des politiques publiques, l’IA peut accomplir certaines tâches pour permettre aux analystes des administrations d’utiliser un éventail plus large de données probantes et de les traiter plus rapidement. Si de premières utilisations de l’IA ont été identifiées dans la conception, la communication et la gestion des évaluations ainsi que l’analyse, le recours à cette technologie pour appuyer l’évaluation des politiques publiques reste limité. C’est la raison pour laquelle il existe des domaines dans lesquels l’IA a le potentiel de faciliter significativement l’évaluation des politiques publiques à l’avenir.

Premièrement, des agents conversationnels pourraient apporter un appui à la conception des évaluations en aidant les évaluateurs à renforcer leurs connaissances dans des domaines spécifiques. En effet, s’ils sont configurés avec des instructions génératives adaptées, ces agents peuvent mener un certain nombre d’activités en vue de faciliter l’apprentissage. Comme l’illustrent de premières expériences en matière de conception d’évaluations, ils peuvent également favoriser la créativité et servir d’outils efficaces d’aide à la réflexion (Ferretti, 2023[133]). Même si ces outils ne génèrent pas de nouvelles données probantes, ils peuvent apporter de nouveaux éclairages utiles lors des premières étapes d’un processus d’évaluation. Récemment, par exemple, l’agent Deep Research de ChatGPT a été mis au point dans l’objectif d’automatiser une grande partie du processus consistant à examiner et synthétiser des données probantes. Les outils comme Deep Research utilisent le raisonnement par chaîne de pensées pour décomposer des questions de recherche complexes en sous-questions plus petites et compréhensibles auxquelles ils répondent successivement. Cette approche permet au système d’établir un rapport détaillé après avoir examiné les données disponibles. Ces techniques ont le potentiel d’automatiser une grande partie du processus d’examen et de synthèse des données probantes. Les chercheurs qui, jusque-là, produisaient manuellement un petit nombre de revues, pourraient alors automatiser la génération de dizaines de revues grâce à l’IA, en assurer le contrôle qualité et les utiliser comme une base pour leurs travaux ultérieurs.

Deuxièmement, d’un point de vue analytique, l’IA recèle un potentiel important pour ce qui est de mener des évaluations ex ante et ex post plus ambitieuses, en utilisant un plus large éventail de données et en effectuant des évaluations d’impact au moyen de méthodes quasi expérimentales. Par exemple, la prévision comportementale fondée sur l’IA peut permettre d’analyser de grandes quantités de données historiques et de comportements observés en vue d’identifier des tendances, d’anticiper les décisions des utilisateurs et d’optimiser leur expérience en tenant compte de variables contextuelles et de stimuli externes. Les outils fondés sur l’apprentissage automatique peuvent être utilisés pour obtenir des prédictions contrefactuelles en l’absence de groupe témoin. Cela peut par exemple être utile dans le cas des évaluations de la tarification du carbone, pour lesquelles les évaluateurs des politiques publiques ne disposent pas d’une perspective ex post. Une étude propose une approche de l’évaluation des politiques publiques permettant de générer des prédictions contrefactuelles en s’appuyant sur des outils d’apprentissage automatique et sur la théorie économique, en vue d’analyser les coûts et les impacts en termes d’émissions engendrés par la taxe britannique sur le carbone Carbon Price Support, ou CPS, « une taxe carbone prélevée sur l’ensemble des centrales à combustibles fossiles » (Abrell, Kosch et Rausch, 2022[134]).

Enfin, à plus long terme, l’IA pourrait faire évoluer la manière d’aborder l’élaboration des politiques publiques, qui s’articule actuellement autour de cycles, en permettant aux évaluations d’alimenter la prise de décision à différents stades. Étant donné que cette technologie permet des évaluations plus rapides et, dans une certaine mesure, moins coûteuses, les universitaires suggèrent qu’il est possible de passer d’un système où les évaluations arrivent souvent trop tard pour éclairer la prise de décision à une approche grâce à laquelle les données tirées des évaluations seront disponibles au moment de façonner, d’ajuster et de repenser les politiques publiques, quasiment en temps réel. C’est ce que l’on appelle le cycle dynamique des politiques publiques (Dynamic Public Policy-Cycle, ou DPPC) (Jacob, 2025[125]). Les pays du monde entier ayant été confrontés à une série de crises ces dernières années, il est essentiel pour les pouvoirs publics d’avoir accès à des données tirées de l’évaluation aux étapes clés de la prise de décision. Des évaluations rapides sont mises au point en vue d’étayer la prise de décisions urgentes, certaines ayant permis d’atteindre cet objectif, par exemple en Australie (Better Evaluation Knowledge, 2022[135]). Actuellement, ces évaluations rapides reposent principalement sur des données qualitatives, mais l’IA pourrait jouer un rôle clé pour les consolider et pour accroître leur prévalence à l’avenir.

Toutefois, pour que l’IA contribue efficacement aux évaluations, les pouvoirs publics doivent investir dans les compétences des fonctionnaires et dans une infrastructure de données robuste. Une collaboration internationale plus étroite peut également renforcer le potentiel d’utilisation de l’IA pour l’évaluation des politiques publiques. Les évaluateurs doivent bien comprendre les avantages, risques et limites potentiels de l’IA pour savoir quand et comment l’utiliser judicieusement. C’est pourquoi les pouvoirs publics doivent investir dans des formations adaptées pour veiller à ce qu’ils comprennent les différents outils à leur disposition. Des formations ont été mises en place dans les pays de l’OCDE (voir le chapitre 4, section « Promouvoir les compétences et les talents »). Cependant, elles portent principalement sur l’utilisation de l’IA dans les administrations et ne sont pas conçues spécifiquement pour le domaine de l’évaluation. Outre les formations, il est important de soutenir l’expérimentation et l’apprentissage par la pratique. Constituer un réseau permettant aux ministères sectoriels de partager leurs expériences concernant les applications pertinentes de l’IA peut être un bon moyen d’encourager l’adoption de cette technologie pour appuyer diverses tâches d’évaluation. Certains incubateurs sont en cours de développement, mais ils doivent mettre davantage l’accent sur l’évaluation.

Comme c’est déjà le cas dans d’autres domaines d’action, les pouvoirs publics devraient investir dans des infrastructures de données pertinentes et dans des pratiques sûres et sécurisées de partage des données (voir le chapitre 4, sections « Créer un socle de données solide » et « Créer une infrastructure numérique » pour un examen plus détaillé). Certaines organisations gouvernementales, comme le centre Australian Centre for Evaluation en Australie, ont élaboré des guides visant à faciliter l’identification de données et ressources utiles pour les activités d’évaluation et à les rendre plus accessibles (ACE, 2025[136]). Certains pays de la zone OCDE ont mis au point des moyens d’associer différents ensembles de données et d’y accéder dans un environnement sécurisé aux fins de l’analyse des politiques. Par exemple, l’Office statistique danois (Danmarks Statistik) (2025[137]) permet l’utilisation de ces bases de microdonnées à des fins de recherche par des analystes, universités, organismes de recherche ou ministères autorisés. Aux Pays-Bas, les pouvoirs publics ont donné le coup d’envoi à la stratégie Data Agenda Government, dans le cadre de laquelle sont présentés des plans visant à améliorer la gestion des données à caractère personnel, des données ouvertes et des données massives, en mettant à profit des travaux d’analyse et d’intégration en vue d’éclairer l’élaboration des politiques publiques et de relever les défis sociétaux (Ministère de l'Intérieur et des Relations au sein du Royaume (Pays-Bas), 2019[138]).

Pour finir, l’IA recèle un potentiel en matière de synthèse des données probantes. Un appel plus large se fait entendre en faveur d’une collaboration plus étroite entre les pays en matière de production de données probantes, à la suite d’initiatives stratégiques soutenues par des pays comme le Royaume-Uni et l’Australie (Halpern et Maru, 2024[139]). Ce programme reconnaît la nécessité de produire des synthèses plus rapides et plus fiables au niveau international, étant donné que l’IA contribue déjà à réduire les délais de production de données probantes. Cela pourrait contribuer à combler plus rapidement certaines des lacunes existantes.

Note

Copier le lien de Note

← 1. https://kudos.dfo.no.

Thèmes clés

Agriculture et pêcheries

Changement climatique

Développement

Développement régional, urbain et rural

Échanges

Économie

Éducation et compétences

Emploi

Environnement

Finances et investissement

Fiscalité

Gouvernance

Industrie, entreprises et entrepreneuriat

Numérique

Santé

Science, technologie et innovation

Société

Énergie

Énergie nucléaire

Transport

Thèmes clés

Agriculture et pêcheries

Changement climatique

Développement

Développement régional, urbain et rural

Échanges

Économie

Éducation et compétences

Emploi

Environnement

Finances et investissement

Fiscalité

Gouvernance

Industrie, entreprises et entrepreneuriat

Numérique

Santé

Science, technologie et innovation

Société

Énergie

Énergie nucléaire

Transport

Pays A - C

Pays D - I

Pays J - M

Pays N - R

Pays S - T

Pays U - Z

Engagement régional et global

Pays

Pays A - C

Pays D - I

Pays J - M

Pays N - R

Pays S - T

Pays U - Z

Engagement régional et global

Publications

Publications

Gros plan

Données

Données

Gros plan

Actualités & événements

Actualités et événements

Gros plan

À propos

À propos

Engagement

Rejoignez-nous

Thèmes clés

Agriculture et pêcheries

Changement climatique

Développement

Développement régional, urbain et rural

Échanges

Économie

Éducation et compétences

Emploi

Environnement