Dans le domaine de l’évaluation des politiques publiques, l’IA peut accomplir certaines tâches pour permettre aux analystes des administrations d’utiliser un éventail plus large de données probantes et de les traiter plus rapidement. Si de premières utilisations de l’IA ont été identifiées dans la conception, la communication et la gestion des évaluations ainsi que l’analyse, le recours à cette technologie pour appuyer l’évaluation des politiques publiques reste limité. C’est la raison pour laquelle il existe des domaines dans lesquels l’IA a le potentiel de faciliter significativement l’évaluation des politiques publiques à l’avenir.
Premièrement, des agents conversationnels pourraient apporter un appui à la conception des évaluations en aidant les évaluateurs à renforcer leurs connaissances dans des domaines spécifiques. En effet, s’ils sont configurés avec des instructions génératives adaptées, ces agents peuvent mener un certain nombre d’activités en vue de faciliter l’apprentissage. Comme l’illustrent de premières expériences en matière de conception d’évaluations, ils peuvent également favoriser la créativité et servir d’outils efficaces d’aide à la réflexion (Ferretti, 2023[133]). Même si ces outils ne génèrent pas de nouvelles données probantes, ils peuvent apporter de nouveaux éclairages utiles lors des premières étapes d’un processus d’évaluation. Récemment, par exemple, l’agent Deep Research de ChatGPT a été mis au point dans l’objectif d’automatiser une grande partie du processus consistant à examiner et synthétiser des données probantes. Les outils comme Deep Research utilisent le raisonnement par chaîne de pensées pour décomposer des questions de recherche complexes en sous-questions plus petites et compréhensibles auxquelles ils répondent successivement. Cette approche permet au système d’établir un rapport détaillé après avoir examiné les données disponibles. Ces techniques ont le potentiel d’automatiser une grande partie du processus d’examen et de synthèse des données probantes. Les chercheurs qui, jusque-là, produisaient manuellement un petit nombre de revues, pourraient alors automatiser la génération de dizaines de revues grâce à l’IA, en assurer le contrôle qualité et les utiliser comme une base pour leurs travaux ultérieurs.
Deuxièmement, d’un point de vue analytique, l’IA recèle un potentiel important pour ce qui est de mener des évaluations ex ante et ex post plus ambitieuses, en utilisant un plus large éventail de données et en effectuant des évaluations d’impact au moyen de méthodes quasi expérimentales. Par exemple, la prévision comportementale fondée sur l’IA peut permettre d’analyser de grandes quantités de données historiques et de comportements observés en vue d’identifier des tendances, d’anticiper les décisions des utilisateurs et d’optimiser leur expérience en tenant compte de variables contextuelles et de stimuli externes. Les outils fondés sur l’apprentissage automatique peuvent être utilisés pour obtenir des prédictions contrefactuelles en l’absence de groupe témoin. Cela peut par exemple être utile dans le cas des évaluations de la tarification du carbone, pour lesquelles les évaluateurs des politiques publiques ne disposent pas d’une perspective ex post. Une étude propose une approche de l’évaluation des politiques publiques permettant de générer des prédictions contrefactuelles en s’appuyant sur des outils d’apprentissage automatique et sur la théorie économique, en vue d’analyser les coûts et les impacts en termes d’émissions engendrés par la taxe britannique sur le carbone Carbon Price Support, ou CPS, « une taxe carbone prélevée sur l’ensemble des centrales à combustibles fossiles » (Abrell, Kosch et Rausch, 2022[134]).
Enfin, à plus long terme, l’IA pourrait faire évoluer la manière d’aborder l’élaboration des politiques publiques, qui s’articule actuellement autour de cycles, en permettant aux évaluations d’alimenter la prise de décision à différents stades. Étant donné que cette technologie permet des évaluations plus rapides et, dans une certaine mesure, moins coûteuses, les universitaires suggèrent qu’il est possible de passer d’un système où les évaluations arrivent souvent trop tard pour éclairer la prise de décision à une approche grâce à laquelle les données tirées des évaluations seront disponibles au moment de façonner, d’ajuster et de repenser les politiques publiques, quasiment en temps réel. C’est ce que l’on appelle le cycle dynamique des politiques publiques (Dynamic Public Policy-Cycle, ou DPPC) (Jacob, 2025[125]). Les pays du monde entier ayant été confrontés à une série de crises ces dernières années, il est essentiel pour les pouvoirs publics d’avoir accès à des données tirées de l’évaluation aux étapes clés de la prise de décision. Des évaluations rapides sont mises au point en vue d’étayer la prise de décisions urgentes, certaines ayant permis d’atteindre cet objectif, par exemple en Australie (Better Evaluation Knowledge, 2022[135]). Actuellement, ces évaluations rapides reposent principalement sur des données qualitatives, mais l’IA pourrait jouer un rôle clé pour les consolider et pour accroître leur prévalence à l’avenir.
Toutefois, pour que l’IA contribue efficacement aux évaluations, les pouvoirs publics doivent investir dans les compétences des fonctionnaires et dans une infrastructure de données robuste. Une collaboration internationale plus étroite peut également renforcer le potentiel d’utilisation de l’IA pour l’évaluation des politiques publiques. Les évaluateurs doivent bien comprendre les avantages, risques et limites potentiels de l’IA pour savoir quand et comment l’utiliser judicieusement. C’est pourquoi les pouvoirs publics doivent investir dans des formations adaptées pour veiller à ce qu’ils comprennent les différents outils à leur disposition. Des formations ont été mises en place dans les pays de l’OCDE (voir le chapitre 4, section « Promouvoir les compétences et les talents »). Cependant, elles portent principalement sur l’utilisation de l’IA dans les administrations et ne sont pas conçues spécifiquement pour le domaine de l’évaluation. Outre les formations, il est important de soutenir l’expérimentation et l’apprentissage par la pratique. Constituer un réseau permettant aux ministères sectoriels de partager leurs expériences concernant les applications pertinentes de l’IA peut être un bon moyen d’encourager l’adoption de cette technologie pour appuyer diverses tâches d’évaluation. Certains incubateurs sont en cours de développement, mais ils doivent mettre davantage l’accent sur l’évaluation.
Comme c’est déjà le cas dans d’autres domaines d’action, les pouvoirs publics devraient investir dans des infrastructures de données pertinentes et dans des pratiques sûres et sécurisées de partage des données (voir le chapitre 4, sections « Créer un socle de données solide » et « Créer une infrastructure numérique » pour un examen plus détaillé). Certaines organisations gouvernementales, comme le centre Australian Centre for Evaluation en Australie, ont élaboré des guides visant à faciliter l’identification de données et ressources utiles pour les activités d’évaluation et à les rendre plus accessibles (ACE, 2025[136]). Certains pays de la zone OCDE ont mis au point des moyens d’associer différents ensembles de données et d’y accéder dans un environnement sécurisé aux fins de l’analyse des politiques. Par exemple, l’Office statistique danois (Danmarks Statistik) (2025[137]) permet l’utilisation de ces bases de microdonnées à des fins de recherche par des analystes, universités, organismes de recherche ou ministères autorisés. Aux Pays-Bas, les pouvoirs publics ont donné le coup d’envoi à la stratégie Data Agenda Government, dans le cadre de laquelle sont présentés des plans visant à améliorer la gestion des données à caractère personnel, des données ouvertes et des données massives, en mettant à profit des travaux d’analyse et d’intégration en vue d’éclairer l’élaboration des politiques publiques et de relever les défis sociétaux (Ministère de l'Intérieur et des Relations au sein du Royaume (Pays-Bas), 2019[138]).
Pour finir, l’IA recèle un potentiel en matière de synthèse des données probantes. Un appel plus large se fait entendre en faveur d’une collaboration plus étroite entre les pays en matière de production de données probantes, à la suite d’initiatives stratégiques soutenues par des pays comme le Royaume-Uni et l’Australie (Halpern et Maru, 2024[139]). Ce programme reconnaît la nécessité de produire des synthèses plus rapides et plus fiables au niveau international, étant donné que l’IA contribue déjà à réduire les délais de production de données probantes. Cela pourrait contribuer à combler plus rapidement certaines des lacunes existantes.