En el ámbito de la evaluación de políticas, la IA puede realizar algunas tareas, lo que permite a los analistas gubernamentales utilizar una gama más amplia de evidencias y procesarlas más rápidamente. Si bien se identificaron algunas aplicaciones iniciales de la IA en el diseño, el análisis y la evaluación, la comunicación y la gestión de las evaluaciones, el uso de la IA en la evaluación de políticas sigue siendo limitado. Por este motivo, existen ámbitos en los que la IA puede tener un impacto significativo en la evaluación de políticas en el futuro.
En primer lugar, para apoyar el diseño de la evaluación, los chatbots podrían ayudar a los evaluadores a desarrollar su conocimiento en campos específicos. De hecho, si se les solicita, los chatbots pueden realizar varias actividades que pueden apoyar el aprendizaje. Como muestran algunos ejemplos iniciales de diseño de evaluación, también pueden apoyar el pensamiento creativo y utilizarse como herramientas útiles para el intercambio de ideas (Ferretti, 2023[133]). Aunque estas herramientas no generen nuevas evidencias, sí pueden proporcionar nuevos conocimientos útiles para las etapas iniciales de un proceso de evaluación. Recientemente, por ejemplo, la Investigación Profunda de ChatGPT intenta automatizar una gran parte del proceso de revisión y síntesis de evidencias. Usando el razonamiento de la cadena de pensamiento (CoT, por sus siglas en inglés), herramientas como la Investigación Profunda dividen preguntas de investigación complejas en subpreguntas más pequeñas y comprensibles que responde en secuencia. Este enfoque permite al sistema elaborar un informe detallado basado en el examen de las pruebas disponibles. Estas técnicas de CoT tienen el potencial de automatizar una gran parte del proceso de revisión y síntesis de evidencias. Esto podría permitir a los investigadores que anteriormente desarrollaban algunas revisiones desde cero automatizar, asegurar la calidad y basarse en docenas de revisiones de investigación generadas por la IA.
En segundo lugar, desde una perspectiva analítica, existe un gran potencial para que la IA se utilice en mayor medida para realizar evaluaciones ex ante y ex post más ambiciosas, utilizando una gama más amplia de datos y evaluando el impacto a través de métodos cuasi experimentales. Por ejemplo, la previsión del comportamiento impulsada por la IA puede analizar grandes cantidades de datos históricos y comportamientos observados para identificar patrones, anticipar decisiones y optimizar las experiencias de los usuarios mediante la integración de variables contextuales y estímulos externos. Las herramientas de ML pueden utilizarse para la predicción contrafactual en los casos en los que falta un grupo de control. Esto puede utilizarse, por ejemplo, en el caso de las evaluaciones de los precios del carbono, en las que los evaluadores de las políticas carecen de una perspectiva ex post. Un estudio propone un enfoque de evaluación de políticas que utiliza herramientas de ML y la teoría económica para la predicción contra fáctica con el fin de analizar los costos y los impactos de las emisiones del CPS del Reino Unido, "un impuesto al carbono aplicado a todas las centrales eléctricas de combustibles fósiles" (Abrell, Kosch and Rausch, 2022[134]).
Por último, a más largo plazo, la IA puede cambiar el enfoque de la formulación de políticas desde un ciclo de formulación de políticas y permitir que las evaluaciones se incorporen a la toma de decisiones en múltiples etapas. Dado que la IA agiliza las evaluaciones y, en cierta medida, las hace menos costosas, los académicos sugieren la posibilidad de pasar de un sistema en el que las evaluaciones suelen llegar demasiado tarde para la toma de decisiones a un enfoque en el que las pruebas de evaluación están disponibles para dar forma, ajustar y rediseñar las políticas casi en tiempo real. Esto se conoce como ciclo dinámico de políticas públicas (Jacob, 2025[125]). Dado que los países de todo el mundo se han enfrentado a una serie de crisis en los últimos años, es esencial que los gobiernos tengan acceso a pruebas de evaluación en las etapas clave de la toma de decisiones. Las evaluaciones rápidas se elaboran para fundamentar la adopción de decisiones urgentes y se han utilizado eficazmente con este fin, por ejemplo, en Australia (Better Evaluation Knowledge, 2022[135]). Aunque estas evaluaciones rápidas ahora se basan principalmente en datos cualitativos, la IA podría desempeñar un papel importante para que estas evaluaciones sean más sólidas y comunes en el futuro.
Sin embargo, para que la IA apoye eficazmente la evaluación, los gobiernos deben invertir en las competencias de los funcionarios públicos y en el desarrollo de una sólida infraestructura de datos. Una mayor colaboración internacional también puede potenciar el potencial de la IA en la evaluación de políticas. Los evaluadores necesitan conocer bien los posibles beneficios, riesgos y limitaciones de la IA para tomar decisiones informadas sobre cuándo y cómo utilizarla. Por este motivo, los gobiernos deben invertir en cursos de formación para evaluadores con el fin de asegurarse de que comprenden las diferentes herramientas de que disponen. Se han impartido formaciones en todos los gobiernos de la OCDE (véase el Capítulo 4, sección "Fomento de las competencias y el talento"). Sin embargo, estos se centran principalmente en el uso de la IA en la administración pública y no se adaptan al ámbito de la evaluación. Además de las formaciones, es importante apoyar la experimentación con IA y el aprendizaje práctico. El desarrollo de una red interministerial para intercambiar aplicaciones pertinentes de IA puede ser una buena forma de apoyar la adopción de la IA en diferentes tareas de evaluación. En la actualidad se están desarrollando algunas incubadoras, pero es necesario prestar más atención a la evaluación.
Como en el caso de otras áreas de política, los gobiernos deberían invertir en infraestructuras de datos pertinentes e intercambio de datos seguro y protegido (para un análisis detallado, véanse el Capítulo 4, secciones sobre "Creación de una base de datos sólida" y "Construcción de una infraestructura digital"). Algunas organizaciones gubernamentales, como el Centro Australiano de Evaluación, han elaborado guías para facilitar el descubrimiento de datos y el acceso a las actividades de apoyo a la evaluación (ACE, 2025[136]). Algunos países de la OCDE han desarrollado formas en las que se pueden vincular y acceder a diferentes conjuntos de datos en un entorno seguro para garantizar el análisis de políticas. En Dinamarca, por ejemplo, Statistics Denmark (2025[137]) facilita el uso de estas bases de datos a nivel micro con fines de investigación para analistas aprobados, universidades, organizaciones de investigación o ministerios. En los Países Bajos, el gobierno puso en marcha la Agenda de Datos, en la que se esbozan planes para mejorar la gestión de los datos personales, los datos abiertos y los macrodatos, aprovechando el análisis y la integración para la formulación de políticas informadas y abordando los desafíos sociales (Netherlands Ministry of the Interior and Kingdom Relations, 2019[138]).
Por último, la IA tiene potencial en la síntesis de evidencias. Existe un llamamiento más amplio en favor de una mayor colaboración en la generación de pruebas empíricas entre países, tras las iniciativas estratégicas apoyadas por países como el Reino Unido y Australia (Halpern and Maru, 2024[139]). Esta agenda reconoce la necesidad de una síntesis más rápida y confiable a nivel internacional, dado que la IA ya está ayudando a reducir los plazos de producción de pruebas. Esto podría ayudar a subsanar algunas de las deficiencias existentes con mayor rapidez.