L’utilisation de modèles économétriques pour prévoir les migrations internationales a pris son essor dans les années 1990, lorsque les discussions sur l’élargissement de l’Union européenne aux pays d’Europe centrale ont commencé. La prévision de la mobilité potentielle de la main-d’œuvre des nouveaux États membres (NEM) figurait en bonne place dans l’agenda politique. Les prévisions devaient tenir compte des dispositions transitoires (c’est-à-dire des restrictions à la mobilité), dont certaines sont restées en vigueur après l’adhésion en 2004. De nombreux chercheurs universitaires ont utilisé des modèles économétriques avant l’élargissement prévu (Boeri et Brucker, 2001[1] ; Dustmann et al., 2003[2]), ou après l’élargissement (Brücker, Damelang et Wolf, 2009[3]). Ces modèles basés sur la régression (voir Bijak (2011[4])) pour plus de détails sur les différentes approches) ont estimé différentes variables dépendantes (par exemple, les flux migratoires, les stocks d’immigrés, les taux d’immigration) entre les pays de destination et certains pays candidats à l’adhésion à l’UE, en fonction d’un ensemble de prédicteurs traditionnels tels que les résultats du marché du travail ou les différences de revenus, le PIB par habitant et des variables fictives indiquant la distance géographique ou culturelle. Ces prévisions n’ont pas permis d’anticiper correctement ce qui allait se passer, donnant des résultats bien inférieurs aux flux réels. Cependant, les taux de chômage ont depuis lors été confirmés comme un facteur explicatif puissant (Bijak et al., 2019[5]) pour toutes les catégories de migration, et pas seulement pour prévoir les migrations de travail. Les modèles utilisés à l’époque ont néanmoins été critiqués pour leurs lacunes en matière de spécification, notamment en ce qui concerne les variables démographiques et les effets spécifiques à chaque pays, qui faisaient défaut dans de nombreuses études (Bijak, 2011[4]). En particulier, la plupart partaient du principe que les séries chronologiques passées étaient stationnaires, une hypothèse qui ne peut tenir dans une période d’incertitude (comme la crise économique mondiale qui a eu lieu à la fin des années 2000) et avec un phénomène aussi volatil que la migration.
Un autre problème lié à l’utilisation de covariables de migration dans les modèles de prévision ou dans les scénarios est qu’elles doivent également faire l’objet de prévisions, soit séparément, soit conjointement avec les migrations. Cela signifie que l’incertitude prédictive des migrations est aggravée par l’incertitude prédictive des covariables et par la nature incertaine des relations entre les migrations et leurs facteurs déterminants (Bijak, 2011[4] ; Barker et Bijak, 2025[6]). Néanmoins, cette approche continue d’être utilisée dans les prévisions, ainsi que dans les scénarios de migrations, qui tracent plusieurs trajectoires futures possibles plutôt que probables de la migration (par exemple, Acostamadiedo et al. (2020[7]) ou Wiśniowski et al. (2023[8])). Ces scénarios peuvent être basés sur des trajectoires présélectionnées de facteurs, décrites de manière qualitative plutôt que nécessairement quantifiées. Une autre approche pourrait consister à utiliser une approche statistique sans facteurs pour établir des scénarios, basée sur la fréquence et l’ampleur des événements migratoires rares (Bijak, 2024[9]).
Outre les modèles économétriques susmentionnés impliquant des variables explicatives, un autre important ensemble d’approches de prévision des migrations peut s’appuyer sur l’analyse traditionnelle et l’extrapolation de séries chronologiques. Il comprend des approches standard d’extrapolation des séries chronologiques telles que les modèles ARIMA (Auto-Regressive Integrated Moving Average), y compris les extensions GARCH (Generalized Autoregressive Conditional Heteroskedasticity) et SV (Stochastic Volatility), ainsi que les modèles VAR (Vector Auto-Regressive) (Barker et Bijak, 2025[6]). Bijak, et al. (2019[5]) ont évalué les approches de prévision des migrations sur les données du Royaume‑Uni avec diverses méthodes d’extrapolation et modèles économétriques. Les modèles économétriques évalués ont donné des résultats médiocres ou seulement acceptables, avec des erreurs de mesure moyennes, voire élevées. L’extrapolation traditionnelle des séries chronologiques est également mal calibrée ou biaisée dans la plupart des cas. Cela est vrai lorsque les prévisions sont basées sur des séries de données plus courtes et/ou lorsque les séries sont non stationnaires.
Certains phénomènes migratoires sont néanmoins suffisamment stationnaires pour être prévus à l’aide d’une analyse traditionnelle des séries chronologiques basée uniquement sur des données passées (par exemple, la migration familiale, voir Encadré 6.1 et Tableau 4.1). Par conséquent, à l’exception de ces quelques catégories de migration qui sont susceptibles d’être stationnaires, les prévisions des autres types de flux migratoires s’appuient de plus en plus sur des modèles bayésiens ou d’apprentissage automatique.