L'enquête PISA collecte des données à partir d'un échantillon et non sur l'ensemble de la population des élèves de 15 ans. L'échantillon a été constitué afin d'éviter tout biais dans la procédure de sélection et d'obtenir une précision maximale compte tenu des ressources disponibles (pour plus d'informations, voir le chapitre 3 du PISA Data Analysis Manual: SPSS and SAS, deuxième édition - en anglais seulement).



En pratique, cela signifie que l'estimation d'un paramètre de population nécessite (1) l'utilisation de poids associés à l'échantillonnage et (2) le calcul de l'incertitude due à l'échantillonnage (l'erreur-type du paramètre).

Utiliser les poids finaux des élèves pour obtenir des estimations non biaisées des paramètres

Toutes les analyses utilisant des données PISA doivent être pondérées, car les analyses non pondérées fourniront des estimations biaisées des paramètres de population. Dans les fichiers PISA 2015, la variable w_schgrnrabwt correspond aux poids finaux des élèves qui doivent être utilisés pour calculer des statistiques non biaisées au niveau du pays.

La somme des poids finaux des élèves correspond à la taille de la population d'intérêt. Lorsque l'analyse porte sur plusieurs pays, cela signifie que les pays où le nombre d'étudiants de 15 ans est plus élevé contribueront davantage à l'analyse. C'est pourquoi, dans certains cas, l'analyste peut préférer utiliser des poids sénatoriaux, c'est-à-dire des poids qui ont été remis à l'échelle afin d'obtenir la même valeur constante dans chaque pays. Chaque pays contribuera ainsi de manière égale à l'analyse.

Utiliser des poids répétés pour obtenir des erreurs types non biaisées



Une statistique calculée à partir d'un échantillon fournit une estimation du paramètre réel de la population. Il convient donc de calculer son erreur type, qui donne une indication de la fiabilité de ces estimations - l'erreur type nous indique dans quelle mesure les statistiques obtenues à partir de cet échantillon sont proches des statistiques réelles pour l'ensemble de la population. Ces estimations de l'erreur type pourraient être utilisées, par exemple, pour signaler des différences statistiquement significatives entre pays ou à l'intérieur d'un même pays.

Le plan d'échantillonnage de l'enquête PISA étant complexe, les estimations de l'erreur type fournies par les procédures statistiques courantes sont généralement biaisées. En outre, le calcul mathématique des variances d'échantillonnage n'est pas toujours possible pour certains indices multivariés. Pour ces raisons, l'estimation des variances d'échantillonnage dans l'enquête PISA repose sur des méthodologies de réplication, plus précisément une réplication Bootstrap avec la modification de Fay (pour plus de détails, voir le chapitre 4 du PISA Data Analysis Manual: SAS or SPSS, deuxième édition (seulement en anglais) ou le guide associé « Computation of standard-errors for multistage samples » - disponible seulement en anglais). Le principe général de ces méthodes consiste à utiliser plusieurs répliques de l'échantillon original (obtenu par échantillonnage avec remplacement) afin d'estimer l'erreur d'échantillonnage. La statistique d'intérêt est d'abord calculée sur l'ensemble de l'échantillon, puis à nouveau pour chaque réplicat. Les estimations des réplicats sont ensuite comparées à l'estimation de l'échantillon entier afin d'estimer la variance d'échantillonnage.



Dans PISA, 80 échantillons répétés sont calculés - et pour chacun d'entre eux, un ensemble de poids est également calculé.



En pratique, cela signifie qu'il faut estimer la statistique d'intérêt en utilisant le poids final comme décrit ci-dessus, puis à nouveau en utilisant les poids répliqués (dénotés par w_fsturwt1- w_fsturwt80 dans PISA 2015, w_fstr1- w_fstr80 dans les cycles précédents). L'erreur type est alors proportionnelle à la moyenne des différences au carré entre l'estimation principale obtenue dans les échantillons originaux et celles obtenues dans les échantillons répliqués (pour plus de détails sur le calcul de la moyenne sur plusieurs pays, voir le chapitre 12 du PISA Data Analysis Manual: SAS or SPSS, deuxième édition - seulement en anglais).



Des procédures et des macros sont développées afin de calculer ces erreurs types dans le cadre spécifique de PISA (voir ci-dessous pour une description détaillée).