Chapter

11. Erreurs, Variances Et Biais

Author(s):
International Monetary Fund
Published Date:
November 2006
Share
  • ShareShare
Show Summary Details

Introduction

11.1 Le présent chapitre examine les principaux types d’erreurs et d’imprécisions auxquels sont exposés tous les indices de prix. Les études consacrées aux indices des prix à la consommation (IPC) considèrent ces erreurs et imprécisions sous deux angles différents, qui sont traités l’un après l’autre dans ce chapitre. On examinera tout d’abord les origines des erreurs d’échantillonnage ou autres qui peuvent se produire au stade de l’estimation de l’IPC pour une certaine population à partir d’un échantillon de prix observés. Le reste du chapitre passe en revue les arguments avancés dans de nombreuses études récentes qui attribuent les biais des IPC à un traitement insuffisamment précis des changements de qualité, des substitutions de produits opérées par les consommateurs et d’autres facteurs. Il convient de souligner que nombre des questions fondamentales abordées ici sont traitées de manière beaucoup plus détaillée dans d’autres parties du manuel.

Types d’erreurs

11.2 L’un des principaux objectifs de l’enquête par échantillonnage est d’obtenir des estimations des caractéristiques d’une population. Or, ces estimations ne correspondront jamais exactement aux caractéristiques de la population considérée. Il y aura toujours une marge d’erreur. Le tableau 11.1 donne la taxonomie des différents types d’erreurs et d’imprécisions. Pour un aperçu des différentes sources d’erreurs stochastiques et non stochastiques dans le calcul d’un IPC, voir aussi Balk and Kersten (1986) et Dalén (1995). On peut distinguer deux grandes catégories d’erreurs: les erreurs d’échantillonnage et les autres erreurs.

Tableau 11.1Taxonomie des erreurs dans un indice des prix à la consommation
Erreur totale
Erreur d’échantillonnage
Biais de sélection
Variance d’échantillonnage
Autres types d’erreurs
Erreur d’observation
Dépassement du champ d’enquête
Erreur de réponse
Erreur de traitement
Erreurs autres que les erreurs d’observation
Défaut de couverture
Biais de non-réponse

Erreurs d’échantillonnage

11.3Les erreurs d’échantillonnage sont imputables au fait que l’estimation d’un IPC est fondée sur des échantillons et non pas sur toutes les unités de la population concernée. Ces erreurs disparaissent si l’observation porte sur la totalité de la population. Comme cela est indiqué dans les chapitres précédents, les bureaux statistiques adoptent généralement comme objet de l’estimation un indice de prix à pondérations fixes. Un indice à pondérations fixes peut être considéré comme la moyenne pondérée d’indices partiels de groupes de produits, les pondérations étant les parts de dépenses. Les procédures d’estimation de l’IPC appliquées le plus couramment par les bureaux de statistiques font intervenir différents types d’échantillons, dont les plus importants sont les suivants:

  • Pour chaque groupe de produits, un échantillon de produits pour calculer l’indice de prix partiel de ce groupe de produits.

  • Pour chaque produit, un échantillon de points de vente pour calculer l’indice d’agrégat élémentaire du produit à partir de relevés de prix individuels.

  • Un échantillon de ménages pour l’estimation des parts moyennes de dépenses afférentes aux groupes de produits. (Certains pays utilisent les données des comptes nationaux au lieu d’une enquête sur les dépenses des ménages pour obtenir les parts de dépenses.)

11.4 L’erreur d’échantillonnage peut venir à la fois d’un biais de sélection et de la variance d’échantillonnage. Un biais de sélection se produit lorsque les probabilités de sélection réelles s’écartent des probabilités de sélection spécifiées lors de la constitution de l’échantillon. La variance d’échantillonnage résulte de l’utilisation d’un échantillon constitué selon une procédure aléatoire. À chaque fois qu’un nouvel échantillon est constitué, il sera composé d’éléments différents, ce qui risque d’aboutir à une valeur différente de l’estimateur.

Erreurs autres que d’échantillonnage

11.5 Les erreurs autres que d’échantillonnage peuvent se produire lorsque l’observation porte sur la totalité de la population. On distingue les erreurs d’observation des autres types d’erreur. Les erreurs d’observation sont les erreurs commises pendant le processus d’obtention et d’enregistrement des observations ou des réponses de base.

11.6 Le dépassement du champ de l’enquête arrive quand certaines unités sont prises en compte dans l’enquête alors qu’elles ne font pas partie de la population cible. Dans le cas des points de vente, les bureaux statistiques ne disposent pas habituellement de bases de sondage adéquates. Dans certains pays par exemple, c’est le registre du commerce qui est utilisé à cette fin. Dans celui-ci, les points de vente sont classés en fonction de leur activité principale, d’où une couverture beaucoup trop large, car elle comprend de nombreux points de vente qui ne devraient pas être pris en compte aux fins du calcul de l’IPC (par exemple les entreprises qui vendent à d’autres entreprises et non aux ménages). En outre, le registre du commerce ne fournit pas d’informations détaillées sur tous les produits vendus par le point de vente considéré; il peut donc arriver qu’un produit particulier ne soit pas vendu du tout par un point de vente inclus dans l’échantillon.

11.7 Les erreurs de réponse sont celles qui se produisent, dans une enquête sur les dépenses des ménages ou sur les prix, lorsque la personne interrogée ne comprend pas la question ou ne veut pas donner la bonne réponse ou lorsque l’enquêteur ou la personne qui relève les prix fait une erreur au moment de consigner la réponse. Ainsi, dans les enquêtes sur les dépenses des ménages, il apparaît que les ménages déclarent systématiquement des dépenses inférieures à leurs dépenses réelles pour les groupes de produits tels que le tabac et les boissons alcoolisées. Quant au relevé des prix, dans la plupart des pays, il est généralement confié à des personnes qui se rendent régulièrement dans les points de vente. Il peut arriver qu’elles relèvent les prix de produits qui n’entrent pas dans l’échantillon.

11.8 Les données sur les prix sont traitées en différentes étapes, à savoir l’encodage, la saisie, le transfert et la vérification (contrôle et correction). À chaque étape, des erreurs dites erreurs de traitement sont possibles. Par exemple, quand ils relèvent les prix dans les points de vente, les collecteurs de prix les consignent sur des formulaires en papier. Ensuite, ces informations sont saisies et transmises au moyen d’un ordinateur. Il est bien évident que cette façon de procéder multiplie les possibilités d’erreur.

11.9 Les erreurs autres que d’observation sont celles qui se produisent lorsque les mesures envisagées ne peuvent pas être menées à bien. Ainsi, en cas de défaut de couverture, des unités de la population cible n’apparaissent pas dans la base de sondage. Dans le cas des points de vente, cela signifie par exemple que certains points de vente où les produits retenus sont achetés ne peuvent pas être contactés. Il semblerait que certains bureaux statistiques excluent de leurs bases de sondage des points de vente les sociétés de vente par correspondance et les étals de marchés qui ne vendent pas de denrées alimentaires.

11.10 Une autre erreur qui n’est pas une erreur d’observation est le biais de non-réponse. Il peut se produire lorsqu’il n’a pas été possible d’obtenir en temps voulu les informations requises pour toutes les unités sélectionnées de l’échantillon. On peut distinguer la non-réponse totale de la non-réponse partielle. Il y a non-réponse totale lorsque les points de vente ne peuvent pas être contactés ou refusent de participer à l’enquête sur les prix ou bien lorsque les personnes interrogées et les collecteurs de prix renvoient respectivement les questionnaires reçus par courrier et les formulaires de relevé après la date limite fixée pour le début du traitement des données. La non-réponse est partielle lorsque les questionnaires ou les formulaires ne sont pas complètement remplis. Si les changements de prix dans les points de vente qui n’ont pas répondu sont différents de ceux des points de vente qui ont répondu, les résultats de l’enquête sur les prix seront biaisés.

11.11 Les erreurs de non-réponse totale ou partielle se rencontrent aussi dans les enquêtes sur les dépenses des ménages. La non-réponse est totale lorsque les ménages inclus dans l’échantillon refusent de collaborer. Elle est partielle lorsque, par exemple, certains ménages refusent de donner des informations sur les dépenses qu’ils consacrent à certains groupes de produits.

Erreurs et biais de mesure

Estimation de variance

11.12 L’estimateur de la variance dépend à la fois de l’estimateur de l’IPC choisi et de la méthode de constitution de l’échantillon. Boon (1998) passe en revue les méthodes d’échantillonnage utilisées par divers instituts statistiques européens pour calculer les IPC. Il en ressort que quatre d’entre eux seulement utilisent des techniques probabilistes pour sélectionner les points de vente, et qu’un seul pour constituer l’échantillon de produits élémentaires. En l’absence de techniques probabilistes, il est fait recours à des méthodes subjectives et à l’échantillonnage par seuil d’inclusion.

11.13 Compte tenu de la complexité des diverses méthodes de constitution d’échantillons (entre lesquels il existe certains liens) pour calculer un IPC, il apparaît problématique d’estimer la variance selon une approche intégrée. Autrement dit, il semble difficile d’établir une formule simple pour mesurer la variance d’un IPC, qui tienne compte de toutes les sources d’aléas d’échantillonnage. Il est cependant possible de parvenir à des mesures partielles (ou conditionnelles), qui quantifient uniquement l’effet d’une seule source de variabilité. Par exemple, Balk et Kersten (1986) ont calculé la variance d’un IPC résultant de la variabilité d’échantillonnage de l’enquête sur les dépenses des ménages, en posant comme condition que les indices de prix partiels sont réputés connus avec certitude. Dans l’idéal, tous les aléas conditionnels d’échantillonnage devraient être regroupés en un cadre unique pour évaluer l’importance relative des diverses sources de variabilité. Sur la base d’hypothèses relativement restrictives, Balk (1989a) a établi un cadre intégré permettant d’évaluer la variance totale d’échantillonnage pour un IPC.

11.14 Pour tenter d’estimer la variance d’échantillonnage d’un IPC, il existe divers procédés. On peut utiliser des estimateurs de variance basés sur le plan de sondage (c’est-à-dire des variances d’estimateurs d’Horvitz–Thompson), en conjonction avec la méthode de linéarisation de Taylor, pour les aléas d’échantillonnage liés au plan de sondage probabiliste. À titre d’exemple, dans l’hypothèse d’un plan de sondage à classement recoupé, dans lequel les échantillons de produits et de points de vente sont tirés indépendamment d’une population bidimensionnelle selon la méthode du tirage aléatoire à probabilité inégale proportionnelle à la taille pour les deux dimensions, une formule de variance basée sur le plan de sondage peut être trouvée. De cette manière, Dalén et Ohlsson (1995) ont établi que l’erreur d’échantillonnage pour un changement sur douze mois de l’IPC suédois regroupant tous les produits était de l’ordre de 0,1–0,2 %.

11.15 Le principal problème posé par l’échantillonnage non probabiliste est qu’il n’existe aucun moyen acceptable sur le plan théorique de savoir si la dispersion des données dans l’échantillon reflète fidèlement la dispersion dans la population. Dès lors, la variance doit être estimée au moyen de valeurs approchées. L’une des techniques utilisées à cette fin est la quasi-randomisation (voir Särndal, Swensson, and Wretman (1992, p. 574)), dans laquelle des hypothèses sont formulées sur les probabilités de l’échantillonnage des produits et des points de vente. Le défaut de cette méthode est qu’il est difficile de trouver un modèle probabiliste qui approche de façon satisfaisante la méthode effectivement utilisée pour sélectionner les points de vente et les produits élémentaires. Une autre possibilité consiste à utiliser des méthodes par simulations répétées, comme celles des groupes aléatoires, des demi-échantillons équilibrés, du jackknife ou du bootstrap. Il s’agit d’une série de méthodes complètement non paramétrique permettant d’estimer la répartition des échantillons et les écartstypes. Chaque méthode de répétition repose sur l’exploitation d’un grand nombre de sous-échantillons tirés de l’échantillon donné. Le paramètre visé peut être estimé à partir de chaque sous-échantillon. Dans des conditions peu contraignantes, on peut montrer que la distribution des estimations obtenues approche la distribution d’échantillonnage de l’estimateur initial. Pour un traitement plus détaillé des méthodes de répétition, voir Särndal, Swensson, and Wretman (1992, p. 418–45).

Description qualitative des erreurs autres que les aléas d’échantillonnage

11.16 Il est encore plus difficile d’obtenir une mesure quantitative des erreurs autres que les aléas d’échantillonnage. Le recours à des indications qualitatives est donc la seule possibilité. On peut, par exemple, vérifier si la couverture des bases de sondage est une bonne valeur approchée des populations cibles (y compris les lacunes, les duplications et les problèmes de définition). Il est possible d’établir quel pourcentage d’échantillons de points de vente cibles a permis d’obtenir des réponses ou des données de prix exploitables (c’est-à-dire les taux de réponse). La description des différences connues entre les prix des points de vente qui ont répondu et les prix de ceux qui n’ont pas répondu peut donner une idée de la méthode d’imputation ou d’estimation utilisée pour compenser les non-réponses. Plusieurs catégories d’erreurs autres que les aléas d’échantillonnage font l’objet de la section qui suit consacrée aux questions de biais.

Procédures suivies pour limiter les erreurs

11.17 Il est possible de limiter la variance au stade de la constitution de l’échantillon. Par exemple, en augmentant la taille de l’échantillon ou en choisissant des probabilités de sélection qui soient proportionnelles à une variable auxiliaire bien choisie, il est possible de réduire la variance de l’estimation de l’IPC. Le choix de la méthode appropriée pour constituer l’échantillon est une question extrêmement complexe. La population cible est composée des biens et services acquis dans les points de vente et utilisés ou payés par les ménages pendant une période donnée. La bonne méthode de tirage aléatoire consiste à choisir un échantillon au moyen d’un mécanisme tel que chaque bien ou service de la population considérée a une probabilité de sélection connue. Combinée à un estimateur de type Horvitz–Thompson, cette méthode de tirage aléatoire produit un indice qui est (plus ou moins) sans biais et précis.

11.18 Les trois méthodes de tirage aléatoire ci-après sont couramment utilisées pour réaliser des enquêtes: tirage aléatoire simple (SI), tirage aléatoire à probabilité inégale proportionnelle à la taille (PPT), tirage aléatoire stratifié avec un tirage SI ou PPT par strate. L’avantage du tirage SI réside précisément dans sa simplicité; il donne à chaque élément de la population la même probabilité d’être inclus dans l’échantillon. Le tirage PPT présente l’avantage de donner aux éléments les plus importants une plus grande probabilité de sélection que les éléments les moins importants. Par exemple, le Bureau statistique suédois choisit les points de vente par tirage aléatoire à probabilité inégale proportionnelle à une variable représentative de leur taille, à savoir leur nombre d’employés. Par rapport au tirage aléatoire à probabilité égale, le tirage aléatoire à probabilité inégale peut réduire sensiblement la variance. Dans le tirage aléatoire stratifié, la population est divisée en sous-populations qui ne se recoupent pas, appelées strates. Par exemple, l’Office statistique national du Royaume-Uni divise la population de points de vente en plusieurs strates en fonction du type de point de vente (multiple, indépendant ou spécialisé). À l’intérieur de chaque strate, un échantillon est choisi en fonction d’un certain plan de sondage. L’une des raisons pour lesquelles le tirage aléatoire stratifié est utilisé si couramment est qu’il permet d’avoir presque entièrement la même précision que celle du tirage aléatoire PPT grâce à un tirage aléatoire simple au sein de strates soigneusement constituées. À plusieurs égards, le tirage aléatoire stratifié est plus simple que le tirage aléatoire PPT.

11.19 Souvent, faute de base de sondage appropriée, les échantillons sont constitués selon des méthodes non probabilistes. L’échantillonnage par choix raisonné (ou par choix d’expert) fait partie des méthodes non probabilistes. Dans ce cas, un expert choisit certaines unités élémentaires «typiques» pour lesquelles des données doivent être relevées. Si l’expert est compétent, on obtiendra un assez bon échantillon, mais rien ne permet d’en être sûr. Une méthode non probabiliste plus perfectionnée est celle de l’échantillonnage par la méthode des quotas: la population est d’abord divisée en plusieurs strates; pour chaque strate, on fixe le nombre (quota) d’unités élémentaires à inclure dans l’échantillon; ensuite, l’enquêteur sur le terrain se borne à remplir son quota, ce qui signifie, dans le cas des points de vente, que la sélection de ces derniers repose en définitive sur l’appréciation des enquêteurs. Une autre méthode non probabiliste est celle de l’échantillonnage fondé sur un seuil d’inclusion: une partie de la population cible est alors exclue délibérément du processus de constitution de l’échantillon. On a recours à cette méthode en particulier lorsque la répartition de la valeur d’une variable auxiliaire est fortement déséquilibrée. Par exemple, la population peut être composée en grande partie de petits points de vente qui contribuent modestement au total des ventes. On peut alors décider d’exclure de la base de sondage les points de vente dont les ventes sont les plus faibles. Étant donné qu’elles reposent sur une sélection non aléatoire, les méthodes non probabilistes produisent généralement des estimations plus ou moins biaisées. Pourtant, des études empiriques réalisées par le Bureau statistique des Pays-Bas montrent que les méthodes de sélection non probabilistes ne donnent pas forcément de moins bons résultats, en termes d’erreur quadratique moyenne, que les techniques de tirage aléatoire (De Haan, Opperdoes, and Schut, 1997).

11.20 Pour un plan de sondage donné, on peut en général réduire la variance d’échantillonnage de l’estimation de l’IPC (portant sur tous les produits):

  • en élargissant les échantillons de ménages, de produits et de points de vente;

  • en stratifiant de manière appropriée les diverses populations (par exemple, en groupant les produits dont les prix ont suivi une évolution similaire).

11.21 Il importe que les ressources disponibles soient réparties au mieux à l’intérieur des différents échantillons et entre ces échantillons. En effet, une mauvaise répartition risque d’entraîner de lourdes erreurs d’échantillonnage qui pourraient être évitées. D’après les résultats de l’étude suédoise concernant l’estimation de la variance, qui sont présentés par Dalén et Ohlsson (1995), l’erreur résultant du mode d’échantillonnage des produits est relativement grande par rapport à l’erreur résultant de l’échantillonnage des points de vente. Dans ce cas, il convient d’accroître la taille de l’échantillon de produits et de réduire celle de l’échantillon de points de vente.

11.22 Une analyse systématique de la variance d’échantillonnage permet d’en diminuer le coût. On considère en général que la constitution optimale des échantillons comporte deux aspects: la détermination de la taille des échantillons de produits et de points de vente, et leur répartition entre strates de manière à réduire autant que possible la variance d’échantillonnage pour un IPC portant sur tous les produits, sous réserve que soit disponible le budget nécessaire.

11.23 On l’a vu, le registre du commerce n’est généralement pas une bonne base de sondage pour les points de vente, car il entraîne un dépassement du champ de l’enquête considérable. Il est recommandé d’établir une base de sondage appropriée en énumérant les principaux points de vente à l’intérieur de chaque municipalité prise en compte dans l’enquête. De cette manière, on obtient une liste de tous les points de vente par municipalité, complétée par les groupes de produits correspondant à chaque catégorie de point de vente. Une méthode moins onéreuse de composer une base de sondage des points de vente consiste à demander aux enquêteurs—dont on peut supposer qu’ils connaissent bien la situation locale—d’établir une liste des points de vente où les ménages effectuent leurs achats.

11.24 Les populations de produits et de points de vente changent continuellement. La composition de la plupart des groupes de produits n’est pas constante dans le temps, car certains produits disparaissent du marché alors que de nouveaux produits font leur apparition. Le passage du temps joue aussi un rôle perturbateur pour ce qui est de la population de points de vente: certains points de vente ferment, provisoirement ou définitivement, d’autres ouvrent, et l’importance relative de chacun peut diminuer ou s’accroître. Pour que les échantillons de produits et de points de vente restent représentatifs des habitudes d’achat des ménages, il convient de les revoir et de les actualiser périodiquement.

11.25 Les erreurs de réponse causées par la sousdéclaration de certaines catégories de dépenses des ménages peuvent être corrigées au moyen d’estimations établies à partir de données sur la production tirées des comptes nationaux (voir l’exemple donné par Linder (1996)). Il est possible de réduire les erreurs de mesure commises par les agents collecteurs de prix en leur fournissant des petits ordinateurs manuels sur lesquels ils peuvent saisir les données qu’ils relèvent. De cette manière, les prix observés peuvent être validés sur place (c’est-à-dire au point de vente même) par une comparaison automatique du prix courant observé avec le prix observé précédemment et avec les prix observés dans d’autres points de vente (en fixant des seuils et des plafonds appropriés). Pour une analyse plus détaillée, voir Haworth, Fenwick, and Beaven (1997).

11.26 Il est utile de nommer des superviseurs chargés de procéder à des vérifications ponctuelles de la qualité du travail des agents collecteurs de données. De même, il est bon d’organiser régulièrement des réunions où les agents collecteurs de prix et les statisticiens du bureau central peuvent discuter de leurs expériences respectives. Les statisticiens peuvent ainsi rester en contact avec ce qui se passe sur le terrain et mettre à profit cette occasion pour informer les agents des erreurs commises le plus souvent lors de la collecte des prix et des nouveaux produits représentatifs.

11.27 Il importe de s’assurer que les prix relevés ne sont pas entachés par des erreurs de traitement et, le cas échéant, de corriger ces erreurs lorsque cela est possible. C’est ce qu’on appelle la vérification des données. Lorsque cette vérification porte sur des observations considérées individuellement, il s’agit de microvérification. Lorsqu’il est souhaitable de limiter les ressources consacrées à la vérification des données tout en maintenant un niveau élevé de qualité des données, il est possible de procéder à une vérification sélective ou à une macrovérification. La vérification sélective est une microvérification classique qui comporte un nombre de vérifications réduit au strict minimum. Seules sont effectuées les vérifications qui influent sur les résultats de l’enquête. La macrovérification suit une méthode descendante: les vérifications sont effectuées sur des données agrégées (par exemple, les indices de prix d’un groupe de produits) plutôt que sur des données individuelles (par exemple, les prix relevés). On ne procède alors à une microvérification que si la macrovérification fait apparaître des données douteuses. Il convient en particulier de surveiller la présence de valeurs aberrantes parmi les données observées.

11.28 Une non-réponse entraîne généralement un biais de sélection. Il existe trois manières de traiter les prix manquants. Premièrement, le prix en question peut être retiré de l’ensemble de prix utilisé précédemment, de manière que cet ancien ensemble corresponde à l’ensemble de prix courants. Deuxièmement, on peut faire correspondre les deux ensembles de prix en utilisant un prix imputé (ou artificiel) à la place du prix manquant. Le prix imputé peut être calculé soit par simple report du prix observé précédemment ou en faisant évoluer le prix observé précédemment en fonction de l’évolution des autres prix pour le même produit. Troisièmement, on peut repondérer l’échantillon. Dans ce cas, il s’agit d’accroître la pondération donnée aux prix des points de vente qui ont répondu à l’enquête afin de compenser les prix manquants.

11.29 Dans le cas des enquêtes sur les dépenses des ménages, les données manquantes sont généralement imputées à l’aide des informations dont on dispose sur le même ménage pour une période d’observation précédente ou sur d’autres ménages pour la même période d’observation. Pour réduire le biais que les nonréponses sélectives engendrent dans la structure moyenne des dépenses, l’échantillon de ménages utilisé dans l’enquête sur les dépenses des ménages est en général stratifié a posteriori en fonction de plusieurs caractéristiques des ménages, telles que le revenu, la composition et la taille.

Types de biais

11.30 La présente section examine plusieurs catégories d’erreur, concernant soit la détermination des prix soit la construction de l’indice, qui peuvent entraîner un biais dans l’IPC global. Nous nous attacherons ici à catégoriser les erreurs, en évoquant au passage leur importance estimée, mais en laissant de côté les méthodes à utiliser pour les réduire ou les éliminer. On peut se demander pourquoi il est nécessaire d’aborder ce sujet ici, puisque des questions telles que les changements de qualité et les méthodes à utiliser pour en corriger les effets sur le calcul de l’IPC sont traitées sur le plan tant conceptuel qu’opérationnel dans d’autres chapitres.

11.31 La raison pour laquelle il y a lieu de traiter à part la question des biais dans le calcul de l’IPC est que, au milieu des années 90, les problèmes posés par la mesure des prix ont commencé à susciter un intérêt considérable. Aux États-Unis en particulier, l’idée s’est répandue que l’IPC comprenait des biais positifs systématiques, car il n’était pas suffisamment tenu compte de la substitution des consommateurs, de l’amélioration de la qualité des produits ni de l’apparition de nouveaux produits et services. En outre, on s’est rendu compte que, premièrement, l’existence de ces surestimations avait des implications fondamentales pour la mesure des tendances récentes de la production et de la productivité, et, deuxièmement, que l’élimination de ces surestimations pouvait grandement améliorer la situation budgétaire de l’État en réduisant les dépenses publiques et en augmentant les recettes (voir, par exemple, Eldridge (1999) et Duggan and Gillingham (1999)). Ces découvertes ont entraîné la publication de toute une série d’études et de rapports sur les problèmes de mesure de l’IPC, qui étaient souvent accompagnés d’estimations ponctuelles du biais global.

11.32 Parmi les principales études quantitatives du biais, on peut citer celles qui ont été réalisées par la Commission consultative pour l’étude de l’IPC (Sénat des États-Unis, 1996), L’Office du budget du Congrès (1994), Crawford (1998), Cunningham (1996), Dalén (1999a), Diewert (1996c), Lebow, Roberts, and Stockton (1994), Lebow and Rudd (2003), Shapiro and Wilcox (1997b), Shiratsuka (1999), White (1999), et Wynne and Sigalla (1994). Plusieurs offices statistiques ont réagi à ces travaux et donné leurs propres estimations, notamment Abraham et al. (1998), le Bureau des statistiques du travail des États-Unis (1998), Ducharme (1997), Edwards (1997), Fenwick (1997), Lequiller (1997), Moulton (1996b), et Moulton and Moses (1997). De nombreux autres travaux sur les biais dans le calcul de l’IPC sont rapportés par Baker (1998), Boskin et al. (1998), Deaton (1998), Diewert (1998a), Krueger and Siskind (1998), Nordhaus (1998), Obst (2000), OCDE (1997), Pollak (1998), Popkin (1997), et Triplett (1997).

11.33 Deux remarques s’imposent d’emblée en ce qui concerne les biais dans le calcul de l’IPC. Premièrement, cette question est en général examinée dans le contexte de l’indice du coût de la vie. Autrement dit, le biais inhérent à l’IPC est défini comme la différence entre le taux d’augmentation de l’IPC et le taux d’augmentation d’un indice véritable du coût de la vie. De nombreux auteurs de travaux sur les biais considèrent comme acquis que l’indice du coût de la vie devrait être l’objectif du calcul de l’IPC. On peut arriver à une conclusion un peu différente si l’on considère que l’indice visé est un indice de prix pur. En particulier, les avantages en termes de bienêtre qu’un consommateur tire de la diversification des produits qui lui sont offerts ou la faculté qu’il a de remplacer certains produits par d’autres à des prix relatifs croissants, peuvent être jugés insignifiants et, par conséquent, un indice qui ne tient pas compte de ces facteurs peut ne pas être considéré biaisé.

11.34 Deuxièmement, les biais de l’IPC se prêtent moins à une estimation rigoureuse que la variance. Étant donné que l’indice du coût de la vie ou tout autre indice idéal n’est pas observable, les analystes ont été obligés de s’en remettre à des hypothèses et à des généralisations tirées de données empiriques fragmentaires pour quantifier le biais. Les exceptions notables concernent le biais de substitution, des indices de Laspeyres classiques et des indices fondés sur des formules superlatives pouvant être calculés à partir des mêmes données de base sur les prix et les dépenses, et les différences interprétées comme la mesure de la surestimation liée à l’utilisation de la formule de Laspeyres.

11.35 Plusieurs classifications des biais sont apparues dans les études susmentionnées. Cependant, quatre catégories suffisent, qui correspondent grosso modo à celles qui sont proposées dans l’étude la plus connue, à savoir le Rapport final de la Commission consultative pour l’étude de l’IPC (de la Commission Boskin, créée en 1995 par la Commission des finances du Sénat des États-Unis). Ces catégories sont les suivantes: biais de substitution de niveau supérieur, biais d’agrégat élémentaire, biais dû au changement de qualité et aux nouveaux produits, et biais dû aux nouveaux points de vente.

11.36 Ces catégories peuvent être ventilées entre deux sous-groupes selon que le biais concerne la mesure des prix proprement dite ou le calcul des séries d’indices. Le biais dû au changement de qualité et aux nouveaux produits s’explique par le fait qu’il n’est pas tenu correctement compte de la valeur que le consommateur attache à certains produits et services qui apparaissent sur le marché (ou qui en disparaissent). Soulignons au passage que l’expression «nouveaux produits» fait référence à tous les produits, qu’il s’agisse de marchandises ou de services. Au niveau conceptuel, il peut être difficile de faire la distinction entre les deux types de biais. Sur le plan opérationnel, toutefois, le biais dû au changement de qualité a trait aux procédures suivies pour comparer les nouveaux produits ou modèles aux produits plus anciens qu’ils remplacent dans les échantillons servant de base au calcul de l’IPC. De manière générale, on peut considérer que le biais dû aux nouveaux produits s’applique à l’ensemble des nouveaux types de produits, c’est-à-dire aux produits qui n’auraient pas été inclus dans les échantillons lors du remplacement délibéré de certains produits. Le biais des nouveaux points de vente, parfois appelé «biais de substitution des points de vente», est similaire au biais dû aux nouveaux produits, mais il concerne l’apparition de nouveaux types de magasins ou de nouvelles méthodes de commercialisation qui permettent de faire baisser les prix ou d’accroître la qualité des produits.

11.37 Les autres catégories de biais ont trait aux procédures utilisées pour construire les indices à partir des séries de données. Comme cela est rappelé en divers points du présent manuel, on peut considérer que la construction d’un IPC s’opère en deux étapes ou à deux niveaux. Au niveau inférieur, les prix relevés sont combinés de manière à en tirer des indices de base; au niveau supérieur, les indices de base ainsi obtenus sont agrégés. À ces deux niveaux correspondent deux types de biais potentiels. Le biais d’agrégat élémentaire vient des formules utilisées pour calculer des moyennes à partir des prix relevés et en tirer des indices de base. Le biais de substitution de niveau supérieur concerne les formules utilisées pour combiner ces agrégats élémentaires et en tirer des indices de niveau supérieur. Ces composantes des biais potentiels ainsi que les méthodes utilisées pour les mesurer sont examinées en détail dans la section suivante.

Composantes des biais

Biais de substitution de niveau supérieur

11.38 Le biais de substitution de niveau supérieur est sans doute la source de biais la plus courante affectant le calcul de l’IPC, celle que les économistes connaissent le mieux pour l’avoir souvent rencontrée dans les manuels sur la théorie et la pratique de l’indice des prix. En résumé, ce biais apparaît lorsque l’IPC est obtenu par la formule de Laspeyres (voir chapitre 17), qui, on le sait, fournit une limite supérieure pour l’indice du coût de la vie si certaines hypothèses concernant le comportement des consommateurs sont respectées. Comme on l’a vu au paragraphe 11.34, on peut obtenir des mesures quantitatives du biais de substitution de niveau supérieur en comparant l’indice de Laspeyres à l’indice idéal de Fisher, à l’indice de Törnqvist ou à d’autres indices superlatifs. Si certaines hypothèses concernant par exemple les préférences constantes sont respectées, ces mesures donnent une estimation relativement précise du biais.

11.39Genereux (1983), Aizcorbe et Jackman (1993) procèdent à ce type de comparaisons d’indices et d’estimations du biais de substitution de niveau supérieur en se servant de séries réelles d’indices de l’IPC, respectivement pour le Canada et les États-Unis. D’autres études, plus anciennes, de Braithwait (1980), de Manser and McDonald (1988) estiment le biais de substitution d’indices des comptes nationaux des États-Unis. À la place d’indices superlatifs, Braithwait utilise des indices estimatifs du coût de la vie véritable fondés sur une estimation du système de demande. Une estimation similaire est fournie par Balk (1990) pour les Pays-Bas. Ces études démontrent l’existence constante d’un biais positif de la formule de Laspeyres. Les biais des variations annuelles des indices pour les différentes années sont relativement faibles (0,1 à 0,3 point de pourcentage en moyenne) et dépendent de façon empirique de facteurs tels que l’éloignement par rapport à la période de base de l’indice de Laspeyres, le degré de détail de l’indice auquel les différentes formules sont appliquées et le fait que l’indice superlatif est un indice à base fixe ou un indice-chaîne.

11.40 Les principales différences entre les indices de Laspeyres et les indices superlatifs découlent de la variation des prix relatifs au cours de la période faisant l’objet de la comparaison et de la modification des quantités consommées au profit des catégories d’indices dont les prix relatifs ont diminué. On peut en tirer plusieurs conclusions:

  • Si l’évolution de l’indice est caractérisée par un mouvement continu et uniforme des prix relatifs dans le temps, accompagné de mouvements de la consommation, le biais annuel de l’indice de Laspeyres sera d’autant plus accentué que l’éloignement sera grand par rapport à la période de base. (Greenlees (1997) note, toutefois, qu’on ne constate guère l’existence de ce phénomène aux États-Unis; voir aussi Szulc (1983)).

  • Dans les mêmes conditions, la diminution de l’intervalle de chaînage des pondérations des dépenses réduira le biais de substitution de niveau supérieur de l’IPC de Laspeyres. Un chaînage à intervalles plus rapprochés accroîtra la pondération des indices dont les prix relatifs baissent, ce qui réduira le taux d’augmentation de l’IPC. Inversement, en cas de fortes amplitudes des mouvements de l’indice relatif, un chaînage à intervalles rapprochés peut entraîner un biais positif de chaînage de l’indice de Laspeyres.

  • Le biais de substitution de niveau supérieur sera en général plus accentué pendant les périodes de forte inflation, si ces périodes sont aussi caractérisées par une plus grande variation des prix relatifs. Cependant, on ne dispose guère d’observations probantes à cet égard.

11.41 Le concept de biais de substitution de niveau supérieur a été défini et examiné dans le contexte de la théorie de l’indice du coût de la vie, mais un biais équivalent peut être défini du point de vue de l’indice de prix pur. Si l’on juge préférable l’indice idéal de Fisher ou un autre indice superlatif parce qu’il traite de façon symétrique les habitudes de dépenses pendant la période de base et la période courante, alors la différence entre cet indice et un indice de Laspeyres pourrait être interprétée comme une mesure du biais de représentativité. Un raisonnement similaire peut être appliqué au biais de substitution de niveau inférieur à l’intérieur des cellules des indices élémentaires.

11.42 Récemment, Lebow et Rudd (2003) ont défini et estimé une autre catégorie de biais afférent au niveau supérieur d’agrégation. Ils concluent que les pondérations utilisées dans les enquêtes sur les dépenses de consommation pour le calcul de l’IPC aux États-Unis comportaient des erreurs en raison, par exemple, de la sous-déclaration des dépenses consacrées à l’alcool et au tabac. Il en résulterait un biais de pondération si les erreurs de pondération relative étaient corrélées à des changements des indices élémentaires. (Les problèmes liés à l’estimation des pondérations des dépenses sont traités en détail au chapitre 4.)

Biais d’agrégat élémentaire

11.43 On peut diviser le biais d’agrégat élémentaire en deux composantes: le biais de formule et le biais de substitution de niveau inférieur. Un indice d’agrégat élémentaire entrant dans l’IPC est biaisé si l’on en attend autre chose que ce qu’il est censé mesurer. Le terme «biais de formule» (ou biais de forme fonctionnelle) est utilisé ici pour désigner la situation où la formule de l’indice élémentaire a un biais positif par rapport à l’indice de prix pur. Lorsque l’objectif est un indice du coût de la vie, la formule de l’indice élémentaire souffre d’un biais de substitution de niveau inférieur (ou biais de substitution à l’intérieur des strates) s’il ne rend pas compte des substitutions opérées par le consommateur entre les produits élémentaires contenus dans cette cellule d’indice. Ainsi, pour une formule d’indice élémentaire donnée, on peut distinguer les deux formes de biais en fonction de l’objectif de l’indice élémentaire.

11.44 Les chapitres 9 et 20 présentent les caractéristiques de différentes formules d’indice élémentaire. Il apparaît en particulier que la formule de Carli de la moyenne arithmétique des rapports de prix présente un biais positif par rapport à l’évolution tendancielle des prix moyens des produits élémentaires. Par conséquent, Eurostat a interdit l’utilisation de cette formule pour calculer l’indice des prix à la consommation harmonisé (IPCH). Les formules pondérées utilisées pour le calcul des indices de base de l’IPC des États-Unis comportaient certaines des caractéristiques de la formule de Carli avant la modification des procédures et modes de calcul en 1995 et 1996. Les problèmes qui se posent ainsi que les méthodes choisies pour y répondre sont examinés, par exemple, par Reinsdorf et Moulton (1997) et Moulton (1996b).

11.45 Le rapport des moyennes arithmétiques (Dutot) et la moyenne géométrique (Jevons) éliminent le biais de formule tel qu’il est défini ici, et sont tous deux autorisés par Eurostat. Cependant, les résultats qu’on peut en attendre diffèrent lorsque les prix des produits de base n’évoluent pas à un rythme uniforme. Les différences offrent une manière d’évaluer l’importance potentielle du biais de substitution de niveau inférieur. La formule de la moyenne géométrique est exacte pour un indice du coût de la vie si les consommateurs suivent le modèle de comportement Cobb–Douglas, alors que la formule fondée sur le rapport des moyennes arithmétiques correspond à un comportement de substitution nulle. Ainsi, s’il s’agit de trouver une valeur approchée de l’indice du coût de la vie, la moyenne géométrique est sans doute préférable.

11.46 À l’avenir, il sera peut-être possible, grâce aux lecteurs optiques, de collecter des données sur la consommation de chaque produit élémentaire à une fréquence journalière, hebdomadaire ou mensuelle, et d’utiliser ces données pour calculer les indices superlatifs. Pour le moment, il n’est pas possible de se servir de formules superlatives pour calculer les indices de prix élémentaires. Pour obtenir une valeur approchée de l’indice du coût de la vie, il est nécessaire de poser une hypothèse, fondée par exemple sur le modèle Cobb–Douglas. On notera que la substitution, dont, dans l’idéal, l’indice devrait rendre compte, porte sur le choix du consommateur entre tous les produits élémentaires de la cellule: produits différents, produits vendus dans des points de vente différents, produit conditionné et vendu en quantités différentes, même produit vendu à des moments différents de la période à laquelle se rapporte l’indice (voir Dalton, Greenlees, and Stewart (1998)). Ainsi, le degré approprié de substitution présumée devrait dépendre, en principe, des facteurs de variété au sein de la catégorie à laquelle appartient le produit élémentaire.

11.47 La méthode utilisée par l’organisme statistique pour composer l’échantillon de produits au sein d’une catégorie déterminera l’efficacité de la méthode choisie pour traiter le biais de substitution de niveau inférieur. Par exemple, si un seul produit est choisi pour représenter l’agrégat élémentaire, alors la formule d’indice ne rendra pas compte de la réaction du consommateur face à un changement de prix relatif dans l’univers des produits. D’une manière plus générale, l’indice fondé sur une formule de moyenne géométrique souffre d’une surestimation lorsque l’échantillon est restreint, de sorte que le biais de substitution de niveau inférieur risque d’être sous-estimé dans les comparaisons empiriques entre la moyenne géométrique et d’autres formules d’indice. White (1999) traite du rapport entre les erreurs d’échantillonnage et l’estimation du biais. Voir aussi McClelland and Reinsdorf (1999) au sujet du biais de la moyenne géométrique dû à la petite taille de l’échantillon.

11.48 L’effet du choix de la formule peut être estimé avec une certaine précision sur une période donnée. Cependant, le biais éventuel correspondant ne peut être estimé qu’en supposant que la moyenne géométrique ou une autre formule fonctionnelle fournit une valeur approchée satisfaisante de la mesure dont l’indice vise à rendre compte.

11.49 Comme l’impliquent les considérations qui précèdent, l’importance du biais d’agrégat élémentaire variera d’un pays à l’autre, en fonction des formules d’indice utilisées, du degré d’hétérogénéité des strates de l’indice et des méthodes d’échantillonnage employées. En outre, comme dans le cas du biais de substitution de niveau supérieur, le biais d’agrégat élémentaire variera en fonction du niveau global d’inflation dans l’économie si les variations des prix absolus et des prix relatifs sont corrélées.

11.50 L’efficacité d’une formule pour calculer un indice d’agrégat élémentaire dépendra aussi des méthodes utilisées par l’organisme statistique pour traiter les situations particulières, telles que l’indisponibilité temporaire des produits saisonniers et de certains autres produits. Armknecht et Maitland-Smith (1999) montrent comment, en n’utilisant pas de prix imputés, on risque de créer un biais dans la formule de Laspeyres modifiée, entre autres.

Biais dû au changement de qualité et aux nouveaux produits

11.51 Les biais qui peuvent affecter l’IPC en raison d’une prise en compte inadéquate des changements de qualité ont fait couler beaucoup d’encre. Par exemple, le rapport de la Commission Stigler sur les statistiques de prix des États-Unis (Price Statistics Review Committee, 1961) indique que «si l’on faisait un sondage auprès des économistes et statisticiens professionnels, il est très probable qu’ils désigneraient (et à une écrasante majorité) comme le plus grand défaut des indices de prix, le fait que ces indices ne tiennent pas pleinement compte des changements de qualité». Dans la plupart des études sur les biais, l’absence de mesure ou la mesure erronée du changement de qualité est le facteur qui contribue le plus à l’estimation du biais total. De la même manière que, de l’avis général, il est extrêmement difficile de tenir compte d’un changement de qualité, il est extrêmement difficile de mesurer le biais qui en résulte.

11.52 Contrairement au biais de substitution, qui peut être estimé par comparaison de différentes formules, le biais dû au changement de qualité doit être analysé par produit. Au fil du temps, les produits et les composantes correspondantes de l’indice subissent des changements de qualité extrêmement variés. De plus, les méthodes utilisées pour rendre compte de ces changements varient elles aussi. Ainsi, bien que la méthode du chaînage soit la plus fréquente, d’autres méthodes, telles que celle des coûts de production, la méthode hédonique ou les autres méthodes décrites aux chapitres 7 et 21, peuvent être utilisées pour des composantes importantes de l’indice.

11.53 Il faut être bien conscient du fait que le sens du changement global de qualité n’est pas forcément le même que celui du biais qui résulte de ce changement. Les profanes considèrent parfois que l’IPC ne tient guère ou pas du tout compte du changement de qualité et que, par conséquent, il surestime les changements de prix, compte tenu des nombreuses améliorations avérées de la qualité des produits et des services. En fait, pour tout indice élémentaire, la question qui se pose est de savoir si la méthode utilisée pour rendre compte de l’ajustement de la qualité surestime ou sous-estime la qualité relative des produits de substitution de l’échantillon de l’IPC. Le biais qui en résulte peut être soit positif soit négatif.

11.54 Les données empiriques sur les biais dus aux changements de qualité se fondent essentiellement sur l’extrapolation d’études menées sur certains produits. Ces études procèdent par exemple à une comparaison entre les indices hédoniques et les séries d’IPC correspondantes ou à une estimation de la valeur de l’amélioration de certains produits dont il n’est pas tenu compte dans le calcul de l’IPC. Même si, pour la plupart, ces études concluent à un biais positif, l’utilisation de données fragmentaires est critiquée par certains observateurs, qui font remarquer que des baisses avérées de qualité n’ont pas fait l’objet d’une analyse systématique.

11.55 Dans le cas des services en particulier, l’évolution globale de la qualité peut aussi donner lieu à une évaluation subjective. En effet, les progrès technologiques ont permis des améliorations indiscutables de la qualité de nombreux biens de consommation durables et d’autres produits. En revanche, dans les secteurs de la poste, des transports publics et des soins médicaux, il peut être difficile d’évaluer les changements de qualité. Par exemple, en quelques décennies, les transports aériens sont devenus plus sûrs et plus rapides, mais peutêtre moins confortables et moins fiables, et le manque de variations croisées de ces caractéristiques rend problématique le recours à un ajustement de la qualité par la méthode hédonique.

11.56 Le biais dû aux nouveaux produits peut, comme le biais d’agrégat élémentaire, être divisé conceptuellement en deux composantes. La première tient au fait que les nouveaux produits ne sont pas inclus assez rapidement dans l’échantillon de l’IPC. Cela peut entraîner un biais positif si, par la suite, ces nouveaux produits accusent de fortes baisses de prix dont l’indice ne tient pas compte. La seconde composante tient à l’avantage en termes de bien-être que tire le consommateur de l’apparition d’un nouveau produit sur le marché. Cependant, on peut considérer qu’il ne s’agit pas là d’un biais lorsque l’indice du coût de la vie n’est pas reconnu comme objectif du calcul de l’IPC.

11.57 Comme on l’a vu au chapitre 8, par «nouveaux produits», on peut entendre: des produits qui remplacent des articles moins modernes, par exemple les disques compacts qui ont remplacé les disques microsillons et les cassettes audio; des variétés de produits qui élargissent le choix du consommateur, telles que les bières d’importation ou les restaurants étrangers; ou les produits qui représentent des catégories de consommation entièrement nouvelles, telles que les fours à micro-ondes ou les téléphones mobiles.

11.58 Comme dans le cas du biais dû au changement de qualité, le biais dû aux nouveaux produits est parfois estimé essentiellement par généralisation d’observations sur un produit particulier. Souvent, on mesure la variation du prix d’un produit ou d’une catégorie au cours d’une période précédant son inclusion dans l’échantillon de l’IPC. Des études réalisées par Hausman (1997, 1999) sur les céréales de petit-déjeuner et les téléphones cellulaires ont permis d’obtenir des mesures quantitatives de l’avantage supplémentaire apporté au consommateur par les nouveaux produits, mais cette approche économétrique compliquée n’est pas très courante. L’estimation du biais dû aux nouveaux produits, notamment les denrées alimentaires, par la Commission Boskin était nécessairement fondée en partie sur des suppositions.

11.59 Enfin, comme le biais dû au changement de qualité, le biais dû aux nouveaux produits peut être négatif si l’éventail de produits rétrécit, si des biens de consommation de valeur disparaissent du marché ou si l’indice ne rend pas compte des phases de hausse rapide des prix des produits. La plupart des observateurs considèrent cependant que le biais est «positif» et que la seule incertitude concerne son ampleur.

Biais dû aux nouveaux points de vente

11.60 Sur le plan conceptuel, le biais dû aux nouveaux points de vente est identique au biais dû aux nouveaux produits. Il trouve son origine dans le fait que les changements de prix dans les nouveaux points de vente non encore inclus dans l’échantillon ou l’amélioration du bien-être du consommateur consécutif à l’ouverture des nouveaux points de vente ne sont pas pris en compte. Le biais dû aux nouveaux points de vente est classé dans une catégorie distincte pour deux raisons. La première est historique: ce type de biais a été identifié par Reinsdorf (1993) comme une importante explication potentielle des mouvements anormaux de l’IPC des États-Unis. La deuxième raison est que les méthodes utilisées pour comparer les points de vente et tirer l’échantillon diffèrent de celles qui sont utilisées pour les produits; en outre, l’ajustement rendu nécessaire par ce type de biais pose des problèmes un peu différents.

11.61 Si l’échantillon de points de vente n’est pas maintenu à jour, un biais peu apparaître du fait que les nouveaux points de vente diffèrent par leur politique de prix ou leur mode de prestation de services. Reinsdorf (1993) s’est intéressé par exemple au développement des magasins de vente au rabais. Il convient toutefois de noter que le problème pourrait aussi être d’ordre géographique; il importe en effet d’utiliser, pour les points de vente, des bases de sondage qui tiennent compte à la fois de l’implantation traditionnelle des magasins et des nouvelles implantations.

11.62 L’une des voies par lesquelles les nouveaux produits entrent dans l’échantillon de l’IPC est le remplacement forcé, qui a lieu lorsque certains produits disparaissent des rayons parce qu’ils sont obsolètes ou n’ont pas le succès escompté. Les points de vente disparaissent moins fréquemment et les offices statistiques ne disposent pas toujours de procédure de remplacement automatique. En outre, lorsqu’un nouveau point de vente est ajouté à l’échantillon, il n’existe aucune procédure standard pour comparer les données afférentes aux nouveaux et aux anciens points de vente. Dans ces conditions, l’indice ne rendra pas compte des effets, par exemple, d’une baisse des prix ou de la qualité dans le nouveau point de vente.

11.63Reinsdorf (1993) estimait l’ampleur du biais dû aux nouveaux points de vente en comparant les prix moyens des points de vente ajoutés aux échantillons de l’IPC aux États-Unis et de ceux qui en étaient supprimés. Cependant, la mesure ou l’évaluation par le consommateur de la qualité des points de vente n’a guère été étudiée de façon empirique. Par conséquent, il existe peu de données empiriques sur lesquelles se fonder pour apprécier l’exactitude des estimations du biais dû aux nouveaux points de vente.

Estimations du biais: présentation sommaire

11.64 La Commission Boskin de 1996 plaçait le biais total positif de l’IPC des États-Unis dans une fourchette estimative de 0,8 à 1,6 point de pourcentage, l’estimation ponctuelle étant de 1,1 point. Ce biais total est obtenu par la simple addition des différents biais estimatifs. Cependant, comme l’indique le General Accounting Office des États-Unis (2000), la modification des méthodes utilisées après 1996 pour calculer l’IPC a amené les membres de la Commission Boskin à revoir en baisse leurs estimations du biais total. La plupart de ces études s’appuient sur l’additivité des biais, principe qui reste valable jusqu’à preuve du contraire. Shapiro et Wilcox (1997b) fournissent des distributions de probabilité ainsi que les corrélations de leurs différents biais estimatifs, ce qui permet de définir un intervalle de confiance global pour le biais total. La plupart des études détaillées sur les biais arrivent à la conclusion que le biais de l’IPC est un biais positif, même si de nombreux observateurs le contestent.

11.65 Il apparaît que les offices statistiques ne peuvent pas calculer ni publier des estimations du biais de l’IPC de façon régulière. Un grand nombre des obstacles qui empêchent l’élimination de ce biais sont aussi ceux qui en compliquent l’estimation, à savoir le manque de données complètes sur les préférences et le comportement des consommateurs, leurs dépenses par produit, ainsi que sur l’impossibilité d’observer et d’évaluer toutes les différences de qualité entre les produits du marché. En l’absence de ces informations, il est impossible de calculer un indice du coût de la vie véritable, de même qu’il est impossible de mesurer l’écart entre son taux de croissance et celui de l’IPC.

11.66 Les offices de statistique sont peu enclins à fournir leurs propres estimations du biais de l’IPC. Dans certains cas, ils concèdent l’existence d’un biais de substitution, en admettant qu’en raison de l’utilisation d’une formule de Laspeyres, l’IPC a tendance à exagérer les variations de prix par rapport à un indice du coût de la vie. En revanche, les offices de statistique rechignent à ne serait-ce que tirer des conclusions qualitatives des données empiriques fragmentaires et spéculatives sur les biais dus aux changements de qualité, aux nouveaux produits et aux nouveaux points de vente.

Conclusion

11.67 Pour que l’IPC bénéficie de la confiance du public, il conviendrait de publier une description détaillée et à jour des méthodes et des sources de données utilisées. Ces informations devraient indiquer, entre autres, les objectifs et le champ de l’indice, le détail des pondérations et, ce qui serait tout aussi important, un commentaire sur l’exactitude de l’indice. Une description de l’origine et de l’ampleur des erreurs d’échantillonnage et des autres erreurs (couverture, taux denon-réponse, etc.) fournirait aux utilisateurs des informations précieuses sur les limites éventuelles de l’indice. À cet égard, on peut citer l’exemple du manuel sur les méthodes de calcul de l’IPC, publié par le Bureau des statistiques du travail des États-Unis, qui consacre une section aux divers types d’erreur qui peuvent affecter le calcul de l’IPC.

    Other Resources Citing This Publication