Chapter

11. Erreurs, variances et biais dans le calcul de l’IPP

Author(s):
International Monetary Fund
Published Date:
September 2009
Share
  • ShareShare
Show Summary Details

A. Introduction

11.1 Un certain nombre de causes d’erreurs, de variances ou de biais ont été décrites dans les chapitres précédents et seront abordées de nouveau dans les chapitres suivants. Le présent chapitre a pour objet de les récapituler pour en donner une vue d’ensemble. Les problèmes d’ordre théorique et pratique seront abordés. Pour bien comprendre les limites d’un IPP, il faut prendre en considération les données requises, la manière dont elles sont recueillies et la manière dont elles sont utilisées pour obtenir une mesure globale récapitulative de l’évolution des prix. Le calcul de l’IPP n’est pas une tâche anodine et tout effort pour en améliorer la précision doit être précédé d’une analyse coût–avantage. Il peut être nécessaire, dans certains cas, de prendre en compte les demandes des utilisateurs qui doivent être satisfaites pour répondre à des besoins précis ou rehausser la crédibilité de l’indice, même si l’amélioration de la précision de l’indice est relativement limitée au regard de son coût.

11.2 Le graphique 11.1 résume les causes possibles d’erreurs, de variance ou de biais dans le calcul de l’IPP. La distinction entre erreurs, variance et biais est cependant expliquée dès la section B. Au stade de l’échantillonnage, par exemple, le choix de la base de sondage (par exemple, un mode d’échantillonnage fondé sur un seuil d’inclusion—voir chapitre 5) peut biaiser l’échantillon en faveur des plus gros établissements, car les variations moyennes des prix de leurs produits sont plus faibles que les variations moyennes de l’ensemble des établissements. Par contre, il se peut qu’un échantillon non représentatif comportant une quantité disproportionnée de gros établissements soit retenu par hasard et qu’il inclue aussi des prix en moyenne inférieurs à ceux de l’ensemble des établissements. Il s’agit dans ce cas d’une variance puisqu’il y a autant de chances pour que l’on retienne un échantillon dont la variation moyenne des prix est plus marquée que celle de l’ensemble des établissements.

Graphique 11.1.Aperçu des sources d’erreurs et de biais

11.3 L’analyse des biais, variances et erreurs exige en premier lieu l’examen de la base théorique sur laquelle repose l’IPP et de l’emploi qui en est fait. Cela déterminera un certain nombre de décisions, concernant notamment la couverture ou le domaine de l’indice et le choix de la formule. Erreurs, variances et biais peuvent survenir si la couverture, le mode de calcul de l’indice et le choix de l’échantillon ne répondent pas à une nécessité conceptuelle. Cette question est abordée à la section C. À la section D, nous analysons les sources de variance et de biais au stade de l’échantillonnage des transactions. L’échantillonnage des prix des produits élémentaires pour le calcul de l’IPP se fait en deux étapes: échantillonnage des établissements, puis des produits élémentaires produits (ou achetés) par ces établissements. Des biais peuvent se développer si les établissements ou les produits sélectionnés présentent, en moyenne, des variations de prix inhabituelles, éventuellement à cause d’omissions dans la base de sondage ou à cause d’une sélection biaisée au sein de la base de sondage. Comme déjà indiqué ci-dessus et au chapitre 5, la variance d’échantillonnage se produit même si la sélection est faite au hasard à partir d’une base de sondage non biaisée et elle est d’autant plus importante que la taille de l’échantillon diminue et que la variance des prix augmente. La variance d’échantillonnage est imputable simplement au fait que l’estimation d’un IPP se fonde sur des échantillons et non pas sur l’ensemble des unités de la population concernée. Les variances et biais dont il est question à la section D sont ceux liés à la constitution de l’échantillon. À la section E, nous nous intéressons davantage aux effets des variances d’échantillonnage et biais de sélection sur les comparaisons ultérieures de prix appariés.

11.4 Dès qu’il est établi, l’échantillon d’établissements et de produits élémentaires commence à se périmer et devient de moins en moins représentatif. L’étendue et la nature du biais varient selon le secteur d’activité. À la section E, nous nous intéressons à l’effet sur un échantillon statique et fixe des changements dynamiques qui interviennent dans l’univers des établissements et des produits élémentaires. La mise à jour de l’échantillon permet de renouveler la liste des produits élémentaires, tandis que le changement de base peut permettre de constituer un nouvel échantillon de produits élémentaires et d’établissements. Certains établissements peuvent fermer et la fabrication de certains produits élémentaires peut être interrompue, de façon temporaire ou définitive. La mise à jour et le remplacement des établissements facilitent l’échantillonnage, encore qu’il n’y ait remplacement que lorsqu’un établissement vient à manquer. La mise à jour a pour objet d’inclure dans l’échantillon un nouvel établissement majeur. Ce processus est plus complexe, car le schéma de pondération du secteur d’activité ou de l’indice doit alors être modifié (chapitre 8). Lorsqu’il manque des prix de produits élémentaires, l’échantillon peut cesser d’être représentatif. On peut alors avoir recours à des prix imputés, mais cela ne contribue en rien à la reconstitution de l’échantillon. En fait, les imputations diminuent la taille de l’échantillon réel, amplifiant de ce fait même la variance d’échantillonnage. Une autre solution consiste à introduire des produits élémentaires de rechange comparables ou des substituts, en ajustant la qualité comme il convient. Les mêmes problèmes que ceux décrits ci-dessus s’agissant de l’inclusion de nouveaux établissements se posent lorsque l’on introduit de nouveaux produits substantiellement différents, aussi en fait-on souvent abstraction jusqu’à ce qu’on décide de changer de période de référence. Et même alors, leur inclusion est très problématique (chapitre 8).

11.5 Dans les paragraphes précédents, nous avons traité de la manière dont les établissements et les produits élémentaires manquants peuvent biaiser l’échantillonnage ou amplifier la variance d’échantillonnage. Toutefois, la procédure normale de relèvement des prix fondée sur la méthode de l’appariement des modèles peut, elle aussi, apporter son lot d’erreurs, variances ou biais si les prix relevés et enregistrés sont différents de ceux vraiment pratiqués. Ces erreurs de réponse, ainsi que les erreurs et les biais découlant du mode de traitement des produits élémentaires et des biens manquant à titre temporaire ou permanent sont décrits à la section F comme des erreurs et des biais de mesure des prix. La section F porte sur les lacunes des méthodes utilisées pour remplacer les établissements et les produits élémentaires manquants afin que la méthode de l’appariement des modèles puisse continuer d’être appliquée, tandis que la section E porte sur l’effet qu’ont ces établissements et produits élémentaires manquants sur l’efficacité de la procédure d’échantillonnage.

11.6 Les biais de substitution constituent la dernière cause de biais. Les propriétés des différentes formules décrites aux chapitres 15 à 17 varient et chaque formule produit des effets différents selon le système de pondération retenu et la méthode d’agrégation. Au niveau plus élevé, où les pondérations sont utilisées, il a été démontré que des effets de substitution sont inclus dans les formules de calcul des indices superlatifs, mais exclus dans la formule de Laspeyres traditionnelle (chapitre 15). Des considérations similaires ont été analysées à un niveau inférieur. Quant à savoir s’il est souhaitable ou non d’inclure ces effets, tout dépend des fondements conceptuels de l’indice adopté. Si l’on s’en tient à une période de référence fixe, ces effets sont gommés, tandis qu’une approche économique fondée sur le coût de la vie économique (chapitres 17 et 20) les inclurait. Les concepts mentionnés au graphique 11.1 peuvent être utilisés pour régler certains problèmes de définition comme la couverture, le mode de calcul et l’échantillonnage ainsi que des problèmes de mesure des prix comme l’ajustement de la qualité et l’inclusion de nouveaux biens et de nouveaux établissements.

11.7 Il est utile d’énumérer les principales causes d’erreurs, de variances ou de biais:

  • i) couverture et méthode de calcul inappropriées (section C);

  • ii) variance d’échantillonnage et biais de sélection; y compris

    • a) la constitution initiale de l’échantillon (section D),

    • b) les effets des produits élémentaires et des établissements manquants sur la variance d’échantillonnage et le biais de sélection (section E);

  • iii) mesure des prix appariés (section F); y compris

    • a) erreurs de réponse/biais,

    • b) biais d’ajustement de la qualité,

    • c) biais dus aux nouveaux produits,

    • d) biais dus aux nouveaux établissements;

  • iv) biais (de substitution) dus à la formule (section G); y compris

    • a) la substitution de produits élémentaires et d’établissements au niveau supérieur,

    • b) la substitution de produits élémentaires et d’établissements au niveau inférieur.

11.8 Il est impossible d’établir quelles sont les causes les plus graves. Dans certains pays et dans certains secteurs d’activité, en raison de la différenciation croissante des produits élémentaires et de la rapidité des changements technologiques, il est difficile de maintenir un échantillon apparié de bonne taille qui soit représentatif, et l’ajustement de la qualité ainsi que l’utilisation d’indices chaînes ou hédoniques pourraient être indiqués. Dans d’autres pays, la couverture limitée de certains secteurs économiques où l’IPP est utilisé peut être le principal problème. Les lacunes de la base de sondage d’établissements peuvent également être un sujet de préoccupation.

11.9 À l’exception de Berndt, Griliches et Rosett (1993), peu d’ouvrages ont été publiés sur la nature et la portée des erreurs, variances et biais dans la mesure de l’IPP. Toutefois, la documentation sur le rôle qu’elles peuvent jouer dans la mesure de l’IPC est substantielle. Diewert (1998a et 2002c) et Obst (2000) analysent ces erreurs, variances ou biais, et fournissent en outre une bibliographie importante. Une bonne partie de cette documentation porte sur des problèmes qui s’appliquent autant à l’IPP qu’à l’IPC.

B. Erreurs, variances et biais

11.10 Dans la présente section, nous établissons la distinction qui s’impose entre une erreur et un biais. Cette distinction est particulièrement pertinente lorsqu’il est question d’échantillonnage, même s’il sera démontré que l’analyse vaut aussi pour les erreurs et les biais qui ne sont pas liés à l’échantillonnage. Pourtant, une erreur ou un biais peut aussi s’analyser en fonction du degré de correspondance entre une mesure existante et un concept d’IPP «véritable», degré qui varie selon la conception retenue, laquelle dépend elle-même de l’utilisation ou des utilisations qu’on entend faire de la mesure. Nous aborderons ces questions tour à tour.

B.1 Variance d’échantillonnage et biais de sélection

11.11 Prenons le relevé d’un échantillon aléatoire de prix dont la moyenne globale de la population (moyenne arithmétique) est μ1. L’estimateur est le moyen utilisé pour procéder à l’estimation de μ en s’appuyant sur les données de l’échantillon. Un estimateur approprié de μ serait la moyenne d’un échantillon tiré au sort. L’estimation est la valeur obtenue en utilisant un échantillon donné et une méthode d’estimation précise, disons x1¯, la moyenne de l’échantillon. La moyenne de la population μ, par exemple, peut être 20, mais la moyenne arithmétique de l’échantillon d’une taille donnée constitué selon une méthode précise peut être 19. Cette variance n’est pas un biais, car elle découle simplement du fait que, par pur hasard, l’échantillon tiré au sort comportait des prix inférieurs à la moyenne. Si un nombre infini d’échantillons de taille suffisamment importante étaient constitués, la moyenne des moyennes de l’échantillon x1¯,x2¯,x3¯, serait en principe égale à μ. On dit alors de l’estimateur qu’il est non biaisé. Dans le cas contraire, on dit qu’il est biaisé. La variance due au fait que x1¯ est différent de μ = 20 ne découle pas d’une sous-estimation ou d’une surestimation systématique imputable à la manière dont l’échantillon a été constitué et la moyenne calculée. Si un nombre infini de ces estimations était calculé et récapitulé, on ne constaterait aucune erreur, car l’estimateur n’est pas biaisé et l’anomalie fait partie de la variance d’échantillonnage habituelle à laquelle il faut s’attendre2.

11.12 Il convient de souligner que tout échantillon peut engendrer un résultat inexact, même si les méthodes utilisées pour le constituer et calculer l’estimation sont en moyenne non biaisées. Les améliorations apportées à la constitution de l’échantillon, l’augmentation de sa taille et la diminution de la variabilité des prix (description plus détaillée des prix constituant la base de prix) entraîneront une diminution de la variance, et la portée de ces améliorations sur la précision probable de l’échantillon est mesurable. Notons que la précision de ces estimations est mesurée principalement au moyen d’intervalles de confiance, zones situées entre la plus grande et la plus petite valeur possibles où μ se situera vraisemblablement. Les plus petites valeurs pour une probabilité donnée sont considérées comme des estimations plus précises. Il est dans l’intérêt des agences de statistiques de constituer leur échantillon et d’utiliser des estimateurs d’une manière qui mène à des estimations plus précises.

11.13 Le calcul de ces intervalles exige une mesure de la variation de l’IPP intégrant toutes les sources de la variance d’échantillonnage. Cependant, l’échantillonnage des prix suppose l’échantillonnage préalable des établissements et des produits élémentaires et de manière générale, les méthodes probabilistes ne sont pas utilisées à chaque étape. Une démarche fondée sur l’appréciation ou sur la méthode de l’échantillonnage par seuil d’inclusion est souvent considérée comme plus pratique et demande moins de ressources. L’estimation de la variance, toutefois, exige la constitution d’échantillons probabilistes à toutes les étapes. Malgré tout, il est possible d’établir des mesures partielles (conditionnelles) en ne quantifiant qu’une seule source de variabilité (voir Balk and Kerston, 1986, pour un exemple applicable aux IPC). Des méthodes de substitution pour constituer des échantillons non probabilistes sont décrites dans Särndal, Swensson, and Wretman (1992).

11.14 Des gains d’efficacité (variance d’échantillonnage moins importante) peuvent être réalisés pour un échantillon d’une taille donnée et une variance de population donnée en utilisant de meilleurs plans de sondage (méthodes de sélection de l’échantillon) comme indiqué au chapitre 5. Il arrive tout de même que les probabilités de sélection réelles s’écartent des probabilités de sélection spécifiées dans le plan de sondage. Les erreurs découlant de ces écarts sont appelées biais de sélection.

11.15 Si un estimateur non biaisé peut donner des résultats imprécis, surtout si les échantillons utilisés sont petits, un estimateur biaisé peut donner des résultats assez précis. Prenons pour exemple la méthode consistant à n’échantillonner que les grands établissements. Supposons que les prix pratiqués par ces établissements soient en moyenne inférieurs à μ, mais tenons pour acquis que ces grands établissements représentent une forte proportion des recettes du secteur d’activité en cause, alors la moyenne des estimations de tous les échantillons possibles m peut être très proche de μ, même si les établissements plus petits pratiquent des prix différents. Cependant, la différence entre m et μ serait systématique et généralement prévisible. En moyenne, m excédera μ, le biais3 étant égal à (μ – m).

B.2 Erreurs et biais non liés à l’échantillonnage

11.16 Le cadre décrit précédemment pour faire la distinction entre erreurs et biais est aussi pertinent pour les erreurs non liées à l’échantillonnage. Si, par exemple, les prix des produits élémentaires sont inexactement enregistrés, il s’ensuivra une erreur de réponse. S’il s’agit d’erreurs non systématiques, les prix enregistrés sont excessifs dans certains cas, mais, en contrepartie, d’autres sont inférieurs à ce qu’ils devraient être. Globalement, les erreurs dans un sens devraient annuler celles dans l’autre et l’erreur nette, en moyenne, devrait être marginale. Toutefois, si les établissements sélectionnés et maintenus dans l’échantillon sont plus anciens et produisent à des prix plus élevés (ajustés en fonction de la qualité) que les établissements équivalents plus récents dotés de technologies plus avancées, on est en présence d’un biais systématique. Les résultats sont biaisés au sens où, si un nombre infini d’échantillons aléatoires similaires d’établissements plus anciens étaient constitués à partir de la population d’établissements, la moyenne ou la valeur prévue des résultats différerait de la moyenne véritable de la population et cette différence constituerait le biais. La distinction est importante. Si l’on augmente la taille d’un échantillon biaisé, parce que constitué par exemple d’établissements plus anciens, le changement de base atténuera la variance mais pas le biais.

11.17 Cette distinction entre la variance et le biais doit être faite aux fins de l’estimation. Lorsqu’on utilise les résultats obtenus au moyen d’un échantillon pour estimer un paramètre de la population, tant la variance que les biais influent sur la précision des résultats. Il existe cependant aussi une distinction dans les ouvrages statistiques entre la variance et les biais selon leur source: variance d’échantillonnage, biais de sélection, biais de non-réponse, biais de traitement et erreur de réponse. Le biais n’existe que si l’on ne peut pas l’estimer à partir de l’échantillon lui-même. Pour cela une estimation de μ est nécessaire. Si l’on peut mesurer le biais, alors il peut ne rester que la variance.

B.3 Concept d’indice véritable ou bon indice

11.18 Jusqu’à maintenant, nous avons abordé les erreurs, variances et biais en cherchant à estimer μ comme s’il s’agissait de la mesure requise. Nous avons pu ainsi établir les distinctions entre variance et biais. Toutefois, une bonne partie du présent Manuel porte sur le choix d’une formule appropriée pour le calcul de l’indice. Il nous faut maintenant considérer les biais sous l’angle de la différence entre la formule de l’indice et les méthodes utilisées pour calculer l’IPP et d’une certaine conception de ce qu’est un indice véritable. Au chapitre 17, nous définissons les indices théoriques véritables en nous inspirant de la théorie économique. La question est la suivante: si les producteurs ont un comportement d’optimisation et privilégient les produits permettant des majorations de prix relativement importantes, quelle sera la formule appropriée à utiliser? Le résultat est un certain nombre de formules d’indice superlatives. La liste n’inclut pas l’indice de Laspeyres ou l’indice de Young couramment utilisé (chapitre 15), qui attribuent des pondérations indûment basses aux produits dont l’augmentation des prix est relativement élevée parce qu’ils ne tiennent pas compte des effets de substitution (voir chapitre 17). Dans les secteurs d’activité où les établissements se comportent ainsi, l’indice de Laspeyres présente un biais négatif systématique. Pour comprendre les biais, il faut donc se référer au concept d’indice véritable. Selon la théorie économique, un indice véritable s’appuie sur des hypothèses de comportement des différents secteurs économiques. Ces présuppositions dictent les formules appropriées et, compte tenu de ces constructions mentales, déterminent s’il y a un biais.

11.19 Une bonne formule de calcul d’un indice peut être définie au moyen de critères axiomatiques comme indiqué au chapitre 16. Par exemple, il a été démontré que les indices de Young et Carli comportent un biais positif systématique, car ils ne satisfont pas au test de réversibilité temporelle, puisque le produit des indices entre les périodes 0 et 1 et entre les périodes 1 et 0 dépasse la valeur de l’unité.

11.20 La théorie et la pratique de l’IPP sont assez différentes. D’un côté, il y a le concept de maximisation des revenus défini dans la théorie économique susmentionnée. D’un autre côté, il y a l’approche du panier type4. Un indice fondé sur cette dernière approche ne comporterait pas, au sens le plus strict du concept, de biais de substitution (formule) ni de biais dû aux nouveaux produits parce qu’il s’agit de mesurer les prix d’un panier type de produits. Toutefois, on peut faire valoir, par souci de représentativité, que le panier devrait être mis à jour et que les effets de substitution devraient y être intégrés.

C. Utilisation, couverture et mode de calcul

11.21 La variance et certains biais découlent d’une utilisation inappropriée de l’IPP, indépendamment de la méthodologie utilisée pour le calculer. Comme les changements de prix peuvent varier considérablement d’un produit à l’autre, la valeur de l’indice des prix dépend en partie des produits ou produits élémentaires qui sont inclus dans l’indice et de la manière dont les prix des produits élémentaires sont déterminés (chapitre 15, section B.1). Au chapitre 2, il a été question des différentes utilisations possibles de l’IPP et ces utilisations ont été mises en parallèle avec différents domaines et principes de calcul. Ainsi, l’analyse de la variance et des biais est d’abord nécessaire pour décider si la couverture et les méthodes de calcul d’évaluation sont appropriées compte tenu des fins visées.

11.22 En termes généraux, l’IPP peut être décrit comme un indice conçu pour mesurer la variation moyenne des prix des produits et services, soit au moment où ils quittent le lieu de production, soit lorsqu’ils entrent dans la chaîne de production. Ainsi, les IPP appartiennent à deux catégories clairement distinctes: les indices des prix des intrants (aux prix d’acquisition) et les indices des prix des extrants (aux prix de base). Au chapitre 15, il est expliqué qu’un déflateur de la valeur ajoutée n’est ni plus ni moins qu’un autre IPP, qui sert à corriger la valeur des activités d’un secteur ou d’une économie en soustrayant de la valeur des extrants la valeur des intrants intermédiaires utilisés aux fins de la production. Dans un premier temps, certaines des principales utilisations vont être énumérées, puis le domaine ou la couverture de l’indice seront examinés. Dans un deuxième temps, les principes de calcul seront rappelés.

C.1 Utilisations et couverture

11.23 Les indices des prix des intrants (IPI) sont un indicateur de l’inflation à court terme. Il permet de suivre l’inflation potentielle à mesure que les pressions sur les prix s’accumulent et que les produits et services entrent dans le processus de production. Les indices des prix des extrants (IPE) ou les IPP établis à différentes étapes de la production montrent comment les pressions sur les prix des produits progressent jusqu’au grossiste et au détaillant. Ce sont des indicateurs de l’inflation des prix à la production qui excluent l’effet des pressions sur les prix provenant des importations et incluent celles qui s’exercent sur les exportations. La famille des IPP devrait toujours comprendre un IPP pour les prix à l’exportation et un autre pour les prix à l’importation. Il peut y avoir une lacune dans la couverture d’un IPP. Si, par exemple, un IPE est restreint au secteur industriel, il peut constituer une source de biais lorsqu’on analyse l’inflation globale si l’évolution des prix dans les autres secteurs est différente de celle du secteur industriel.

11.24 Les IPP peuvent être biaisés lorsqu’ils sont utilisés pour la déflation des comptes nationaux. Premièrement, leur couverture peut être insatisfaisante, mais ils sont malgré tout utilisés par les responsables de la comptabilité nationale. Par exemple, si on utilise uniquement l’IPP du secteur manufacturier pour déflater la production industrielle et si les variations des prix dans les secteurs manquants, les carrières et le bâtiment diffèrent, globalement, de celle du secteur manufacturier, on est en présence d’un biais. Le biais de sous-couverture découle de l’utilisation de l’indice et pas nécessairement de la manière dont il est constitué, mais les organismes statistiques se doivent d’être sensibles aux besoins des utilisateurs. Deuxièmement, le biais de surcouverture signifie que certains éléments inclus dans l’enquête ne sont pas pertinents pour la population cible. Le biais émerge si les variations des prix de ces éléments diffèrent globalement de ceux des éléments inclus. Troisièmement, la classification des activités aux fins du calcul de l’IPP devrait se faire à un niveau suffisamment bas de désagrégation et le système de classification devrait être le même que celui adopté pour les comptes de production du Système de comptabilité nationale (SCN 1993). Finalement, l’utilisation, pour l’IPP, de la formule de Laspeyres comme déflateur induit un biais puisque, théoriquement, la formule de Paasche convient (voir chapitre 18) pour mesurer les variations de la production à prix constants. Par ailleurs, l’importance du biais augmente à mesure que les pondérations deviennent périmées.

11.25 Des IPP fortement agrégés sont aussi utilisés pour l’analyse macroéconomique de l’inflation. Certains secteurs ou certains produits dont les prix sont volatils peuvent être exclus. Ces indices peuvent ne pas être retenus, car ils introduisent des variances d’échantillonnage substantielles dans les indices agrégatifs et leur exclusion aide à déterminer la tendance sous-jacente.

11.26 Dans les paragraphes qui précèdent, il a été question de la couverture ou du domaine de l’indice du point de vue des activités prises en compte. Toutefois, les mêmes considérations peuvent s’appliquer aussi à la couverture géographique. L’exclusion des établissements des régions rurales, par exemple, peut créer un biais si les variations de leurs prix diffèrent de celles des régions urbaines. Ces questions sont analysées aux sections D et E à la rubrique échantillonnage.

C.2 Mode de calcul

11.27 Valoriser un IPE consiste à évaluer la production aux prix de base en excluant toute TVA ou autre taxe déductible similaire facturée à l’acheteur. Ces recettes fiscales sont perçues par l’État et ne doivent pas être incluses dans le calcul, car elles ne font pas partie des recettes de l’établissement. Les frais de transport et les marges commerciales facturés séparément par le producteur doivent également être exclus. Un IPI doit prendre en compte les prix des intrants intermédiaires, y compris les taxes non déductibles, puisqu’elles font partie du coût réel payé par l’établissement. En ce qui concerne les IPI, les changements dans le mode de perception des taxes—par exemple l’imposition de droits de douane sur les intrants intermédiaires—peuvent créer des biais. En pareil cas, des indices excluant les taxes ou les droits de douane peuvent être produits. Quoi qu’il en soit, il faut s’assurer que les établissements traitent les taxes indirectes d’une manière uniforme et appropriée, surtout lorsque les taux de ces taxes varient.

D. Variance et biais lors de la constitution de l’échantillon

11.28 Le chapitre 5 décrit les méthodes appropriées pour constituer un échantillon. Un biais peut être causé par une base de sondage insatisfaisante. C’est l’une des sources de biais les plus pernicieuses, car les défauts de la base d’échantillonnage ne sont pas immédiatement apparents pour les utilisateurs. Pourtant, une base de sondage biaisée par le fait qu’elle comporte des établissements ou des secteurs industriels de taille donnée donnera lieu à un échantillon biaisé quel que soit le degré de probité de la sélection. Comme l’échantillonnage s’effectue généralement en deux temps—échantillonnage des établissements, puis des produits élémentaires pour chaque établissement—, une base de sondage doit être constituée pour les établissements et une autre pour les produits élémentaires produits par ces établissements. Cette dernière base s’appuie sur les données fournies par l’établissement sur ses recettes, les quantités produites et les prix pratiqués (ou sur la recette par unité de production) pour les produits élémentaires en question. Tout biais à ce stade, dû au fait que le prix de certaines composantes est fixé et enregistré au siège, peut entraîner un biais global. Il faut garder à l’esprit que, même lorsque la sélection est planifiée, il existe malgré tout une base implicite à partir de laquelle le répondant choisit les produits élémentaires. La nature de la base de sondage devrait être claire dans l’esprit du répondant.

11.29 La sélection de l’échantillon d’établissements à partir de la base de sondage devrait être aléatoire ou, à défaut, planifiée. Dans ce dernier cas, le but devrait être d’inclure les produits élémentaires les plus importants dont les variations de prix sont susceptibles de représenter celles de l’ensemble des produits. Le chapitre 5 donne une description assez détaillée des principes et des pratiques de sélection des échantillons et des biais qui peuvent en découler. Nous avons déjà établi les distinctions qui s’imposaient entre biais et variance d’échantillonnage, et la possibilité a été évoquée qu’une sélection non biaisée puisse malgré tout engendrer des estimations comportant des écarts substantiels, compte tenu de la forte variabilité (des évolutions) des prix et de la taille relativement réduite de l’échantillon.

E. Variance et biais d’échantillonnage: l’univers dynamique

11.30 Les chapitres 7 et 8 portent aussi, à certains égards, sur les problèmes d’échantillonnage. Si on utilise la méthode de l’appariement de modèles, il manquera des prix pour une période donnée si la production d’un produit élémentaire a été temporairement ou définitivement interrompue. Si des imputations globales sont utilisées pour remplacer les prix manquants, la taille de l’échantillon est réduite en pratique et la variance d’échantillonnage augmente. Dans une comparaison entre les prix de la période 0 et de la période t, les procédures d’imputation (chapitre 7) ne tiennent pas compte pour la période 0 des prix des produits élémentaires manquants pour la période t. Si les anciens prix des produits élémentaires dont la production a été interrompue diffèrent des autres prix de la période 0, on se trouve en présence d’un biais d’exclusion. De même, les nouveaux produits élémentaires dont la production a commencé après la période 0 et qui ne font donc pas partie de l’échantillon apparié sont ignorés. Si leur prix au cours de la période t diffère, en moyenne, du prix des produits élémentaires appariés au cours de la période t, on se trouve de nouveau en présence d’un biais. La variance et les biais d’échantillonnage peuvent par conséquent découler de l’exclusion des prix introduits après la constitution de l’échantillon ou des prix des produits abandonnés lorsque les prix ne sont plus fournis et s’ajouter à la variance et aux biais existants lors de la constitution de l’échantillon. L’important consiste à s’assurer que l’échantillon est représentatif de l’univers dynamique.

11.31 Plus l’échantillon d’établissements et de produits élémentaires se détériore, plus il devient nécessaire de changer la base de l’indice—c’est-à-dire de mettre à jour les pondérations et l’échantillon d’établissements et de produits élémentaires ou de procéder à la rotation des produits élémentaires de l’échantillon à mettre à jour. Cependant, ce sont là des procédures onéreuses et irrégulières et, dans certains secteurs, des mesures plus immédiates sont parfois nécessaires. Le changement de base et la mise à jour de l’échantillon sont des techniques utilisées pour rehausser la qualité de l’échantillonnage d’établissements et de produits élémentaires. Les stratégies appliquées pour régler le problème des établissements et des prix manquants ont aussi un effet sur l’échantillonnage d’établissements et de produits élémentaires. Ces stratégies consistent à intégrer à l’échantillon des établissements et des produits élémentaires de remplacement qui renouvellent l’échantillon d’une manière plus limitée qu’un changement complet de la base et qu’une mise à jour de l’échantillon. Des ajustements de prix en fonction de la qualité sont nécessaires si l’établissement ou le produit élémentaire de remplacement est différent, selon le cas, de l’établissement ou du produit manquant, même si cette procédure relève plutôt du biais de mesure des prix dont il est question à la section F. De nouveaux établissements et biens peuvent aussi devoir être intégrés à l’échantillon pour éviter un biais d’échantillonnage. Il est nécessaire en pareil cas d’accroître l’échantillon. Cet accroissement peut exiger un changement du système de pondération et, comme indiqué au chapitre 8, cette procédure ne devrait être entreprise que lorsque l’intégration de nouveaux établissements ou biens majeurs est jugée nécessaire. Ainsi, les biais d’échantillonnage imputables à des différences entre l’univers dynamique et l’univers statique lors de la constitution de l’échantillon peuvent, jusqu’à un certain point, être atténués par un remplacement ou un accroissement de l’échantillon (chapitre 8).

11.32 Il peut arriver que l’échantillon se détériore gravement à cause des produits élémentaires manquants, car le taux de remplacement de certains produits différenciés est très rapide. Dans de tels cas, il est conseillé au chapitre 7, section G, de recourir à des indices hédoniques ou à un chaînage fondé sur un rééchantillonnage de l’univers tous les mois.

F. Mesure des prix: erreurs et biais de réponse, changement de la qualité et nouveaux produits

F.1 Erreurs et biais de réponse

11.33 Des erreurs peuvent survenir si les prix déclarés ou enregistrés sont inexacts. Si ces erreurs sont systématiques, on parle alors plutôt d’un biais. Les descriptions de produits élémentaires qui définissent la base de prix devraient être aussi précises que possible, de sorte que les comparaisons se fassent entre prix de produits élémentaires similaires. En considérant automatiquement que la qualité des modèles plus récents est comparable à celle des produits antérieurs, on crée un biais positif si la qualité s’améliore. Ces considérations valent aussi pour l’amélioration de la qualité du service qui va de pair avec un produit élémentaire. La période à laquelle les prix se rapportent devrait être clairement indiquée, surtout lorsque les prix ont fluctué au cours du mois en question et il devient nécessaire de calculer un prix moyen (chapitre 6). Les erreurs de calcul peuvent être atténuées par une description claire de la base de la valorisation et en discutant avec les répondants, si les principes inhérents à leur système comptable diffèrent de ceux du calcul requis. C’est particulièrement important lorsque les taux de taxation ou les systèmes de taxation varient. Des vérifications permettant d’établir la cause de variations extrêmement inhabituelles des prix devraient faire partie d’un système automatisé d’assurance de la qualité et les valeurs extrêmes devraient toujours faire l’objet d’une vérification auprès du répondant plutôt que d’être automatiquement supprimées. Les enquêteurs devraient visiter les établissements au départ, puis périodiquement par la suite dans le cadre du programme d’assurance de la qualité (voir chapitre 12).

F.2 Biais dus au changement de qualité

11.34 Comme expliqué à la section E, un biais peut survenir si des produits élémentaires nouvellement lancés ne font pas partie de l’échantillon apparié et si leur prix (ajusté en fonction de la qualité) diffère des prix de l’échantillon apparié. Ce biais de sélection des produits élémentaires de qualité supérieure et des nouveaux produits fait l’objet de la section E. Il y est aussi noté que les organismes statistiques peuvent contribuer à l’appauvrissement de l’échantillon en ayant recours à des imputations ou utiliser des produits de remplacement pour le renouveler. Le problème ici est lié à la validité de ces démarches aux fins du calcul des prix plutôt qu’à leurs effets sur le biais de sélection.

11.35 Le chapitre 7 décrit un grand nombre de méthodes explicites et implicites d’ajustement en fonction de la qualité. D’un point de vue pratique, le problème du changement de la qualité réside dans la nécessité de mesurer le changement de prix d’un produit dont la qualité a aussi changé. L’ancien produit élémentaire n’est plus fabriqué, mais un produit de remplacement ou de substitution est venu prendre sa place. Si le changement de qualité a en moyenne pour effet de majorer ou de réduire le prix, il s’ensuit un biais si les prix sont comparés comme s’ils étaient comparables alors qu’ils ne le sont plus. Un ajustement explicite en fonction de la qualité peut être apporté au prix de chacun des deux produits élémentaires afin de les rendre comparables. Un certain nombre de méthodes permettant de procéder à ces ajustements explicites sont décrites au chapitre 7, y compris l’estimation à dire d’expert, l’ajustement en fonction de la quantité, la méthode des coûts d’options ou de production, et l’estimation par régression hédonique. Si un ajustement est inapproprié, il y aura une erreur, et si les ajustements sont systématiquement inappropriés, il y aura un biais. Par exemple, le recours à la méthode d’ajustement en fonction de la quantité afin d’établir le prix de très petits lots de produits, pour lesquels les clients acceptent de payer plus par unité par pure commodité, engendrerait une estimation biaisée de l’ajustement des prix imputable au changement de qualité (chapitre 7, section E.2).

11.36 Il existe aussi des méthodes implicites d’ajustement de la qualité. Ce sont notamment la méthode de chevauchement, la méthode d’imputation par la moyenne globale ou ciblée, la méthode d’imputation par la moyenne des remplaçants à qualité constante, le remplacement en équivalent, le remplacement en dissemblable pour éliminer toute variation du prix et la méthode du report du prix précédent. On a souvent recours à des imputations selon lesquelles la variation de prix des produits élémentaires manquants est réputée être la même que celle de l’ensemble de l’échantillon ou d’un groupe donné de produits élémentaires ciblés. Ces méthodes accentuent cependant la variance, car la taille de l’échantillon s’en trouve réduite et peuvent engendrer des biais si les produits élémentaires ainsi éliminés sont à un stade de leur cycle de vie où leur prix diffère de celui des autres produits élémentaires. De manière générale, il est admis que ces biais surestiment les variations des prix (chapitre 7, section D).

11.37 Au chapitre 7, il a été expliqué que la procédure d’ajustement de la qualité retenue varie d’un secteur à l’autre en fonction de leurs caractéristiques propres. Pour certaines catégories de produits, comme les produits de consommation durables, les matériaux et les produits électroniques faisant appel à des technologies de pointe, le changement de qualité est considéré comme significatif. Si ces produits ont une pondération significative dans l’indice, un biais global peut s’ensuivre si les changements de qualité sont ignorés ou si les effets du changement de qualité sur les prix sont mal mesurés. Quelle que soit la méthode utilisée, une hypothèse est toujours formulée quant à la mesure dans laquelle un changement de prix donné est imputable à un changement de qualité. Lorsque l’hypothèse n’est pas fondée, cela donne lieu à un biais.

F.3 Biais dus aux nouveaux produits

11.38 Avec le temps, de nouveaux produits (et services) vont apparaître. Ceux-ci peuvent être très différents des produits et services actuels. Un indice qui ne tient pas suffisamment compte de l’effet sur les prix des nouveaux produits peut être biaisé. L’intégration de nouveaux produits à un indice est problématique. Premièrement, on n’a aucune idée de leur pondération. Deuxièmement, il n’y a pas de période de référence à laquelle comparer le nouveau prix. Même si le nouveau produit est lié à l’indice, il n’existe aucun prix (minimum) au cours de la période précédant son lancement qui permettrait d’effectuer une comparaison avec son prix de lancement. En intégrant le nouveau produit au moment d’un changement de base, on néglige le changement de prix du produit par rapport à sa période initiale de lancement, or c’est souvent au cours de cette période que des variations de prix inhabituelles sont à prévoir, surtout lorsque le nouveau produit offre une amélioration à un prix donné ou inférieur. Ces considérations s’appliquent aussi aux nouveaux établissements (section G.4). On considère en général que les biais dus aux nouveaux produits et aux nouveaux établissements surestiment en moyenne les variations de prix.

F.4 Biais dus aux produits temporairement manquants

11.39 La disponibilité de certains produits élémentaires fluctue d’une saison à l’autre. C’est notamment le cas des fruits et légumes. Un certain nombre de méthodes peuvent être utilisées pour imputer ces prix pendant les périodes où les prix sont manquants. Il a été démontré que cette manière de procéder entraîne un biais si les méthodes d’imputation utilisées sont inappropriées. En fait, si les produits élémentaires saisonniers constituent une grande partie des recettes, il est difficile d’accorder une quelconque signification à des indices mensuels, même si la comparaison des prix pratiqués au cours d’un mois donné et le même mois de l’année suivante est en règle générale significative (voir chapitre 22).

G. Biais de substitution

11.40 Selon le domaine d’un indice et les principes de calcul, la valeur des recettes encaissées par l’établissement peut être comparée au cours de deux périodes différentes, en l’occurrence, ici, les périodes 0 et 1. Il est démontré au chapitre 15 que les variations de cette valeur entre les périodes 0 et 1 peuvent être subdivisées en deux composantes: la variation de prix globale et la variation de quantité globale. Une formule indicielle est nécessaire pour récapituler la variation de prix globale. En pratique, cela peut se faire en deux étapes. Au niveau supérieur, une moyenne pondérée des variations des prix (ou la variation de la moyenne pondérée des prix) est calculée, les informations disponibles sur les recettes (quantités) servant de pondérations. Au niveau inférieur, les formules indicielles n’ont pas recours à la pondération des recettes ou des quantités et utilisent uniquement les informations sur les prix pour mesurer les indices d’agrégat élémentaires des variations moyennes des prix (ou les variations des prix moyens). Il est reconnu que dans de nombreux cas, seuls des calculs pondérés sont effectués. Cinq démarches ont été utilisées aux chapitres 15 à 17 afin de mettre au point une formule appropriée au niveau supérieur et une analyse similaire est entreprise pour les indices d’agrégat élémentaires de niveau inférieur au chapitre 20.

G.1 Biais de substitution de niveau supérieur

11.41 Les formules d’agrégation n’ont pas toutes les mêmes propriétés. Au niveau supérieur de pondération, des recherches importantes sur les méthodes axiomatique, stochastique, de Divisia, à base fixe et économique ont mené à une compréhension des biais implicites de certaines formules particulières. Ces biais sont analysés de manière assez détaillée aux chapitres 15 à 17. La formule de Laspeyres est généralement celle le plus souvent retenue pour l’établissement d’un IPP, pour la raison pratique qu’elle n’exige aucune information sur les quantités pour la période courante. Il est aussi admis que le déflateur approprié pour calculer les estimations de production à prix constants est celui de Paasche (chapitre 18). Ainsi, si des estimations d’une série de produits à prix constants sont nécessaires, l’utilisation du déflateur de Laspeyres entraînera un biais. En pratique, si l’on procède à une comparaison de prix entre les périodes 0 et t, les pondérations des recettes de la période 0 ne sont pas disponibles et on utilise alors l’indice de Young, qui pondère les variations de prix de la période 0 à la période t par les parts de recettes d’une période antérieure b. Au chapitre 15, il est expliqué que cet indice est biaisé. Les indices superlatifs, en particulier les indices de Fisher et de Törnqvist, possèdent de bonnes propriétés axiomatiques et peuvent aussi être justifiés par les approches de la base fixe, stochastique et économique. En effet, il est possible de démontrer que l’indice de Laspeyres comporte un biais de substitution si certains comportements économiques typiques sont posés en hypothèse. Par exemple, les producteurs peuvent chercher à maximiser les recettes d’une technologie donnée et les intrants peuvent orienter la production vers des produits élémentaires dont l’augmentation des prix est supérieure à la moyenne. L’indice de Laspeyres, en maintenant les quantités constantes au cours de la période de référence, n’intègre pas d’effet de ce genre dans ses pondérations, ce qui donne un poids relatif indûment bas aux produits élémentaires dont le prix a augmenté plus que la moyenne. Par conséquent, cet indice comporte un biais systématique par défaut. On peut aussi faire valoir que l’indice de Paasche fixe pondéré à la période courante souffre d’un biais positif systématique, tandis que l’indice de Fisher représente la moyenne symétrique des deux et se situe donc par conséquent à l’intérieur de ces limites. Le calcul rétrospectif de l’indice de Fisher fait apparaître le biais de substitution de niveau supérieur.

11.42 L’importance du biais dépend de l’importance de l’effet de substitution. L’indice de Laspeyres est approprié lorsqu’il n’y a pas de substitution. Toutefois, le modèle économique suppose que la technologie de production est la même pour les deux périodes comparées. Si, par exemple, l’usine change de technologie pour produire le même produit élémentaire à un coût inférieur, les hypothèses qui dictent la nature et l’importance du biais s’écroulent.

G.2 Biais de substitution de niveau inférieur

11.43 Dans certains pays où certains secteurs d’activité, des indices d’agrégat élémentaires de niveau inférieur sont construits en utilisant uniquement des données sur les prix. Les prix de ce qui devrait être des produits élémentaires similaires sont regroupés. En pratique, toutefois, la description des produits élémentaires peut être vague et la variation des prix entre les produits élémentaires faisant l’objet de l’agrégation très substantielle.

11.44 Les méthodes axiomatique (expérimentale), stochastique et économique peuvent aussi être appliquées au choix de l’indice au niveau inférieur (chapitre 20). L’indice de Carli, qui est une moyenne arithmétique des variations de prix, ne donne pas de bons résultats dans un contexte axiomatique et son utilisation n’est pas recommandée. Il a été démontré que l’indice de Dutot, qui est un ratio de moyennes arithmétiques, est vulnérable à l’effet des unités de mesure utilisées pour les variations de prix et n’est pas recommandé lorsque les produits élémentaires ne répondent pas à des critères de qualité précis. L’indice de Jevons, qui est la moyenne géométrique des variations de prix (ou, ce qui revient au même, le ratio des moyennes géométriques des prix), donne de bons résultats lorsqu’il est mis à l’essai au moyen de l’approche axiomatique, mais intègre un effet de substitution qui va dans le sens contraire à ce qui était prévu par le modèle économique susmentionné. Il possède une élasticité unitaire implicite qui exige que les recettes demeurent constantes au cours des périodes comparées. Dans le cas d’un indice des prix à la consommation, le modèle économique veut que les consommateurs délaissent les produits élémentaires dont l’augmentation des prix est supérieure à la moyenne dans une proportion équivalente aux achats de produits élémentaires relativement meilleur marché. L’hypothèse de parts des recettes constantes est appropriée dans ces circonstances. Cependant, la théorie du producteur exige que celui-ci remplace les produits élémentaires par d’autres dont l’augmentation des prix est supérieure à la moyenne. L’hypothèse des recettes égales n’est donc pas plausible. Le chapitre 20 décrit en détail un certain nombre de formules comportant des propriétés plutôt différentes. Toutefois, il en ressort que, puisque les méthodes axiomatique, stochastique, à base fixe et économique, décrites à la section G.1, considèrent que les indices superlatifs sont supérieurs (chapitres 15 à 17), il est préférable de tenter d’utiliser ces formules au niveau inférieur plutôt que de reproduire leurs effets en utilisant uniquement des données sur les prix, tâche pour laquelle elles sont mal adaptées. Il faudrait demander aux répondants de fournir des données sur leurs recettes ou les quantités ainsi que des données sur les prix. À défaut, un indice approprié doit être établi selon la nature prévue du biais de substitution.

G.3 Biais de la valeur unitaire

11.45 Même si des données sur la quantité ou sur les recettes sont disponibles au niveau détaillé des produits élémentaires, il y a encore une possibilité de biais imputable à la formule utilisée pour définir les prix. Si un établissement produit des milliers d’exemplaires d’un même produit élémentaire tous les jours, le prix peut ne pas être fixe. Des variations mineures dans la nature de ce qui est produit peuvent influer sur le prix si celui-ci est considéré comme étant égal aux recettes totales divisées par la quantité d’articles produits. Si la production est réorientée vers des produits à prix plus élevés, les prix moyens augmenteront simplement à cause du changement de composition de la production et il y aura donc un biais positif systématique.

G.4 Biais dus aux nouveaux établissements (substitution)

11.46 La nécessité d’inclure les nouveaux établissements dans l’échantillon a déjà été évoquée à la section E où il est question du biais d’échantillonnage. Les produits provenant de nouveaux établissements peuvent non seulement avoir des prix différents (habituellement inférieurs), ce qui milite en faveur de leur inclusion dans l’échantillon, mais ils sont par ailleurs de plus en plus acceptés par les acheteurs qui remplacent les produits des anciens établissements par ceux des nouveaux établissements. Leur exclusion peut donc induire une surestimation des variations des prix. Lorsqu’un établissement de l’échantillon ferme, on a l’occasion de le remplacer par un nouvel établissement, ce qui annule en quelque sorte le biais d’échantillonnage dont il était question à la section E. Toutefois, dans toute comparaison de prix, pour que la méthode d’établissement des prix repose sur une base définie uniformément, il faut prendre en compte non seulement la qualité du produit élémentaire qui est remplacé, mais aussi le niveau de service offert, la commodité de l’emplacement géographique de l’établissement et tous les autres facteurs liés aux conditions de vente.

11.47 Les sections qui précèdent ne donnent qu’un aperçu des sources possibles d’erreurs, de variance et de biais et ne constituent ni un exposé exhaustif ni une description détaillée. L’analyse détaillée des erreurs, de la variance et des biais, figure dans chacun des chapitres pertinents. La multiplicité des sources de biais, d’erreurs et de variance devrait toutefois convaincre les organismes statistiques de procéder à une vérification de leurs forces et de leurs faiblesses et de se doter de stratégies visant à éliminer ces erreurs, ces biais et cette variance d’une manière efficace par rapport à son coût.

Par souci de simplicité, il est ici question de prix plutôt que de variations des prix.

Il s’agit d’une variance d’échantillonnage, que l’on peut estimer comme étant l’écart entre la plus grande et la plus petite valeur d’une probabilité donnée, plus fréquemment appelée intervalle de confiance. Les méthodes et les principes qui permettent de calculer ces extrêmes sont expliqués dans Cochran (1963), Singh and Mangat (1996) et dans la plupart des textes d’initiation à la statistique. Moser et Kalton (1981) donnent un excellent aperçu des différents types d’erreurs et des distinctions entre elles.

À défaut de connaître la valeur de μ, on procède habituellement à des estimations de la variance d’échantillonnage. Elles ne sont cependant qu’un des éléments influant sur la variabilité des prix utilisés pour le calcul de μ.

On trouvera une analyse de ce débat dans Triplett (2001).

    Other Resources Citing This Publication