Chapter

21. Changements De Qualité Et Indices Hédoniques

Author(s):
International Monetary Fund
Published Date:
November 2006
Share
  • ShareShare
Show Summary Details

Introduction

21.1 Les chapitres 15 à 20, qui traitent les problèmes théoriques relatifs au choix d’une formule d’indice, reposent sur une hypothèse simplificatrice: l’agrégation porte sur les mêmes produits élémentaires appariés i = 1,…,n dans les deux périodes comparées. Pour effectuer une comparaison des prix entre deux périodes, la qualité de chaque produit élémentaire doit être la même. On demande aux personnes qui relèvent les prix d’apparier chaque mois des produits ayant la même spécification de qualité; en effet, on veut seulement mesurer les changements «purs» des prix et non pas ceux qui reflètent des modifications qualitatives de ce que l’on consomme. En pratique, la qualité de ce qui est consommé évolue bel et bien. En outre, de nouveaux biens et services apparaissent sur le marché et les changements de leurs prix relatifs peuvent différer de ceux des biens et services existants. Ces innovations représentent éventuellement une part substantielle des dépenses. Les paragraphes 21.2 à 21.60 présentent un cadre théorique qui élargit la définition des produits élémentaires à leurs caractéristiques qualitatives. Ce cadre contribue à l’application pratique de l’ajustement qualitatif, évoquée au chapitre 7, et aux méthodes utilisées en présence de la substitution de produits élémentaires et de l’apparition de nouveaux produits, traitées au chapitre 8.

Apparition et disparition des produits élémentaires

21.2 Dans les chapitres précédents, on a supposé que, dans chaque période, on comparait la même gamme de produits élémentaires. On peut considérer cela comme l’échantillonnage de tous les produits élémentaires appariés disponibles pendant les périodes 0 et t—l’univers d’intersection1, qui se limite à des produits élémentaires appariés. Pourtant, dans de nombreux domaines, on voit disparaître d’anciens produits élémentaires, tandis que de nouveaux apparaissent. Il n’est pas réaliste de contraindre l’échantillon à ne provenir que de l’univers d’intersection. Il arrive que les circuits de distribution vendent un produit pendant la période 0, mais ne le commercialisent plus pendant les périodes suivantes t2. Il arrive aussi que l’on lance de nouveaux produits élémentaires après la période 0 et qu’ils ne soient pas comparables à un produit élémentaire correspondant de la période 0. Il s’agit éventuellement de variantes des anciens produits, mais il est également possible qu’ils procurent des services totalement nouveaux que l’on ne peut comparer directement à rien de ce que l’on connaissait auparavant. Cet univers de la totalité des produits élémentaires des périodes 0 et t est l’univers double dynamique.

21.3 Il existe un troisième univers à partir duquel on peut échantillonner les prix: c’est un univers de remplacement. On détermine les prix d’un échantillon de produits élémentaires dans la période 0 et on les surveille dans les périodes suivantes. Si un produit cesse d’être commercialisé et si l’on ne dispose plus de prix à enregistrer pour cet article particulier, il est possible de se référer au prix d’un produit remplaçant comparable pour ne pas interrompre la série de prix. Cet univers est un univers de remplacement, qui commence avec l’univers de la période de base, mais intègre aussi les remplacements, unité pour unité, quand un produit élémentaire appartenant à l’échantillon de la période de base manque pendant la période actuelle.

21.4 Dans l’idéal, le produit remplaçant est d’une qualité comparable au produit élémentaire auquel il se substitue. Quand on ne dispose pas d’un produit remplaçant comparable, on peut choisir un non-comparable. Il y a deux techniques possibles. On peut procéder à un ajustement explicite du prix de l’ancien produit ou du produit remplaçant pour tenir compte de la différence de qualité, puisqu’ils n’ont pas la même. Une autre solution consiste à faire l’hypothèse que le changement de prix de l’«ancien» produit élémentaire, s’il avait continué d’exister, aurait été le même que la variation globale des prix d’un groupe de référence de produits de l’univers apparié. Dans la deuxième démarche, on fait un ajustement implicite au titre de l’effet sur le prix du changement qualitatif: on estime qu’il n’y a pas de différence entre le changement de prix du groupe apparié et le changement de prix, ajusté de l’effet de qualité de l’ancien produit, s’il avait continué à exister3. On envisage ici le problème des produits élémentaires manquants sous l’angle des ajustements de prix en fonction des différences de qualité.

21.5 Trois difficultés pratiques apparaissent. En premier lieu, c’est le problème de l’ajustement qualitatif explicite entre le produit remplaçant et l’ancien. Ce dernier n’est plus consommé; on trouve un produit remplaçant dont la qualité n’est pas strictement comparable; les différences de qualité sont distinguées et il faut leur donner un prix, si l’on veut utiliser la série de prix du «nouveau» produit remplaçant pour poursuivre celle de l’«ancien».

21.6 En deuxième lieu, sur des marchés où la rotation des produits est rapide, l’espace d’échantillonnage choisi dans l’univers apparié va devenir de moins en moins représentatif de l’univers dynamique, comme on l’a soutenu au chapitre 8. Même l’univers de remplacement peut ne pas convenir, car il comprendra des séries qui se reconstituent seulement quand un produit élémentaire doit être remplacé. Compte tenu de la rapidité de l’évolution technologique dans de nombreux domaines de produits, cet univers risque de ne pas être représentatif. Dans de telles situations, il est peut-être préférable de relever les prix, non pas dans des échantillons appariés, mais dans un échantillon de chaque période des principaux produits disponibles (ou dans un échantillon représentatif de ces derniers), même s’ils sont de qualité différente. Une comparaison des prix moyens de ces produits élémentaires serait biaisée si, par exemple, leur qualité s’améliorait. La nécessité et les détails des mécanismes permettant d’éliminer les effets de ces changements dans les comparaisons de prix moyens sont évoqués au chapitre 7.

21.7 En troisième lieu, on est confronté au problème des biens et services nouveaux et de ceux qui disparaissent. C’est le cas où le nouveau produit élémentaire n’est pas une variante de l’ancien, mais procure un service tout à fait inédit. On ne peut l’utiliser comme remplacement d’un ancien produit en ajustant le prix en fonction du différentiel de qualité, parce qu’il apporte, par définition, quelque chose de neuf.

21.8 Il existe plusieurs méthodes d’ajustement au titre de la qualité, qui sont examinées au chapitres 7. L’une d’entre elles consiste à effectuer des ajustements explicites des prix selon la différence qualitative entre les produits anciens et produits remplaçants, en utilisant les coefficients ou les valeurs prédites obtenus des modèles de régression hédoniques. Les régressions hédoniques sont des régressions des prix des produits sur leurs caractéristiques: par exemple, les prix des postes de télévision en fonction de la dimension de l’écran, de l’existence de la stéréo ou de possibilités d’interactivité etc. Les coefficients de ces variables donnent des estimations des valeurs marginales de diverses caractéristiques quantifiables du produit. Ils peuvent servir à ajuster le prix d’un produit remplaçant non comparable en fonction des différences de qualité avec l’ancien produit; c’est ainsi que le poste de télévision de remplacement peut être équipé d’un dispositif interactif, alors que la version ancienne ne l’était pas. Il importe de bien comprendre la signification des coefficients estimés, si on veut les utiliser pour l’ajustement qualitatif des prix, sachant que leur usage à cette fin est préconisé4. Pour bien saisir le sens de ces paramètres, il faut d’abord se représenter les produits élémentaires comme des agrégats de leurs caractéristiques. À la différence des produits, les caractéristiques ne se voient pas attribuer un prix distinct. Toutefois, le prix du produit élémentaire est le prix d’un ensemble inséparable de ses caractéristiques. Il faut donc rechercher ce qui pourrait déterminer les prix des caractéristiques en question: la théorie économique incite à examiner la demande et l’offre des caractéristiques (voir paragraphes 21.13 à 21.21) ainsi que l’interaction des deux pour produire un prix d’équilibre (voir paragraphes 21.22 et 21.23). Après avoir défini le cadre analytique de ces prix, on doit examiner comment la théorie économique nous permet d’interpréter les coefficients calculés (voir paragraphes 21.24 à 21.28).

21.9 Aux paragraphes 7.125 à 7.158 du chapitres 7, on a recommandé deux méthodes principales pour les domaines où la rotation des produits élémentaires est rapide. Si l’échantillon de la période zéro est rapidement dépassé, l’univers apparié et même l’univers de remplacement deviendront de moins en moins représentatifs de l’univers double et il faudra un échantillonnage répété à partir de l’univers double. Dans ce cas, on a conseillé de recourir soit aux indices chaînés (voir paragraphes 7.153 à 7.158), soit à un certain nombre d’indices hédo-niques (voir paragraphes 7.132 à 7.152). Ces indices diffèrent de l’utilisation de la régression hédonique pour ajuster les prix d’un produit manquant en fonction des différences de qualité. Pour estimer le changement du prix en prenant en compte l’effet de qualité, ils utilisent des régressions hédoniques, par exemple en incluant une variable indicatrice temporelle du côté droit de l’équation, comme on le décrit ci-dessous et au chapitres 7; ils s’appuient aussi sur la théorie exposée au chapitres 17 et dans les paragraphes 21.13 à 21.36. La théorie économique des indices de prix, évoquée au chapitres 17, est conçue pour inclure ces ensembles de biens que l’on peut définir par leurs caractéristiques comme un produit élémentaire dans la fonction d’utilité du consommateur. On définit des indices de prix à la consommation théoriques, qui intègrent les changements de prix des caractéristiques. À l’instar des indices de prix des produits, examinés au chapitres 17, ces indices peuvent être formulés de nombreuses manières; on rencontre des problèmes et des formules analogues quand on présente d’autres méthodes aux paragraphes 21.40 à 21.60.

21.10 L’estimation des régressions hédoniques et la vérification de leurs propriétés statistiques sont facilitées par le fait que l’on dispose de logiciels statistiques et économétriques conviviaux, mais puissants. L’estimation des équations de régression soulève beaucoup de questions habituelles, que l’on peut résoudre au moyen de tests de diagnostics disponibles dans ces logiciels, comme l’expliquent Kennedy (1998) et Maddala (1988). Il y a toutefois des problèmes de forme fonctionnelle—l’usage d’estimateurs de moindres carrés pondérés et la spécification—particuliers à l’estimation des équations hédoniques. Nombre d’entre eux sont illustrés au chapitres 7, alors que l’appendice 21.1 du présent chapitre examine certains des aspects théoriques. On se reportera à Gordon (1990), Griliches (1990) et Triplett (1990).

21.11 Finalement, aux paragraphes 21.61 à 21.68, on fait appel à la théorie économique pour résoudre le problème des biens et services nouveaux et de ceux qui disparaissent. Il se pose quand la nature des biens et services existants diffère très sensiblement de celle des nouveaux, de telle sorte que la comparaison n’a pas de sens, même si elle est ajustée de l’effet de qualité. On examine la théorie économique des prix de réservation, tout en exprimant certaines préoccupations vis-à-vis de son application pratique.

Prix hédoniques et marchés implicites

Les produits élémentaires en tant qu’ensembles liés de caractéristiques

21.12 Une régression hédonique est une équation de régression qui établit une relation entre les prix des produits élémentaires p et les quantités de caractéristiques, données par le vecteur z = (z1, z2, …., zn), c’est-à-dire:

où les produits élémentaires sont définis par des montants variables de leurs caractéristiques. En pratique, on observera pour chaque produit élémentaire (variante du produit) son prix, ses caractéristiques et éventuellement la quantité et donc la valeur vendues. Les travaux empiriques effectués dans ce domaine ont porté sur deux problèmes: on a estimé les changements du prix d’un produit élémentaire par suite de modifications unitaires de chaque caractéristique, c’est-à-dire les coefficients estimés de l’équation. (21.1); on a également estimé les fonctions de demande et d’offre de chaque caractéristique. La description d’un produit élémentaire comme panier de caractéristiques, dont chacune a son propre prix virtuel exige ensuite la spécification d’un marché de ces caractéristiques, puisque les prix résultent du fonctionnement des marchés. Houthakker (1952), Becker (1965), Lancaster (1966) et Muth (1966) ont tous identifié la demande de produits élémentaires à partir de leurs caractéristiques. La vente d’un produit porte sur un ensemble inséparable de caractéristiques acquis par un consommateur dont le comportement économique, quand il choisit parmi des produits élémentaires, est décrit comme une sélection entre des ensembles de caractéristiques5. Rosen (1974) a poussé plus loin l’analyse en établissant un cadre structurel de marché de producteurs et de consommateurs. Il y a deux aspects: la demande et l’offre. La quantité de chaque caractéristique offerte et consommée est déterminée par l’interaction de la demande de caractéristiques des consommateurs et de l’offre des caractéristiques des producteurs. On va les examiner successivement.

Le consommateur ou la demande

21.13 Observons le graphique 7.1, de Triplett (1987, p. 634), qui montre un espace-caractéristiques simplifié entre deux caractéristiques seulement. Les surfaces hédoniques p1 et p2 retracent toutes les combinaisons des deux caractéristiques z1 et z2 qui peuvent être acquises aux prix p1 et p2. Une courbe d’indifférence q* représente les combinaisons de z1 et z2 dont l’achat ne fait pas de différence pour le consommateur; en d’autres termes, il tirera la même utilité de tout point de la courbe. La tangence de q* avec p1 à A est la solution au problème de maximisation de l’utilité pour un budget donné (prix p1) et pour des goûts donnés (que reflète qj*).

21.14 La pente de la surface hédonique est le coût marginal pour le consommateur de l’achat d’une combinaison de caractéristiques, tandis que la pente de la fonction d’utilité est l’utilité marginale que procure l’achat; la tangence à A est la combinaison de caractéristiques maximisant l’utilité achetée à ce prix. Si les consommateurs achetaient n’importe quelle autre combinaison de caractéristiques dans l’espace du graphique 21.1, ils supporteraient un coût plus élevé ou obtiendraient un niveau inférieur d’utilité. Ainsi, la position AA’ comporte davantage de z1 et de z2, tandis que le consommateur bénéficie d’un niveau plus élevé d’utilité, étant au q,i mais il lui faut aussi un budget plus important et il paie un prix supérieur, p2, pour être dans cette position. Le graphique 17.1 du chapitres 17 illustre en espace-produits comment le consommateur choisirait entre différentes combinaisons de produits, q1 et q2. Le problème de l’espace-caractéristiques dans le graphique 21.1 est analogue à celui de l’espace-produits, les consommateurs choisissant parmi les combinaisons de caractéristiques z1 et z2. On notera que la surface hé-donique décrite au graphique 21.1 est non linéaire; les prix relatifs des caractéristiques ne sont donc pas fixes. Le consommateur aux goûts qk* sélectionne l’ensemble de caractéristiques B à p1. Ainsi, les données observées sur le marché dépendent de la gamme des goûts. Triplett (2002) a soutenu que, si tous les goûts étaient identiques, on achèterait, par exemple, un seul modèle d’ordinateur personnel. Mais, dans le monde réel, il existe une pluralité de modèles, qui reflètent l’hétérogénéité des goûts et des niveaux de revenus. Rosen (1974) démontre que, pour la totalité des combinaisons de caractéristiques et des prix auxquels les produits peuvent être offerts, la surface hédonique trace une enveloppe de tangentes6 incluant qj* et qk* sur p1 dans le graphique 21.1. Cette enveloppe n’est qu’une description du lieu géométrique des points choisis. Selon la théorie économique, ces points seront observés sur le marché, si l’on suppose que les consommateurs maximisent rationnellement l’utilité; ce sont donc les points devant être utilisés pour estimer la régression hédonique. On notera également que les seuls points A et B ne permettent pas à la régression de déterminer le prix de z1 relativement à z2, puisque les données observées sont deux combinaisons de produits au même prix. Mais, le lieu géométrique des points sur un sentier d’expansion AA’ permettrait de déterminer cela. Il peut bien sûr exister des sentiers d’expansion pour des consommateurs aux goûts différents, comme B, et cela entraîne éventuellement des évaluations conflictuelles. Les estimations globales de paramètres déterminées par la régression, à partir des transactions observées sur le marché, sont un amalgame de ces données. C’est tout simplement le reflet de la vie économique réelle. Il ressort de tout cela que la forme de la fonction hédonique est déterminée en partie par la distribution des acheteurs et de leurs choix sur le marché.

Graphique 21.1Décisions de consommation et de production correspondant à des combinaisons de caractéristiques

[Auteur: SG et SH sont en italiques majuscules, p, z, qj, qk en italiques minuscules.]

21.15 L’exposé est maintenant formalisé pour inclure des paramètres de goûts et un bien numéraire7 servant à sélectionner des combinaisons d’autres agrégats, conformément à Rosen (1974). La fonction hédonique p(z) décrit la variation du prix de marché des produits élémentaires selon leurs caractéristiques. On suppose que la décision d’achat du consommateur s’inspire d’un comportement de maximisation de l’utilité. La fonction d’utilité est donnée par U(z, x; α) où x est un bien numéraire; la maximisation de l’utilité est soumise à une contrainte budgétaire donnée par le revenu y, mesuré comme y = x + p(z) (le montant dépensé en bien numéraire et en produits hédoniques); α est un vecteur de caractéristiques de consommateurs individuels qui décrit leurs goûts. Il va de soi que, dans la fonction d’utilité, x peut être décrit par yp(z). Les consommateurs maximisent leur utilité en sélectionnant une combinaison de quantités de x et de caractéristiques z, sous contrainte budgétaire. On fait l’hypothèse que le marché est concurrentiel et que les consommateurs subissent les prix («price takers»); comme ils n’achètent qu’un seul produit alimentaire, leur décision d’achat n’influence pas le prix de marché. Le prix qu’ils acquittent pour une combinaison de caractéristiques, le vecteur z, est donné par p(z). Sachant que les consommateurs optimisent, la combinaison choisie est telle que:

où ∂p(Z)/∂Zi, est la première dérivée de la fonction hédonique (21.1) pour chaque caractéristique z. Les coefficients de la fonction hédonique sont égaux à leurs prix virtuels p,i qui sont égaux à l’utilité dérivée de cette caractéristique par rapport au bien numéraire pour des budgets et des goûts donnés.

21.16 On peut définir une fonction de valeurθ comme la valeur de la dépense qu’un consommateur aux goûts α est prêt à consentir pour des valeurs alternatives de z à un niveau d’utilité donné u et de revenu y, représentée par θ(z; u, y, α). Elle définit une famille de courbes d’indifférence reliant zi, à x, l’«argent». Pour une caractéristique individuelle zi, θ est le taux marginal de substitution entre z,j et l’argent ou l’évaluation marginale implicite de zi par le consommateur aux goûts α à un niveau donné d’utilité et de revenu. C’est une indication du prix de la demande de réservation8 d’une unité supplémentaire de zi9. Le prix de marché est p(z) et l’utilité est maximisée quand θ(z;u,y,α)= p(z); c’est-à-dire que l’achat se produit lorsque la surface de la courbe d’indifférence θ est tangente à la surface de prix hédoniques. Si divers acheteurs ont des fonctions de valeur (goûts) différentes, certains acquerront un montant plus élevé d’une caractéristique que d’autres pour une fonction de prix donné comme l’illustre le graphique 21.1.

21.17 La fonction de distribution conjointe des goûts et des revenus donne une famille de fonctions de valeur; chacune d’entre elles, quand elle est tangente à une fonction de prix, décrit un achat et définit simultanément la fonction de prix dont l’enveloppe est la fonction de prix hédoniques de marché. Les points d’achat tracés par la fonction hédonique dépendent donc du budget et des goûts du consommateur individuel qui acquiert une gamme individuelle de caractéristiques. Pour tracer les fonctions de demande, on doit spécifier la distribution conjointe de probabilités des consommateurs ayant des budgets et des goûts particuliers qui se manifestent sur le marché, c’est-à-dire F(y, α). Cette fonction ainsi que l’équation (21.1) permettent de représenter les équations de demande pour chaque caractéristique.

Le producteur ou l’offre

21.18 Le graphique 21.1, tiré de Triplett (1987), montre aussi l’aspect production. Considérons un producteur maximisant ses revenus dont le problème de maximisation est décrit par10:

R(p,v) est la valeur maximum de la production Σn=1Npnqn, que l’établissement peut réaliser, sachant qu’il est confronté au vecteur de prix à la production p et que le vecteur d’intrants v est disponible en utilisant la période technologique t. On se souviendra que le graphique 17.1 illustre en espace-produits comment le producteur choisirait entre différentes combinaisons de produits q1 et q2. Dans le graphique 21.1, le problème de l’espace-caractéristiques est celui du choix que font les producteurs entre des combinaisons de z1 et z2 pour fabriquer à un certain niveau de technologie et d’intrants S(v). Pour un producteur particulier ayant un niveau d’intrants et de technologie S*G et confronté à une surface de prix p1, la combinaison optimale de production se situe à A. Mais un producteur différent, doté d’une technologie et d’intrants S*H, et confronté à une surface de prix p1, produirait à B. À ces points, le coût marginal de z1 par rapport à z2 est égal à son prix marginal de la surface hédonique, tel qu’indiqué par le point de tangence. Dans ces circonstances, la production avec toute autre combinaison ne serait pas optimale. L’enveloppe de tangentes telle que S*G et S*H retrace les décisions d’optimisation de production que l’on observerait sur le marché de la part de producteurs subissant les prix et elles sont utilisées comme données pour estimer les régressions hédoniques. On peut considérer la fonction hédonique comme déterminée en partie par la distribution des technologies des producteurs, incluant leur échelle de production.

21.19Rosen (1974) formalise le côté production, en faisant l’hypothèse que les producteurs qui subissent les prix ont des fonctions de coût décrites par C(Q, z; τ),11 dans lesquelles Q = Q(z) est l’échelle des produits—c’est-à-dire le nombre d’unités produites par un établissement qui offre les spécifications d’un produit élémentaire ayant les caractéristiques z. Les producteurs doivent décider quels produits élémentaires fabriquer, autrement dit quel ensemble de z. Pour le faire, on résout un problème de minimisation des coûts qui exige τ, équivalant à S(v) mentionné ci-dessus; c’est un vecteur de la technologie de chaque producteur décrivant les combinaisons de ses produits qu’il peut fabriquer à des coûts d’intrants donnés, en utilisant ses facteurs de production et de prix. C’est la variation de τ parmi les producteurs qui distingue la combinaison de z que le producteur A décide de fabriquer de celle du producteur B, dans le graphique 21.1. Les producteurs sont des «optimiseurs» qui cherchent à maximiser les profits, donnés par:

en sélectionnant Q et z de manière optimale. On suppose que le marché de l’offre est concurrentiel et que les producteurs subissent les prix—ils ne peuvent les influencer par une décision de production. La décision du producteur en ce qui concerne la quantité de chaque z à fabriquer est déterminée par le prix de z, en faisant l’hypothèse que le producteur peut faire varier Q et z dans le court terme12.

En divisant l’expression (21.4) par Q et en la mettant égale à zéro, les conditions de maximisation des profits du premier ordre sont données par:

p = p(z1, z2,…., zn) à partir de l’équation (21.1).

21.20 Le revenu unitaire marginal obtenu en produisant la caractéristique zi est donné par son prix virtuel dans la fonction de prix et par son coût marginal de production. S’agissant du producteur, la distribution de probabilités des technologies des firmes G(τ) est nécessaire pour connaître l’offre globale de produits élémentaires dotés d’ensembles de caractéristiques donnés. Comme le choix de la combinaison optimale de caractéristiques à produire est un problème de maximisation des profits, les revenus marginaux tirés des attributs supplémentaires doivent être égaux au coût marginal de production par unité vendue. La production continue jusqu’au point où les revenus unitaires p(z) sont égaux au coût marginal de production, évalué pour l’ensemble optimal de caractéristiques offert.

21.21 Alors que l’on a considéré une fonction de valeur pour les consommateurs, les producteurs nécessitent une fonction d’offre de caractéristiques φ(z; π, τ). Le prix d’offre est celui que le vendeur est disposé à accepter pour différentes valeurs de z à un niveau de profit constant, quand les quantités produites sont choisies de façon optimale, tandis que p(z) est le prix maximum pouvant être obtenu sur le marché pour ces modèles. L’équilibre de la production est caractérisé par une tangence entre une surface d’indifférence des caractéristiques de profits et la surface de prix des caractéristiques de marché, dans laquelle pi(zi) = φzi(z; πz; τ) et pi(zi) = φzi(z; πz; τ). Comme il existe une distribution de technologies G(τ), l’équilibre de production est caractérisé par une famille de fonctions d’offre de caractéristiques qui enveloppent la fonction de prix hédonique de marché. La variation de τ dépendra des différents prix de facteurs des produits élémentaires fabriqués dans divers pays, des entreprises multiproduits réalisant des économies d’échelle et des différences technologiques, qui peuvent porter sur la qualité du capital, de la maind’œuvre ou des intrants intermédiaires comme sur leur organisation. Une famille de surfaces de production est définie pour différentes valeurs de τ.

L’équilibre

21.22 Le cadre théorique définit d’abord chaque produit élémentaire comme un point sur un plan de plusieurs dimensions, fait des caractéristiques de qualité z1, z2, …., zn; chaque produit est une combinaison des valeurs z1, z2,…., zn. Si deux caractéristiques seulement définissent le produit, chaque point de l’espace positif du graphique 21.1 définirait un produit élémentaire. On n’achète pas les caractéristiques individuellement, mais en tant qu’ensemble lié pour constituer un produit élémentaire. On fait l’hypothèse d’une différenciation des marchés permettant une large gamme de choix13. Le marché est aussi censé être parfaitement concurrentiel, les consommateurs et les producteurs, sans influence sur les prix, adoptant un comportement d’optimisation, pour décider des produits élémentaires (ensembles inséparables de caractéristiques) à acheter et à vendre. On fait aussi l’hypothèse de marchés concurrentiels et de comportements d’optimisation de sorte que la quantité de produits élémentaires demandés soit égale à la quantité offerte. Comme les produits se composent de caractéristiques z, la quantité demandée de toutes ces caractéristiques doit égaler la quantité offerte. Il a été démontré que les choix des producteurs et des consommateurs—ou «positions» sur le plan—sont dictés par les goûts des consommateurs et la technologie des producteurs. Tauchen et Witte (2001, p. 4) montrent que la fonction de prix hédonique diffère entre les marchés selon les moyennes et les variances (et dans certains cas aussi selon les moments plus élevés) des distributions des caractéristiques des ménages et des entreprises.

21.23 Rosen (1974, p. 44) fait remarquer qu’un acheteur et un vendeur sont parfaitement appariés quand leurs fonctions respectives de valeur et d’offre sont tangentes l’une par rapport à l’autre. À ce point, le gradient commun est donné par le gradient de la fonction de prix implicite qui équilibre le marché, p(z). Les décisions de consommation et de production apparaissent dans les fonctions de valeur et d’offre à déterminer conjointement, F(y, α) et G(τ) pour des p(z) donnés. Sur des marchés concurrentiels, il y a détermination simultanée de l’équation hédonique, car la distribution de F(y, α) et de G(τ) contribue à déterminer les quantités demandées et offertes ainsi que la pente de la fonction. Les consommateurs et les producteurs prennent leurs décisions sans influencer les prix, mais les prix sont ceux de la fonction hédonique. Dans un sens, la fonction hédonique et ses prix virtuels émanent du fonctionnement des marchés. Les marchés de produits révèlent implicitement la fonction hédonique. Comme les consommateurs et les producteurs ont un comportement d’optimisation sur des marchés concurrentiels, la fonction hédonique donne en principe le prix minimum de chaque ensemble de caractéristiques. Compte tenu de tous ces éléments, Rosen (1974, p. 44) posait la question de la signification des prix hédoniques.

Ce que signifient les prix hédoniques

21.24 Il serait commode que, pour l’élaboration de l’indice des prix à la consommation, les coefficients estimés des régressions hédoniques soient des estimations de l’utilité marginale basées sur une caractéristique ou une valeur pour l’utilisateur. Mais la théorie nous dit qu’il n’en est rien et que l’interprétation n’est pas claire.

21.25 Dans les années 1960, on pensait à tort que les coefficients tirés des méthodes hédoniques représentaient des valeurs d’utilisation et non des coûts de ressources. Comme on l’a vu, Rosen (1974) a montré que les coefficients hédoniques reflétaient généralement les deux, c’est-à-dire des situations d’offre aussi bien que de demande. Les ratios de ces coefficients traduisent peut-être des taux marginaux de substitution des consommateurs ou des taux marginaux de substitution (transformation) des producteurs pour les caractéristiques. C’est ce que l’on appelle en économétrie un problème d’ «identification»: les prix et les quantités observés sont déterminés conjointement par des considérations d’offre et de demande, leurs sources sous-jacentes ne pouvant être séparées. Les données recueillies en matière de prix proviennent à la fois des variations de la demande de différents consommateurs n’ayant pas les mêmes goûts et préférences et de variations de l’offre de producteurs utilisant des technologies diverses.

21.26 Il faut d’abord résoudre ce problème de simultanéité. Les régressions hédoniques sont un instrument d’analyse de plus en plus important, implicitement promu par l’attention que lui porte le présent manuel, mais aussi popularisé par les manuels d’organisations comme l’OCDE [voir Triplett (2002) et Eurostat (2001a)]; par ailleurs, aux États-Unis, le Bureau des statistiques du travail l’utilise largement [voir Kokoski, Waehrer and Rozaklis (2001) ainsi que Moulton (2001)]. Dès lors, comment les économistes qui s’expriment sur le sujet peuvent-ils négliger ces conclusions?

Rosen (1974, p. 43) se réfère en ces termes à la fonction hédonique:

… une enveloppe conjointe d’une famille de fonctions de valeur et d’une autre famille de fonctions d’offre. Une fonction d’enveloppe ne révèle rien par elle-même des composantes sous-jacentes qui la génèrent; et elles-mêmes constituent la structure génératrice des observations.

Griliches (1988, p. 120) fait les remarques suivantes:

Je pense, pour ma part, que la méthode hédonique tente d’estimer des aspects de la contrainte budgétaire des consommateurs, ce qui permet d’estimer les prix «manquants» quand la qualité change. Elle n’a pas en soi pour but d’estimer des fonctions d’utilité, bien qu’elle puisse aussi être utile à cette fin…ou estime le lieu géométrique réel de l’intersection des courbes de demande de différents consommateurs aux goûts variables et des courbes d’offre de divers producteurs ayant peut-être des technologies de production variables. Il est donc improbable que l’on puisse tirer de ces seules données l’utilité sous-jacente et des fonctions de coût, sauf dans des circonstances très particulières.

Triplett (1987) écrit:

Il est bien établi—mais pas encore largement compris—que l’on ne peut calculer la formule de h(•) [la fonction hédonique] à partir de la formule de Q(•) et de t (•) [les fonctions d’utilité et de production], pas plus que h(•) ne représente une «formulation réduite» des fonctions d’offre et de demande dérivées de Q(•) et de t (•).

Diewert (2003a, p. 320), qui se concentre sur le côté consommation, déclare:

Je suis donc l’exemple de Muellbauer (1974, p. 977) quand il dit que sa «conception est délibérément unilatérale; seul l’aspect demande est traité». L’objet de sa réflexion est donc assez différent de celui de la récente étude de Sherwin Rosen. Les problèmes d’offre et de simultanéité qui peuvent se poser sont ignorés.

21.27 L’approche de Diewert (2003a) est intéressante, parce que le calcul des estimations des coefficients hédoniques ne porte que sur l’aspect demande. Il est utile d’examiner les conditions dans lesquelles les coefficients hédoniques sont déterminés exclusivement par des facteurs de demande ou d’offre—les circonstances où des explications claires seraient valides. Le problème est le suivant: comme les coefficients d’une fonction hédonique sont le résultat de l’interaction des comportements d’optimisation des consommateurs et des producteurs, on ne peut interpréter la fonction sous le seul angle des coûts marginaux de production ou des valeurs marginales de consommation, par exemple. Mais supposons que la technologie de production τ soit la même pour chaque établissement producteur. Les acheteurs sont différents, mais les vendeurs sont identiques. Au lieu d’une famille de fonctions d’offre prêtant à confusion, il y a une fonction d’offre unique et la fonction hédonique décrit les prix des caractéristiques que la firme offrira, avec la technologie dominante donnée, pour satisfaire le dosage actuel des goûts. La fonction p(z) devient la fonction d’offre en l’absence d’une distribution de τ, source de confusion. Les consommateurs ayant des goûts différents, ce qui apparaît sur le marché est le résultat des efforts des fabricants pour satisfaire les préférences des consommateurs, à technologie et à niveau de profits constants pour tous; la fonction de prix hédonique révèle la structure de l’offre. Dans le graphique 21.1, seul le sentier d’expansion que trace, par exemple, SH* similaire à AA’ serait révélé. Supposons maintenant que les vendeurs soient différents, mais que les goûts des acheteurs α soient identiques. Dans ce cas, la famille de fonctions de valeur ne peut pas être révélée comme la fonction hédonique p(z) qui identifie la structure de la demande, comme AA’ dans le graphique 21.114. Triplett (1987, p. 632) relève que l’uniformité des technologies est la plus vraisemblable des éventualités, surtout quand l’accès aux technologies est sans restriction à long terme, alors que l’uniformité des goûts est improbable. Il peut naturellement exister des marchés segmentés où les goûts sont plus uniformes, donnant lieu à la conception d’ensembles spécifiques de produits élémentaires et pour lesquels on peut estimer des équations hédoniques intéressant des segments individuels15.

21.28 L’analyse effectuée aux paragraphes 21.12 à 21.27 démontre l’ambiguïté qui caractérise l’interprétation des coefficients hédoniques. Cette analyse est nécessaire, parce que les problèmes d’estimation des fonctions sous-jacentes d’offre et de demande des caractéristiques ont des implications pour l’estimation des fonctions hédoniques. C’est à la lumière de cet état de fait que l’appendice 21.1 examine les problèmes d’identification et d’estimation. On trouve dans la partie suivante un autre calcul théorique, inspiré de Diewert (2003a), qui indique les hypothèses requises pour une interprétation fondée sur la demande (le consommateur).

Autre formulation théorique hédonique, basée sur le consommateur

21.29 Dans cette partie, on utilise une méthode basée sur le consommateur pour calculer les fonctions hédoniques théoriques. On suppose que:

  • tous les consommateurs ont la même fonction de sous-utilité séparable f(z1,…,zN); elle leur donne la sous-utilité Z = f(z), quand ils achètent une unité du produit hédonique complexe qui a le vecteur de caractéristiques z = (z1,…,zN)16;

  • la sous-utilité obtenue par le consommateur en achetant Z unités du produit hédonique se conjugue à la consommation de X unités d’un «autre» produit composite pour lui procurer une utilité globale de u = Ut(X,Z) dans la période t, où Ut est la fonction d’utilité «macro» de la période t. Rosen (1974, p. 38) a normalisé le prix de X pour qu’il soit égal à unité. Cela n’est pas nécessaire avec la présente méthode. À la place, il y a un prix explicite de la période t, pt, pour une unité du produit X de consommation générale.

21.30 Avec cette méthode, on commence par considérer l’ensemble de combinaisons X et Z, avec lequel on peut obtenir le niveau d’utilité ut de la période de consommation t. C’est l’ensemble{(X,Z): Ut(X,Z) = ut} qui est la courbe d’indifférence de la période de consommation t au-dessus des combinaisons équivalentes du produit X de consommation générale et du produit hédonique Z. L’équation Ut(X,Z) = ut pour X est résolue comme une fonction de ut et Z; c’est-à-dire17

On suppose que la courbe d’indifférence soit décroissante et on fait l’hypothèse plus forte que gt soit déri-vable en Z et que:

Posons que pt et Pt soient les prix d’une unité de X et de Z, respectivement, pendant la période t. Le problème de minimisation de la dépense du consommateur en période t peut être défini comme suit:

La condition nécessaire de premier ordre pour Z afin de résoudre l’équation (21.8) est:

On peut modifier l’équation 21.9 pour donner le prix de l’agrégat hédonique Pt comme fonction du niveau d’utilité ut de la période t et le prix de consommation générale pt:

où l’inégalité procède de l’hypothèse (21.7). On peut maintenant interpréter la partie droite de l’équation (21.10) comme la fonction de prix que le consommateur serait prêt à payer en période t:

21.31 Ainsi, pour chaque point (indexé par Z) de la courbe d’indifférence de la période de consommation t, l’équation (21.11) indique le montant monétaire que le consommateur serait prêt à payer par unité de Z afin de rester sur la même courbe d’indifférence, qui est indexée par le niveau d’utilité ut. On peut maintenant définir la fonction de valeur vt de la volonté de payer en période t comme le produit de la quantité de Z consommée multiplié par la volonté par unité correspondante de payer le prix, wt(Z, ut, pt):

où la dernière égalité procède de l’équation (21.11). La fonction vt est la contrepartie de la fonction de valeur ou d’offre de consommateurs de Rosen (1974, p. 38). Elle nous donne le montant que le consommateur est prêt à dépenser pour consommer Z unités. La présentation algébrique ci-dessus a une interprétation indépendante du modèle hédonique; elle expose simplement comment calculer une fonction de la volonté de payer un prix et une valeur en utilisant les préférences définies d’un consommateur pour deux produits.

21.32 On suppose maintenant que le consommateur a une fonction de sous-utilité séparable, f(z1,…,zN), qui lui procure la sous-utilité Z = f(z) quand il achète une unité du produit hédonique complexe18 ayant le vecteur de caractéristiques z = (z1,…,zN). Notons que l’on a supposé que la fonction f était invariante dans le temps. Supposons que la fonction d’utilité de la période de consommation t soit Ut(X, f(z)). La démonstration algébrique ci-dessus relative à la volonté de payer reste valide. En particulier, la fonction de prix de la volonté de payer de la nouvelle période t, pour un modèle spécifique doté des caractéristiques z = (z1,…,zN), est:

La fonction de prix de la volonté de payer de la nouvelle période t (qui est le montant monétaire que le consommateur est prêt à régler pour disposer des services d’un modèle ayant le vecteur de caractéristiques z) est:

21.33 Supposons maintenant que le consommateur dispose de Kt modèles dans la période t sachant que le modèle k se vend au prix unitaire de Pkt et a le vecteur de caractéristiques zkt=(z1kt,,zNkt) pour k = 1,2,…,K. Si le consommateur achète une unité de modèle k dans la période t, le prix du modèle peut être considéré comme égal à la volonté appropriée de payer la valeur définie par l’équation (21.14), où z est remplacé par zkt l’équation suivante devrait donc se vérifier:

Quelle est la signification de l’hypothèse de séparabilité? Supposons que le produit hédonique soit une automobile et qu’elle n’ait que trois caractéristiques: le nombre de sièges, la consommation de carburant et la puissance en chevaux. L’hypothèse de séparabilité signifie que le consommateur peut arbitrer ces trois caractéristiques et déterminer l’utilité de tout véhicule à partir d’un dosage quelconque des trois caractéristiques, indépendamment de ses autres choix de produits. En particulier, le classement des modèles d’automobile selon leur utilité est indépendant du nombre d’enfants que le consommateur peut avoir ou du prix de l’essence. À l’évidence, l’hypothèse de séparabilité a peu de chances de se vérifier exactement dans le monde réel, mais, malgré son caractère quelque peu restrictif, elle est nécessaire au fonctionnement de notre modèle.

21.34 Un autre aspect de notre modèle appelle des explications supplémentaires. On suppose explicitement que les consommateurs ne puissent acheter des unités fractionnées de chaque modèle; ils ne peuvent acquérir qu’un nombre entier non négatif de chacun. On fait explicitement l’hypothèse d’indivisibilités dans la partie offre du modèle. Dans chaque période, on ne dispose donc que d’un nombre limité de modèles du produit hédonique. Alors que le consommateur est supposé avoir des préférences continues à l’égard de toutes les combinaisons possibles de caractéristiques (z1,…,zN), dans chaque période il n’existe sur le marché qu’un nombre limité de modèles isolés.

21.35 À ce stade, on spécialise davantage le modèle. On suppose que tous les consommateurs aient la même fonction de sous-utilité hédonique19f(z) et que le consommateur i ait, dans la période t, la fonction linéaire de macro-utilité de courbe d’indifférence suivante:

at et bit sont des constantes positives.

Pour chaque période t et chaque consommateur i, la courbe d’indifférence de la période t entre les combinaisons de X et Z est linéaire, avec la pente constante – at identique pour tous les consommateurs20. On notera que la pente peut varier dans le temps. Dérivons maintenant l’équation 21.16 par rapport à Z et remplaçons cette dérivée partielle dans l’équation (21.15). L’équation qui en résulte est21:

Définissons le prix agrégé d’une unité de Z dans la période t comme22:

Remplaçons maintenant l’équation 21.18 dans l’équation 21.17, afin d’obtenir notre système d’équations hédoniques de base23.

21.36 Pour obtenir un modèle de régression hédo-nique de base, il suffit de postuler une forme fonctionnelle pour la fonction de sous-utilité hédonique f et d’ajouter une spécification stochastique à l’équation (21.19). On peut alors estimer les paramètres inconnus de f ainsi que les paramètres de prix rt de la période t24. Il est possible de généraliser le modèle ci-dessus, mais d’obtenir le même modèle (21.19) si l’«autre» produit composite X est remplacé par h(x), x étant un vecteur de consommation et h une fonction agrégative linéaire homogène croissante et concave. Avec ces nouvelles hypothèses, on a, au lieu de l’équation (21.17), les résultats suivants:

pt est maintenant le vecteur des prix des produits x dans la période t, tandis que c est le coût de l’unité ou la fonction de dépense qui est duale à h25. Redéfinissons maintenant rt comme c(pt)at et l’on obtient encore le système basique d’équations hédoniques (21.19). L’équation (21.19) a une propriété qui est susceptible de figurer dans les modèles plus complexes et réalistes de choix des consommateurs. Cette propriété est que les prix des modèles de la période t ont une homogénéité de degré un dans le niveau général des prix pt. Par conséquent, si pt est remplacé par λpt pour tout λ > 0 (pensons à une soudaine hyperinflation où λ est de montant élevé), les équations (21.17) et (21.19) impliquent que les prix des modèles deviennent λPkt. On remarque aussi que cette propriété d’homogénéité ne vaudra pas pour le modèle hédonique supplémentaire ci-après:

On peut donc éliminer a priori les régressions hédoniques basées sur le modèle linéaire (21.21). Notons que les modèles hédoniques avec le logarithme du prix de modèle Pkt comme variable de dépendance tendront à être compatibles avec les équations hédoniques de base (21.19); en revanche, les modèles linéaires comme (21.21) ne seront pas conformes aux propriétés normales d’homogénéité qu’implique la théorie microéconomique.

Les indices hédoniques

21.37 On a signalé plus haut que les indices hédo-niques étaient nécessaires à l’ajustement de la qualité pour deux raisons. D’abord, quand un produit élémentaire n’est plus disponible et quand le produit remplaçant, dont on utilise le prix pour poursuivre la série, n’est pas de la même qualité que la base de prix originelle. Les écarts de qualité peuvent être exprimés sous forme de valeurs différentes d’un sous-ensemble de variables z déterminant le prix. Les coefficients des régressions hédoniques, qui sont des estimations de la valeur monétaire d’unités supplémentaires de chaque composante de qualité z, peuvent alors être utilisés pour ajuster, par exemple, le prix de l’ancien produit élémentaire, afin de le rendre comparable au prix du nouveau26—ainsi on compare encore ce qui est de même nature. On peut décrire ce processus comme un «rafistolage», dans la mesure où il faut ajuster le prix de l’ancienne série (ou de la nouvelle série de remplacement) en fonction des différences de qualité, pour pouvoir accoler la nouvelle série à l’ancienne. La deuxième utilisation des fonctions hédoniques est l’estimation des indices hédoniques. Ces derniers conviennent quand le rythme et l’échelle des remplacements de produits élémentaires sont substantiels et quand un usage extensif du «rafistolage» risque de mener à de nombreuses erreurs, s’il y a un défaut ou un biais dans le processus d’ajustement qualitatif, et à un échantillonnage sur la base d’un univers de remplacement biaisé (comme on l’a vu dans les paragraphes 21.12 à 21.36). Dans chaque période, les indices hédoniques utilisent des données tirées d’un échantillon renouvelé de produits, qui doit inclure ceux qui représentent une part significative des dépenses—l’échantillonnage utilisant pour chaque période l’univers double. Il n’est pas nécessaire d’établir un ensemble présélectionné de produits à apparier et les collecteurs de prix ne sont pas obligés de recueillir les prix de cet ensemble. Ce que l’on doit faire est une révision mensuelle des échantillons de produits ainsi que des informations sur leurs prix, leurs caractéristiques et, si possible, leurs quantités/valeurs. Dans les régressions hédoniques, la répartition («partialling out») contrôle les différences de qualité, contrairement à l’appariement des prix pratiqués par ceux qui les collectent. Il existe plusieurs procédures pour estimer les indices hédoniques et nous les examinons brièvement ci-dessous.

Les indices théoriques de prix des caractéristiques

21.38 Les indices théoriques du coût de la vie sont définis au chapitres 17 et on considère les formules des indices pratiques comme des estimations des premiers. Ici, les chiffres des indices théoriques ne portent pas seulement sur les produits fabriqués, mais aussi sur leurs caractéristiques. La famille établie par Konüs (1924) d’indices véritables du coût de la vie concerne deux périodes, où le consommateur est confronté aux vecteurs de prix strictement positifs p0=(p10,pN0) et p1=(p11,,pN1) dans les périodes 0 et 1 respectivement; elle a été définie au chapitres 17 comme le ratio des coûts minimums de réalisation du même niveau d’utilité u =f(q), où q = (q1,…,qN) est un vecteur positif de quantité de référence; on a:

Pour les indices théoriques de l’espace de caractéristiques, on définit aussi les fonctions de revenus pour des biens faits d’ensembles de caractéristiques représentés par la fonction hédonique27:

21.39 L’indice de prix théorique défini par l’équation (21.23) est un ratio des coûts hypothétiques supportés par les consommateurs pour atteindre une utilité donnée, pendant la période 1, comparés à ceux de la période 0. L’équation (21.23) incorpore des effets de substitution: si les prix de certaines caractéristiques augmentent plus que ceux de certaines autres, les consommateurs maximisant l’utilité peuvent modifier le dosage de caractéristiques de produits en leur faveur. Le numérateur de l’équation (21.23) est le coût de l’utilité maximum que le consommateur pourrait obtenir, s’il était confronté aux prix des produits et aux prix hédo-niques virtuels implicites de la période 1, p1 et p(z1); le dénominateur de l’équation (21.23) est l’utilité maximum qu’il pourrait obtenir avec les prix des produits et des caractéristiques de la période 0, p0 et p(z0). On remarquera que toutes les variables des fonctions du numérateur et du dénominateur sont exactement les mêmes, si ce n’est que les vecteurs des prix des produits et des caractéristiques diffèrent. C’est un trait qui définit un indice de prix. Comme pour les indices économiques du chapitres 15, il existe bien sûr une famille entière d’indices en fonction du niveau d’utilité de référence choisi. Certaines formulations explicites sont examinées aux paragraphes 21.48 à 21.58, parmi lesquelles un niveau de référence de la période de base 0 et un niveau de référence de la période actuelle 1, analogues au calcul des indices de Laspeyres et de Paasche exposé au chapitres 17. Avant d’examiner ces indices hédoniques, on présente deux formulations plus simples: les régressions hédoniques utilisant des variables indicatrices temporelles (paragraphes 21.40 à 21.42) et les indices hédoniques d’imputation (paragraphes 21.43 à 21.47). Elles sont simples et d’usage très courant, parce qu’elles n’exigent pas d’informations sur les quantités ou les pondérations. Comme elles ne demandent pas non plus de données appariées, on peut y avoir recours quand on rééchantillonne toutes les données. Mais, de ce fait, leur interprétation théorique est plus limitée. Comme on le verra à l’appendice 21.1, des formulations pondérées sont néanmoins possibles au moyen d’un estimateur de moindres carrés pondérés.

Régressions hédoniques et indicatrices temporelles

21.40 Supposons qu’il y ait K caractéristiques d’un produit et que le modèle ou le produit élémentaire i ait, dans la période t, le vecteur de caractéristiques zit=zit=[zi1t,,zikt] pour i = 1,…., I et t = 1,…,T. Notons par pit le prix du modèle i dans la période t. Une régression hé-donique du prix du modèle i, dans la période t, sur son ensemble de caractéristiques zit est donnée par:

Dt sont des variables indicatrices pour les périodes temporelles, D2 étant 1 dans la période t=2 et zéro autrement. D3 est 1 dans la période t=3, et zéro autrement, etc. Les coefficients γt sont des estimateurs des changements de prix ajustés de l’effet de qualité, en contrôlant les effets de la variation de qualité qualitative (via Σk=1Kβkzikt)—voir cependant Goldberger (1968) ainsi que Teekens and Koerts (1972) pour l’ajustement pour le biais d’estimation.

21.41 La méthode ci-dessus utilise les variables indicatrices temporelles pour comparer les prix de la période 1 à ceux de toutes les périodes suivantes. À cette fin, on contraint les paramètres βk à être constants pendant la période t = 1,…, T. Cette technique est rétrospectivement satisfaisante, mais, en temps réel, on peut estimer l’indice comme une formulation à base fixe ou en chaîne. La formulation à base fixe estimerait l’indice pour les périodes 1 et 2, I1,2, en utilisant l’équation (21.24) pour t = 1,2; l’indice pour la période 3, I1,3, utiliserait l’équation (21.24) pour t = 1,3; l’indice pour la période 4, I1,4, utiliserait l’équation (21.24) pour t = 1,4, etc. Dans ces cas, la variable indicatrice prendrait les valeurs de 1 pour la période actuelle et de 0 pour la période de référence des prix. À cette fin, pour I1,4 ce serait 1 pour les observations de la période 4 et 0 autrement, c’est-à-dire pour les observations de la période 1. Seules les données des périodes 1 et 4 sont employées pour l’équation estimée. Le coefficient de la variable indicatrice est une estimation du changement de prix ajusté de l’effet qualité. Dans chaque cas, l’indice contraint les coefficients estimés des caractéristiques de qualité à être les mêmes pour la période actuelle et celle de référence des prix, les périodes 1 et 4. Une comparaison bilatérale à base fixe utilisant l’équation (21.24) recourt aux estimations de paramètres contraints pour les deux périodes de comparaison des prix. Ainsi, une formulation en chaîne estimerait I1,4, comme le résultat d’une série de liens: 11,4 = I1,2 × I2,3 × I3,4. Chaque comparaison binaire successive, ou lien, est combiné par multiplications successives. On estime l’indice de chaque lien au moyen de l’équation (21.24). Comme les périodes comparées sont proches, il est généralement considéré comme plus probable que les contraintes des paramètres exigées par les indices hé-doniques en chaîne à variables indicatrices temporelles, soient moins sévères que celles exigées de leurs homologues à base fixe.

21.42 Il n’y a pas de pondération explicite dans ces formulations et c’est un sérieux désavantage. En pratique, on peut employer l’échantillonnage avec seuil d’inclusion pour ne retenir que les produits les plus importants. Si l’on dispose de données de ventes, on devra utiliser un estimateur de moindres carrés pondéré (par les parts relatives dans les ventes; voir appendice 21.1), et non un estimateur ordinaire (MCO)28. Avec cette méthode, on n’a pas besoin de données appariées; les produits élémentaires peuvent être rééchantillonnés dans chaque période pour inclure de nouvelles technologies.

Les indices hédoniques d’imputation

21.43 Une autre approche possible pour comparer les périodes 1 et t consiste à estimer une régression hédonique pour la période t et à insérer les valeurs des caractéristiques de chaque modèle existant en période 1 dans la régression de la période t, pour prévoir le prix de chaque produit élémentaire p^it(zi1). Cela donnerait des prévisions de prix des produits qui existent en période 1 à des prix virtuels de la période p^it(zi1), i = 1,…,N. Il est possible de comparer ces prix (ou une moyenne) à la moyenne des prix réels des modèles i = 1,…,N en période 1. Les moyennes peuvent être arithmétiques, comme dans un indice de Dutot, ou géométriques, comme dans un indice de Jevons. La formulation arithmétique est la suivante:

21.44 Une autre possibilité est d’insérer les caractéristiques des modèles qui existent dans la période t dans une régression pour la période 1. Les prix prévus des produits élémentaires de la période t, générés aux prix virtuels de la période 1 (ou une moyenne), peuvent être comparés à (la moyenne des) prix réels de la période t:

21.45 Pour une comparaison bilatérale à base fixe utilisant la formule (21.25a) ou la formule (21.25b), il ne faut estimer l’équation hédonique que pour une période. Le dénominateur de la formule (21.25a) est le prix moyen observé pendant la période 1; il devrait être égal au prix moyen qu’une régression hédonique, basée sur les données de la période 1, prévoira en utilisant les caractéristiques de la période 1. Toutefois, le numérateur a besoin d’une régression hédonique estimée pour prévoir les caractéristiques de la période 1 aux prix hédoniques de la période t. De même, dans la formule (21.25b), une régression hédonique n’est nécessaire que pour le dénominateur. Pour des raisons analogues à celles expliquées au chapitres 15, une moyenne symétrique de ces indices devrait avoir un certain appui théorique.

21.46 On notera que tous les indices décrits aux paragraphes 21.40 à 21.45 peuvent employer des données appariées ou toutes les données disponibles à chaque période. S’il y a un nouveau produit élémentaire dans la période 4, par exemple, il est inclus dans les ensembles de données et la régression contrôle ses différences de qualité. De la même façon, si d’anciens produits disparaissent, ils figurent toujours dans les indices des périodes où ils existent. Cela fait partie de la procédure d’estimation naturelle et diffère de l’usage des régressions hédoniques pour les seuls ajustements de prix de produits non comparables.

21.47 De même que pour la méthode des variables indicatrices, les données appariées ne sont pas nécessaires. Mais, dans ces formulations, on ne recourt pas explicitement à la pondération des quantités, ce qui constitue un sérieux inconvénient. Si l’on disposait de données sur les quantités ou les valeurs, il apparaîtrait immédiatement possible de les rattacher aux prix individuels i = 1,…,N ou à leurs estimateurs. Ce point est traité dans la partie suivante.

Les indices hédoniques superlatifs et exacts

21.48 Au chapitres 17, les limites de Laspeyres et Paasche ont été définies sur une base théorique au même titre que les indices superlatifs qui traitent les deux périodes symétriquement. Ces formules superlatives comprenaient l’indice de Fisher, dont les propriétés axiomatiques souhaitables ont été indiquées au chapitres 16. En outre, l’indice de Fisher a été soutenu par la théorie économique en tant que moyenne symétrique des limites de Laspeyres et de Paasche, et on s’est aperçu qu’il était, d’un point de vue axiomatique, la moyenne la plus appropriée des deux. L’indice de Törnqvist possédait aussi des propriétés axiomatiques désirables, semblait le meilleur au point de vue stochastique et n’exigeait pas de fortes hypothèses pour être calculé par la méthode économique comme indice superlatif. Les indices de Laspeyres et de Paasche se sont avérés correspondre aux (être exacts pour les) fonctions d’agrégateur sous-jacentes (Leontief) sans possibilités de substitution; les indices superlatifs étaient, eux, exacts pour des formes fonctionnelles flexibles, notamment les formes quadratiques et translog des indices de Fisher et de Törnqvist. Si l’on dispose de données relatives aux prix, aux caractéristiques et aux quantités, des approches et des résultats analogues s’appliqent aux indices hédoniques; voir Fixler and Zieschang (1992) ainsi que Feenstra (1995). Feenstra (1995) a défini les limites exactes d’un indice de ce type. Considérons l’indice théorique de l’équation (21.23), mais seulement défini maintenant par les caractéristiques des produits élémentaires. Bien que les prix soient toujours ceux des produits, ils se définissent intégralement par p(z). L’agrégation arithmétique d’une équation hédonique linéaire montre qu’une limite supérieure de Laspeyres (les quantités offertes diminuant quand les prix relatifs augmentent) est donnée par:

où la partie droite de l’équation est le ratio du coût de réalisation d’un niveau d’utilité (ut−1) de la période t–1, tandis que l’utilité est une fonction du vecteur de quantités; on a donc ut–1 = f(xt–1); la comparaison des prix est évaluée à un niveau fixe de quantités de la période t –1 et sit–1 sont les parts dans la valeur totale des dépenses du produit i pour la période t–1:

21.49 La différence entre une formule de Laspeyres et la partie gauche de l’équation (21.26a) est que le prix figurant dans le numérateur de la partie gauche de l’équation (21.26a) est un prix prédit:

où, si l’on utilise un remplacement non comparable, le prix prédit s’ajuste en fonction de la différence de qualité entre les produits anciens et nouveaux. De fait, le prix prédit

est le prix de la période t, ajusté pour tenir compte de la somme des changements de chaque caractéristique de qualité, pondérée par les coefficients obtenus d’une régression hédonique linéaire. On notera que la sommation porte sur le même i dans les deux périodes, puisque l’on inclut les remplacements en cas d’absence d’un produit; de plus, (21.26c) ajuste les prix de la période t en fonction des différences de qualité via Σk=1Kβkt(ziktzikt1).

21.50 Une limite inférieure de Paasche est estimée comme:

ou oùsit=xitpit/Σj=1Nxjtpjt

qui sont respectivement les ajustements au titre de l’imputation et du remplacement. Il s’agit des prix des périodes t–1 ajustés de la somme des changements de chaque caractéristique de qualité, pondérée par leurs coefficients respectifs dérivés d’une régression hédonique linéaire.

21.51 Suite aux inégalités de (17.5), où les indices de Laspeyres PL et de Paasche PP forment des limites (17.8) sur leurs «véritables» indices économiques théoriques PK, on a:

Un indice approprié est donc une moyenne géométrique de Fisher des indices de Laspeyres PL et de Paasche Pp qui incorpore des ajustements hédoniques au titre des différences de qualité.

21.52 Ainsi, la méthode fondée sur l’usage des indices hédoniques exacts et superlatifs applique d’abord les coefficients des régressions hédoniques aux changements de caractéristiques, pour ajuster les prix observés en fonction des changements qualitatifs. Ensuite, elle incorpore un système de pondération employant des données relatives aux quantités vendues de chaque modèle et à leurs caractéristiques, au lieu de traiter tous les modèles comme étant d’importance égale. Enfin, elle correspond directement à la formulation définie à partir de la théorie économique.

21.53 Les régressions hédoniques semi-logarithmiques fourniraient un ensemble de coefficients β pouvant être utilisés avec les limites géométriques de la période de base et de la période actuelle:

21.54 Dans l’inégalité (21.29a), on a montré ensemble les deux limites des indices théoriques respectifs. Calculer ces indices est relativement simple pour des données appariées, mais plus complexe pour des données qui ne le sont pas. Pour un exemple d’application de comparaisons non appariées dans le temps, voir Silver and Heravi (2002; 2003) et le chapitres 7, paragraphes 7.132 à 7.152; on se reportera à Kokoski, Moulton, and Zieschang (1999) pour des comparaisons de prix appariés entre régions d’un pays.

21.55 On peut aussi définir des indices hédoniques exacts au moyen du cadre théorique exposé par Diewert (2003a)29. Revenons à l’équation hédonique de base (21.19). Supposons que le prix Pkt soit le prix moyen de tous les modèles de type k vendus pendant la période t et que qkt soit le nombre d’unités du modèle k vendues pendant la période t. On se souvient que le nombre de modèles sur le marché pendant la période t est Kt. Faisons l’hypothèse qu’il existe K modèles sur le marché pendant toutes les périodes T de notre période d’échantillon. Si un modèle particulier k n’est pas du tout commercialisé au cours de la période t, on supposera alors que Pkt et qkt soient tous deux égaux à zéro. En ayant ces conventions à l’esprit, la valeur totale des achats des consommateurs pendant la période t est la suivante:

21.56 La fonction hédonique de sous-utilité f a fait tout le travail difficile du modèle en convertissant l’utilité produite par le modèle k dans la période t en une utilité «standard» f(zk), qui est cardinalement comparable dans tous les modèles. Pour chaque modèle de type k, il suffit de la multiplier par le nombre total d’unités vendues pendant la période t, qkt, pour obtenir la quantité totale sur le marché du produit hédonique pendant la période t, Qt. On obtient30:

21.57 Le prix agrégé du produit hédonique correspondant à Qt est rt. Ainsi, dans le modèle très simplifié décrit aux paragraphes 21.29 à 21.36, le prix et la quantité agrégés exacts de la période t pour le produit hédonique sont rt et Qt définis par l’équation (21.31); on peut les calculer aisément à condition que l’on ait estimé les paramètres de la régression hédonique et que les données relatives aux quantités vendues soient disponibles pour chaque période qkt31. Une fois que l’on a déterminé rt et Qt pour t = 1,…,T, ces estimations de prix et de quantités agrégés du produit hédonique peuvent être associées aux prix et aux quantités agrégés de produits non hédoniques au moyen de la théorie normale d’indice de prix. En utilisant l’information sur les quantités, on peut définir toutes les formules d’indice considérées au chapitres 17, que ce soient Laspeyres, Paasche ou Fisher.

21.58 Les développements qui précèdent illustrent comment on pourrait élaborer des formules d’indices ajustées de l’effet de qualité, en utilisant les données sur les prix, les quantités et les caractéristiques d’un produit élémentaire. La méthode qui emploie des variables indicatrices temporelles, décrite aux paragraphes 21.40 à 21.42, ne nécessite pas de données appariées. L’appendice 21.1 décrit un système de pondération. L’emploi d’indices superlatifs pondérés pour les données appariées a été décrit plus haut. On peut aussi appliquer des indices superlatifs pondérés à des données non appariées, au moyen d’une méthode expliquée au chapitres 7 ainsi que dans Silver and Heravi (2001a; 2001b; 2003). Mais qu’en est-il des indices non pondérés, qui faisaient l’objet de la partie initiale de ce chapitre? Quelle est la relation entre l’indice hédonique non pondéré à variables indicatrices temporelles (décrit aux paragraphes 21.40 à 21.42), qui utilise toutes les données, et les formules d’indices non pondérés appariés? La question est d’importance critique pour les domaines où la rotation des produits élémentaires est rapide. On a suggéré antérieurement d’utiliser la méthode des variables indicatrices temporelles au lieu de la méthode appariée. En quoi diffèrent-elles donc pour les indices non pondérés? L’appendice 21.1 traite l’effet et l’usage des pondérations.

Indices hédoniques non pondérés et formules d’indices appariés non pondérés

21.59 Selon Triplett (2002) et Diewert (2003a), un indice de Jevons de moyenne géométrique non pondéré (voir équation (20.3) pour des données appariées donne le même résultat qu’un indice hédonique logarithmique à variables indicatrices employé avec les mêmes données. Pour des modèles appariés, un indice de régression hédonique à variables indicatrices, comme dans l’équation (21.24), mais en forme double logarithmique (log-log), peut être (voir Aizcorbe, Corrado, and Doms (2001)) égal à:

m est l’échantillon apparié, Zt et Zt–1 étant les ajustements qualitatifs des variables indicatrices temporelles dans l’équation (21.24), c’est-à-dire Σk=1Kβkzkt. L’équation (21.32) est simplement la différence entre deux moyennes géométriques de prix ajustés de l’effet de qualité. L’espace d’échantillonnage m = Mt = Mt–1 est le même modèle dans chaque période. Considérons l’introduction d’un nouveau modèle n en période t sans contrepartie dans t–1 et la disparition d’un ancien modèle O, de sorte qu’il n’ait pas de contrepartie dans t. Ainsi, en période t, l’espace d’échantillon Mt se compose des produits appariés m de la période t et des nouveaux produits n; dans la période t–1, Mt–1 se compose des produits appariés m de la période t–1 et du modèle O des anciens produits o. Silver et Heravi (2002) ont montré que la comparaison hédonique avec variables indicatrices était:

21.60 Considérons la deuxième expression dans l’équation (21.33). D’abord, il y a le changement de prix pour m observations appariées. Il s’agit du changement des prix moyens des modèles appariés m dans les périodes t et t–1, ajustés de l’effet de qualité. On notera que la pondération de cette composante appariée dans la période t est le rapport entre les observations appariées et la totalité des observations dans la période t, portant à la fois sur les nouveaux produits (n) appariés et non appariés. De même, en période t–1, la pondération appariée dépend du nombre d’observations anciennes (o), appariées et non appariées, qui sont dans l’échantillon. À la dernière ligne de l’équation (21.33) le changement est entre les nouveaux et les anciens prix moyens non appariés (ajustés de l’effet de qualité) dans les périodes t et t–1. Ainsi, on peut voir que les méthodes appariées ignorent la dernière ligne de l’équation (21.33) et diffèreront donc de l’approche hédonique avec variables indicatrices. Il ressort de l’équation (21.33) que cette approche, parce qu’elle inclut des observations anciennes et nouvelles non appariées, est peut-être différente d’une moyenne géométrique des changements de prix appariés; l’ordre de grandeur d’une éventuelle différence, dans cette formulation non pondérée, dépend des proportions d’anciens et de nouveaux produits élémentaires sortant de l’échantillon et y entrant, ainsi que des modifications de prix des anciens et nouveaux produits par rapport à celles des produits appariés. Si, sur le marché des produits, les prix anciens ajustés de l’effet de qualité sont inhabituellement bas, alors que les prix nouveaux ajustés de l’effet de qualité sont inhabituellement élevés, l’indice apparié sous-estimera les changements de prix; on trouvera des exemples dans l’ouvrage de Silver and Heravi (2002) ainsi que dans Berndt, Ling, and Kyle (2003). Les différences de comportement sur les marchés entraîneront des formes de biais différentes. Les résultats diffèreront d’une seconde façon. Les formules d’indices donnent des pondérations pour les changements de prix. L’indice de Carli, par exemple, pondère également toutes les observations, alors que l’indice de Dutot les pondère selon leurs prix relatifs en période de base. L’indice de Jevons, qui ne fait pas d’hypothèses sur le comportement économique, donne une pondération égale à toutes les observations. Mais, selon Silver (2002), le poids donné à chaque observation dans une régression de moindres carrés ordinaire dépend aussi de ses caractéristiques, certaines observations aux caractéristiques inhabituelles ayant davantage d’importance. Dans ces conditions, les résultats des deux méthodes peuvent différer encore plus.

Les nouveaux biens et services

21.61 Cette partie retrace brièvement les questions théoriques relatives à l’incorporation de nouveaux produits dans l’indice. Les problèmes d’ordre pratique sont évoqués dans les paragraphes 8.36 à 8.60 du chapitres 8. Dans l’acception qui lui est donnée ici, le terme «nouveaux produits» se réfère à ceux qui représentent un changement substantiel et concret; c’est différent d’une adjonction à l’ensemble de flux de services disponibles couramment, par exemple un nouveau modèle d’automobile doté d’un plus gros moteur. Dans ce dernier cas, il y a continuation d’un flux de services et de production, d’une manière peut-être liée au flux de services et à la technologie de fabrication du modèle existant. Le problème pratique que pose la définition de nouveaux produits, par opposition aux modifications qualitatives, est que les premiers ne peuvent être aisément rattachés aux produits existants en tant que continuation d’une base de ressources et de flux de services existants; et cela en raison de la nature même de leur «nouveauté». Il y a d’autres définitions; Oi (1997) assimile le problème de la définition des «nouveaux» produits à celui de la définition d’un monopole. En l’absence de substitut proche, il y a innovation. Un fournisseur monopolistique peut être en mesure de livrer un produit doté de nouvelles conjonctions de caractéristiques hédoniques z, résultant d’une nouvelle technologie, et être seul capable de le faire; mais, en pratique, le nouvel article peut être lié à ceux qui existent déjà, du fait de l’ensemble de leurs caractéristiques hédoniques. Sous cet angle pratique, on ne peut considérer de tels produits comme «nouveaux» dans le cadre du manuel.

21.62 La terminologie adoptée ici est celle employée par Merkel (2000) pour mesurer les prix à la production, mais on la replace dans le contexte des indices de prix à la consommation (IPC). L’objectif est d’établir une distinction entre les produits évolutionnaires et révolutionnaires. Les premiers sont des modèles de remplacement ou supplémentaires, qui continuent à assurer un flux de services similaire, éventuellement avec des modalités nouvelles ou à des degrés différents. En revanche, les produits révolutionnaires sont totalement nouveaux et sans lien étroit avec un produit disponible antérieurement. Bien que les produits révolutionnaires puissent répondre de manière nouvelle à un besoin ancien du consommateur, ils ne peuvent convenir à aucune catégorie établie de l’IPC. Ainsi, la théorie sous-jacente relative à la signification des nouveaux produits s’applique en principe aussi bien aux évolutionnaires qu’aux révolutionnaires. Cependant, les aspects pratiques de la construction d’un indice exigent de considérer un produit nouveau comme quelque chose qui ne constitue ni une extension, ni une modification d’un produit existant. On peut incorporer les produits évolutionnaires dans un indice au moyen des méthodes évoquées au chapitres 7, même si l’on ignore les gains en termes d’utilité résultant de leur apparition. Cette technique se heurte à d’autres problèmes. Un article étant par nature unique, il a peu de chances d’être intégré dans l’échantillon en remplacement d’un produit existant. Il ne serait pas comparable et ne se prêterait pas à des ajustements explicites de prix au titre des différences de qualité avec les produits déjà en circulation. Comme il ne remplace pas un produit, il n’a pas de pondération désignée et son introduction implique de repondérer l’indice.

21.63 L’aspect le plus important de l’incorporation de nouveaux produits à l’IPC est de décider si et quand il faut les inclure. Le fait d’attendre, pour l’introduire, qu’un nouveau produit soit bien établi ou que l’on change l’indice de base peut entraîner des erreurs de mesure des changements de prix, si l’on ignore les évolutions inhabituelles des prix à des stades très importants du cycle de vie des produits. Il existe des méthodes pratiques, évoquées au chapitres 8, pour l’adoption précoce des produits évolutionnaires et révolutionnaires. En ce qui concerne les premiers, ces stratégies comprennent le changement de base de l’indice, le ré-échantillonnage des produits élémentaires et l’intégration de nouveaux articles dans l’échantillon par substitution; voir Merkel (2000). On peut également utiliser les ajustements de qualité et les indices hédoniques, décrits au chapitres 7 (paragraphes 7.103 à 7.109, 7.153 à 7.158), ainsi qu’aux paragraphes 21.37 à 21.60, ce qui facilite l’incorporation des biens évolutionnaires. Ces derniers ont un ensemble de caractéristiques similaires aux produits existants, mais avec des quantités différentes de ces caractéristiques. Les approches à court terme ou en chaîne, décrites aux paragraphes 7.153 à 7.173, peuvent aussi mieux convenir à des domaines de produits à rotation élevée. Avec ces méthodes, on peut incorporer à l’indice les changements de prix des nouveaux produits dès qu’ils sont disponibles pour deux périodes successives, même si des problèmes de pondération appropriée de ces changements risquent de subsister.

21.64 Mais, pour les produits révolutionnaires, la substitution risque de ne pas être la bonne solution. En premier lieu, on ne pourra peut-être pas les définir dans le cadre des systèmes de classification en vigueur. En deuxième lieu, il est possible qu’ils soient principalement vendus par un nouveau réseau de distribution, ce qui rendra nécessaire d’élargir l’échantillon à ce dernier. En troisième lieu, il n’existera pas de produits élémentaires antérieurs à apparier avec eux pour ajuster qualitativement les prix, étant donné qu’ils sont par définition nettement différents des produits pré-existants. Enfin, il n’y a pas de pondération à attacher au nouveau vendeur ou au nouveau produit. L’extension de l’échantillon convient aux produits révolutionnaires, contrairement à la substitution dans l’échantillon, qui convient aux produits évolutionnaires. Il faut ajouter les nouveaux produits révolutionnaires à l’échantillon existant. Cela implique éventuellement une extension de la classification, de l’échantillon de vendeurs et de la liste de produits élémentaires au sein des réseaux de distribution nouveaux ou existants (Merkel, 2000).

21.65 Le deuxième problème de mesure qui se pose pour les nouveaux produits est l’intégration de leurs effets sur le bien-être au moment de l’introduction. Les développements précédents ont traité l’incorporation à l’indice des changements de prix, une fois que l’on dispose de deux relevés successifs. Pourtant, il est avantageux pour le consommateur de comparer le prix pendant la première de ces périodes au prix de la période qui précédait son introduction s’il avait existé. En ce qui concerne l’IPC, le prix virtuel approprié de la période 1 pour le nouveau produit, est celui qui incite seulement le consommateur du nouveau produit à consommer zéro quantité dans la période précédente. C’est un prix hypothétique. S’il est relativement élevé dans la période qui précède l’apparition du produit, alors que le prix réel de la période de lancement est beaucoup plus bas, l’arrivée du nouveau produit bénéficie manifestement au consommateur. Ne pas tenir compte de cet avantage et du passage du prix virtuel au prix réel pendant la période d’introduction, c’est ignorer une partie des mouvements de prix qui font évoluer les dépenses.

21.66 Les techniques d’extension des échantillons n’appréhendent pas les effets sur le prix qui se produisent entre la période précédant l’introduction du nouveau produit et l’introduction elle-même. Les outils pour les estimer existent dans la théorie économique et dans la pratique; voir Hicks (1940) et Diewert (1980, p. 498–503). Il faut fixer un prix virtuel pour la période antérieure à l’introduction, qui est celui auquel l’offre est fixée à zéro. On compare ce prix virtuel au prix réel de la période d’introduction et on l’utilise pour estimer le gain de bien-être résultant de l’apparition du produit. Hausman (1997) donne des estimations du bien-être procuré aux consommateurs par le lancement d’une nouvelle marque de céréales pour le petit déjeuner, les «Cheerios» à la pomme et à la cannelle. Il conclut:

La méthode économique correcte pour évaluer les nouveaux produits est connue depuis les travaux d’avant-garde de Hicks il y a plus de 50 ans. Mais elle n’a pas été appliquée par les instituts statistiques officiels, peut-être en raison de sa complication et des obligations en matière de données. On dispose maintenant des données. L’incidence des nouveaux produits sur le bien-être des consommateurs apparaît significative, selon les estimations de la demande faites dans cette étude. L’IPC des céréales est peut-être d’environ 25 % trop élevé, parce qu’il ne tient pas compte des nouvelles marques. Une estimation d’un tel ordre de grandeur semble devoir retenir l’attention.

21.67 Shapiro et Wilcox (1997b, p. 144) partagent ces préoccupations:

… le rare nouveau produit qui offre des services radicalement différents de tout ce dont on disposait auparavant. Ainsi, même la toute première génération des ordinateurs personnels a permis aux consommateurs d’entreprendre des activités qui auraient été auparavant d’un coût prohibitif.

Ce problème ne peut être résolu qu’en estimant l’excédent pour le consommateur que crée l’apparition de chaque nouveau produit. Hausman (1997) soutient qu’il faut pour cela modéliser explicitement la demande de tous les nouveaux produits. …Même si cette modélisation serait sans doute difficile à mettre en pratique sur une grande échelle pour l’IPC, une application stratégique à quelques cas sélectionnés pourrait valoir la peine.

21.68 Ces calculs exigent un très grand degré d’expertise et n’échappent pas à la contestation quand on les applique; voir sur ce point Bresnahan (1997). En ce qui concerne l’IPC, Balk (2000b) a défini une autre méthode, dont les estimations empiriques ont été données par de Haan (2001); on trouvera des détails au chapitres 8 et à l’appendice 8.2. Si cette méthode est plus simple que celle suivie par Hausman (1997), l’une et l’autre exigent une grande compétence statistique et économétrique. La prise en compte systématique de tels effets n’est pas vraiment envisagée, même par les instituts statistiques qui disposent de systèmes bien développés32.

Appendice 21.1 Quelques problèmes économétriques

1. On a vu, au chapitres 7, que les estimations des régressions hédoniques peuvent être utilisées pour l’ajustement des prix en fonction de la qualité. Plusieurs problèmes se posent pour spécifier et estimer les régressions hédoniques, utiliser les statistiques de diagnostics et mettre en œuvre des mesures quand les hypothèses standard des moindres carrés ordinaires (MCO) ne tiennent pas. Beaucoup d’entre eux sont de nature habituelle en économétrie et n’intéressent pas ce manuel. Cela ne signifie pas qu’ils soient négligeables. L’utilisation des régressions hédoniques exige une certaine expertise économétrique et statistique, mais on dispose généralement de textes appropriés; on peut consulter, parmi beaucoup d’autres, Berndt (1991)—notamment le chapitre sur les régressions hédoniques—ainsi que Maddala (1988) et Kennedy (1998). Les logiciels modernes ont des tests de diagnostics qui permettent bien de vérifier quand les hypothèses MCO ne sont pas satisfaites. Mais il demeure certains aspects spécifiques qui méritent que l’on y prête attention; ils vont au-delà des considérations habituelles importantes dont traitent les textes économétriques.

Identification et estimateurs appropriés

2. Wooldridge (1996, p. 400–401) a démontré, sur des bases économétriques normalisées, que l’estimation par MCO des fonctions d’offre et de demande était biaisée et que ce biais s’étendait à l’estimation de la fonction hédonique. Il convient d’abord d’examiner les problèmes d’estimation des fonctions de demande et d’offre. Cette estimation est rarement effectuée en pratique. La méthode la plus répandue consiste à estimer des fonctions d’offre de caractéristiques, dans lesquelles le prix marginal proposé par la firme dépend d’attributs choisis (les caractéristiques du produit) et des spécificités de l’entreprise. On estime aussi des fonctions de valeur ou d’offre des consommateurs, où les prix marginaux payés par un consommateur dépendent d’attributs choisis et des spécificités du consommateur33. Comme on l’a noté plus haut, les prix et les quantités observés résultent de l’interaction des équations structurelles de demande et d’offre ainsi que de la distribution des technologies de production et des goûts des consommateurs; ils ne peuvent révéler les paramètres des fonctions d’offre de caractéristiques et de valeur. Rosen (1974, p.50–51) a suggéré une procédure pour déterminer ces paramètres. Comme les estimations sont conditionnées par les goûts (α) et les technologies (τ), la procédure d’estimation doit inclure des mesures empiriques ou «variables représentatives» de α et τ. Pour mesurer empiriquement les goûts α des consommateurs, on peut utiliser des variables socio-démographiques et économiques, telles que l’âge, le revenu, l’éducation et la région géographique. Pour les technologies τ, les variables peuvent comprendre les types de technologies ainsi que les prix d’échelle et de facteurs. Pour commencer, on estime l’équation hédonique de façon normale, sans ces variables, en utilisant la forme fonctionnelle qui ajuste le mieux les données. Il s’agit de représenter la fonction de prix à laquelle les consommateurs et les producteurs sont confrontés quand ils prennent leurs décisions. Ainsi, on calcule pour chaque caractéristique une fonction implicite de prix marginaux, telle que p(z)/zi=,oùp^(z) est l’équation hédonique estimée. Gardons à l’esprit que, dans les études normales de la demande/offre de produits, on observe les prix sur le marché. On n’observe pas les prix des caractéristiques. Cette première étape consiste à estimer les paramètres de la régression hédonique. Ensuite, les valeurs réelles de chaque zi achetée et vendue sont insérées dans chaque fonction implicite de prix marginaux pour donner une valeur numérique à chaque caractéristique. Dans une deuxième étape34, ces valeurs marginales sont employées en tant que variables endogènes pour l’estimation de la demande:

α* sont les variables représentatives des goûts; du côté offre on a:

α* sont les variables représentatives des technologies.

Les variables τ disparaissent quand les technologies ne varient pas et quand pΛi(z) est une estimation de la fonction d’offre des consommateurs. De même, les variables α* disparaissent si les vendeurs sont différents et les acheteurs identiques, tandis que les estimations en coupe transversale retracent les fonctions de demande compensées.

3. Selon Epple (1987), la stratégie de modélisation de Rosen est susceptible de donner lieu à des procédures inappropriées d’estimation des paramètres de demande et d’offre. Dans la méthode hédonique d’estimation de la demande de caractéristiques, le fait que les prix marginaux soient probablement endogènes pose problème—ils dépendent de chaque caractéristique consommée et doivent être calculés à partir de la fonction hédonique, au lieu d’être observés directement. Il en résulte deux difficultés. D’abord, il y a un problème d’identification (voir Epple (1987), car tant le prix marginal d’une caractéristique que l’offre inversée des consommateurs dépendent des niveaux de caractéristiques consommées. En deuxième lieu, si des caractéristiques importantes ne sont pas mesurées, tout en étant corrélées à des caractéristiques mesurées, les coefficients des caractéristiques mesurées seront biaisés. Cela s’applique à tous les modèles économétriques, mais concerne en particulier les modèles hédoniques; sur ce point, on se reportera notamment à Wooldridge (1996, p.400–401). Les conditions d’équilibre des prix des caractéristiques impliquent l’existence de rapports fonctionnels entre les caractéristiques des demandeurs, des fournisseurs et des produits. D’où une moindre vraisemblance que d’importantes variables exclues ne soient pas corrélées aux variables incluses dans le problème; sur ce point, voir aussi Bartik (1988). Le biais apparaît, parce que les acheteurs sont différenciés par les caractéristiques (y, α) et les vendeurs par les technologies τ. Le type de produits élémentaires que les acheteurs acquerront est corrélé à (y, a) et le type que les vendeurs fourniront corrélé à τ. Sur le plan représentant les combinaisons de z échangées, les combinaisons d’équilibre choisies peuvent être systématiquement corrélées; les caractéristiques des acheteurs sont liées à celles des vendeurs. Epple (1987) cite l’exemple des équipements stéréo: les acheteurs à revenus élevés sont incités à acquérir des équipements de qualité supérieure, tandis que la compétence des vendeurs les conduit à leur fournir. Les caractéristiques des consommateurs et des producteurs peuvent être corrélées.

4. Wooldridge (1996, p.400–401) suggère d’utiliser comme instruments, dans l’estimation des fonctions hédoniques, les caractéristiques individuelles des consommateurs et des entreprises comme le revenu, l’éducation et les prix des intrants. On devrait également inclure, si elles déterminent les prix, des variables autres que les caractéristiques d’un produit, par exemple la situation géographique (proximité de ports, réseau routier de qualité, climat, etc). On suppose qu’il existe des communautés d’agents économiques, au sein desquelles les consommateurs consomment et les producteurs produisent les uns pour les autres à des prix qui changent selon les communautés pour des biens identiques. Les variables relatives aux caractéristiques des communautés n’entreront pas ellesmêmes dans l’équation de demande et d’offre, mais elles déterminent les prix observés que l’on enregistre dans les diverses communautés. Tauchen et Witte (2001) font une investigation systématique des conditions dans lesquelles les caractéristiques des consommateurs, des producteurs et des communautés affecteront les estimations hédoniques de paramètres d’une seule équation de régression estimée pour toutes les communautés. Il est très important de savoir si le terme d’erreur de la fonction de prix hédonique représente des facteurs qui ne sont observés ni par les agents économiques, ni par le chercheur ou qui le sont seulement par le chercheur. Dans ce dernier cas, il arrive que le terme d’erreur soit corrélé aux attributs du produit; une estimation reposant sur des variables instrumentales est alors nécessaire. Si le terme d’erreur n’est pas corrélé aux caractéristiques du produit—les préférences étant quasi linéaires—, on peut alors estimer, par les moindres carrés ordinaires, une régression hédonique proprement spécifiée, incluant des caractéristiques propres aux communautés ou des variables indicatrices de pente appropriées. Dans d’autres cas, il peut s’avérer nécessaire d’utiliser des variables instrumentales, notamment des variables ou des caractéristiques relatives aux consommateurs, aux producteurs ou aux communautés, en fonction de la corrélation entre les caractéristiques des consommateurs et des producteurs, des hypothèses sur le terme d’erreur et de la méthode d’intégration à la régression des caractéristiques des communautés.

Forme fonctionnelle

5. Selon Triplett (1987 et 2002), ni la théorie classique de l’utilité, ni celle de la production ne peuvent spécifier la forme fonctionnelle de la fonction hédonique35. Cet argument date de Rosen (1974, p. 54), selon lequel ces observations sont «…une fonction enveloppe jointe et elles ne peuvent par ellesmêmes identifier la structure des préférences des consommateurs et des technologies de production qui les génèrent». Les jugements a priori à propos de ce à quoi devrait ressembler la forme peuvent être basés sur des conceptions du mode de réaction des consommateurs et des technologies de production aux évolutions des prix. Il est difficile de formuler ces jugements quand les observations sont déterminées conjointement par des facteurs de demande et d’offre, mais ce n’est généralement pas impossible. Toutefois, la situation se complique quand la fixation des prix s’accompagne du système du coût majoré dont l’importance peut varier au cours du cycle de vie d’un produit. Certains ensembles liés de caractéristiques auront des coût majorés supérieurs à d’autres. Les introductions de nouveaux produits élémentaires s’effectueront sans doute plus volontiers dans ces domaines d’espace de caractéristiques, ce qui entraînera une augmentation de l’offre, et donc une baisse du coût majoré et du prix; voir Cockburn and Anis (1998), Feenstra (1995, p. 647) et Triplett (1987). Cela aussi doit être pris en considération par tout raisonnement a priori et l’affaire n’est pas simple.

6. Il est possible que, dans certaines situations, la forme fonctionnelle de la fonction hédonique soit simple. Ainsi, les prix des options pour les produits vendus sur les sites Internet sont souvent additifs. Le coût sous-jacent et la structure d’utilité sont peu susceptibles de générer conjointement de telles fonctions linéaires; mais le producteur ou le consommateur paient aussi pour la commodité de ce mode de vente et acceptent de subir des pertes ou de réaliser des gains, si le coût ou l’utilité à des valeurs plus élevées de z sont tarifés plus bas ou valent plus que le prix fixé. En général, les données devraient indiquer la forme fonctionnelle; imposer des structures artificielles aboutit simplement à biaiser la spécification. On trouvera des exemples de vérification économétrique de la forme fonctionnelle hédonique dans Cassel and Mendelsohn (1985), Cropper, Deck, and McConnell (1988), Rasmussen and Zuehlke (1990), Bode and van Dalén (2001) ainsi que Curry, Morgan, and Silver (2001).

7. Les trois formes qui dominent dans la littérature économique sont la forme linéaire, la forme semi-logarithmique et la forme double logarithmique (log-log). En l’absence d’un principe théorique clair permettant de choisir entre elles, nombre d’études ont eu recours à des tests économétriques. Il y a eu un grand nombre d’études hédoniques, et comme l’ont montré Curry, Morgan et Silver (2001), les formes très simples donnent de bons résultats dans beaucoup d’entre elles, au moins en ce qui concerne le R2 présenté36 et les paramètres conformes au raisonnement a priori, en général pour l’aspect consommation. Parmi ces trois formes dominantes, certaines sont préférées dans les tests. Ainsi, Murray et Sarantis (1999) ont préféré la forme semi-logarithmique, alors que d’autres, comme Hoffmann (1998), se sont aperçus que la capacité explicative des trois formes fonctionnelles n’était guère différente. Le fait que les paramètres de ces formes simples s’accordent avec le raisonnement a priori, habituellement du côté de la consommation, est prometteur; mais les chercheurs doivent savoir qu’il n’y a pas de certitude en la matière. Il peut se produire du côté de l’offre beaucoup de choses susceptibles d’affecter les valeurs des paramètres. À cet égard, Pakes (2001) soutient que l’on ne peut donner aucun signe intuitif aux paramètres des variables, car les producteurs peuvent modifier leurs coûts majorés sur des caractéristiques selon des modalités qui se traduiraient par des signes négatifs contre-intuitifs pour certaines caractéristiques désirables.

8. Parmi les trois formes, la forme semi-logarithmique a beaucoup d’avantages. L’interprétation de ses coefficients est directe puisque les changements proportionnés des prix découlent d’une modification unitaire de la valeur de la caractéristique37 (voir chapitres 7, paragraphes 7.39 et 7.40). C’est une formulation utile, dans la mesure où les ajustements qualitatifs s’opèrent généralement de façon multiplicative et non pas additive.

9. À la différence du modèle log-log, la forme semi-logarithmique peut incorporer des variables indicatrices pour des caractéristiques qui sont présentes zi = 1, ou pas, zi = 0. En outre, selon Diewert (2002e), les erreurs d’une équation semilogarithmique ont plus de chances d’être homoscédastiques (d’avoir une variance constante) que les erreurs d’une équation hédonique linéaire; en effet, les produits élémentaires dont les caractéristiques ont des valeurs importantes auront des prix élevés et, très probablement, des termes d’erreur relativement grands. En revanche, les modèles dotés de faibles nombres de caractéristiques auront des prix bas et de petites moyennes, tandis que la déviation du prix d’un modèle par rapport à sa moyenne sera nécessairement réduite. Comme les résidus sont supposés homoscédastiques, selon une des hypothèses MCO, on préfère l’équation semi-logarithmique à la linéaire.

10. Des formes plus compliquées sont évidemment possibles. Les formes simples ont l’avantage de la parcimonie et permettent des estimations plus efficaces pour un échantillon donné. Cependant, la parcimonie ne doit pas être obtenue au prix d’un biais faussant la spécification. En premier lieu, si l’on estime la fonction hédonique sur une multiplicité de marchés indépendants, des termes d’interaction sont nécessaires [voir Mendelsohn (1984) pour les sites de pêche]. Les exclure revient à omettre des variables et à contraindre de façon inappropriée les coefficients estimés de la régression. Tauchen et Witte (2001) ont indiqué les biais spécifiques qui peuvent résulter de l’omission de telles variables dans les études hédoniques. En deuxième lieu, on peut soutenir que la forme fonctionnelle devrait correspondre à l’agrégateur de l’indice—linéaire pour un indice de Laspeyres, logarithmique pour un indice de Laspeyres géométrique, translogarithmique pour un indice de Törnqvist et quadratique pour un indice de Fisher (voir chapitres 17). Mais, comme le remarque Triplett (2002), l’objectif de l’estimation des régressions hédoniques est d’ajuster les prix selon les différences de qualité; imposer aux données une forme fonctionnelle incompatible avec elles risquerait d’induire en erreur la procédure d’ajustement pour l’effet qualité. Or, comme le note Diewert (2003a), les formes fonctionnelles flexibles englobent ces formes simples, la forme log-log étant un cas particulier de la forme translog donnée à l’équation (17.42) et la forme semi-log un cas particulier de la forme quadratique semi-log donnée à l’équation (17.49). S’il existe des raisons a priori de s’attendre à ce que des caractéristiques spécifiques aient des termes d’interaction, comme l’illustre l’exemple donné au paragraphe 7.99, ces formes plus générales le permettent. La théorie des fonctions hédoniques ne dicte pas la forme de la fonction hédonique, pas plus qu’elle ne la restreint.

Évolution des goûts et des technologies

11. Les estimations des coefficients d’une régression hédonique peuvent se modifier dans le temps. On attribuera une partie de ces modifications à l’erreur d’échantillonnage, surtout s’il y a multicollinéarité, comme on l’explique ci-dessous. Mais, dans d’autres situations, ce peut être vraiment le reflet de l’évolution des goûts et des technologies. Si l’on veut employer un sous-ensemble de coefficients estimés d’une régression hédonique, pour ajuster qualitativement le prix de remplacement d’un produit non comparable, l’utilisation, pour ajuster les prix d’un nouveau modèle de remplacement, de coefficients estimés datant d’une période antérieure et qui sont dépassés risque d’être inappropriée. Il est nécessaire de mettre à jour les indices aussi régulièrement que les changements l’exigent38. L’estimation des indices d’imputation hédoniques est plus compliquée. Silver (1999) a montré, à partir d’un exemple simple, comment l’estimation des prix ajustés de la qualité oblige à disposer d’un panier de référence des caractéristiques. On le voit, pour les indices d’imputation hédoniques, aux paragraphes 21.37 à 21.60, dans lesquels on estime des indices séparés au moyen des caractéristiques de la période de base et de la période actuelle. On considère comme appropriée une moyenne symétrique de ces indices. Un indice hédonique fondé sur une variable indicatrice temporelle a contraint implicitement les coefficients estimés des deux périodes à être identiques. Diewert (2003a) a formalisé le problème du choix des caractéristiques de référence, lors de la comparaison des prix dans le temps, quand les paramètres de la fonction hédonique peuvent eux-mêmes changer au fil du temps. Il a trouvé que les résultats des indices hédoniques n’étaient pas invariants par rapport au choix de l’ensemble z de vecteurs de caractéristiques de la période de référence. Il a envisagé l’utilisation d’un vecteur moyen de caractéristiques pondéré en fonction des ventes, comme l’avait proposé Silver (1999), mais il a noté qu’à long terme celui-ci risquait de devenir non représentatif39. Si l’on emploie une formulation en chaîne, les moyennes pondérées des caractéristiques restent bien sûr raisonnablement à jour, bien que le chaînage ait ses propres avantages et inconvénients (voir paragraphes 17.44 à 17.49 du chapitres 17). Diewert (2003a) a signalé une autre solution à base fixe: elle consiste à utiliser une comparaison de type Laspeyres, avec l’ensemble de paramètres de la période de base, et un indice de type Paasche avec l’ensemble de paramètres de la période actuelle, puis à prendre la moyenne géométrique des deux indices pour des raisons similaires à celles données au chapitres 15, paragraphes 15.18 à 15.32. L’indice de type Fisher qui en résulte est analogue à la moyenne géométrique des indices de Laspeyres et de Paasche—donnée aux équations (21.26) et (21.27)—en se basant sur Feenstra (1995)40. L’une des caractéristiques de la méthode des variables indicatrices temporelles, exposée aux paragraphes 21.40 à 21.42, est qu’elle prend implicitement une moyenne symétrique des coefficients en les contraignant à être identiques. Mais qu’arrive-t-il si, comme c’est plus probablement le cas, on dispose seulement des coefficients de régression hédoniques de la période de base? Comme des indices hédoniques fondés sur une moyenne symétrique des coefficients sont souhaitables, la différence entre les estimations basées sur un ensemble de caractéristiques de la période actuelle ou de la période de référence («spread») est l’indication d’un biais potentiel; cette différence peut faire l’objet d’estimations rétrospectives. Si elle est importante, il faut traiter avec prudence les estimations faites à partir d’un ensemble de caractéristiques d’une seule période, par exemple l’actuelle. Une mise à jour plus fréquente des régressions hédoniques est probablement de nature à réduire le «spread», parce que les périodes comparées seront plus proches et les caractéristiques des produits de ces périodes plus similaires.

Pondération

12. Les estimateurs de moindres carrés ordinaires traitent implicitement tous les produits élémentaires comme étant d’importance égale, alors même que certains feront l’objet de ventes tout à fait substantielles et d’autres de ventes minimales. Il est évident que l’on ne doit pas accorder la même influence, dans l’estimateur de régression, à un produit vendu chaque mois à plus de 5 000 exemplaires qu’à un autre donnant lieu à peu de transactions. Les produits élémentaires très peu vendus, sont peut-être au terme de leur cycle de vie ou fabriqués sur mesure. Dans un cas comme dans l’autre, leurs prix ajustés de l’effet de qualité et l’évolution de ces prix risquent d’avoir un profil inhabituel41. Il ne faut pas laisser des observations à prix inhabituels influencer indûment l’indice42.

13. Il est préférable d’estimer les équations de régression hédonique au moyen d’un estimateur de moindres carrés pondérés (MCP). Cet estimateur minimise la somme des déviations pondérées entre les prix actuels et les prix prévus de l’équation de régression; ce n’est pas le cas de l’estimateur de moindres carrés ordinaires (MCO), qui utilise une pondération égale pour chaque observation. La question est de savoir si l’on se sert de pondérations de quantités (volumes) ou de dépenses. L’emploi de pondérations de quantité peut se justifier au vu de la nature de leur «prix» équivalent. Il s’agit du prix moyen (généralement le même) pour un certain nombre de transactions. L’unité d’échantillonnage sous-jacente est la transaction individuelle: les données peuvent donc être reproduites comme si elles se composaient, par exemple, de 12 observations individuelles en utilisant un estimateur MCO, au lieu d’une seule observation avec une pondération de 12 en utilisant un estimateur MCP. Les deux méthodes donneraient le même résultat. Diewert (2002e) a soutenu que, pour des raisons de représentativité, les valeurs des ventes devraient servir de pondération. La pondération sur la base des quantités donne trop peu de place aux modèles à prix élevés et une importance excessive aux modèles à bon marché, qui ont relativement peu de caractéristiques utiles. La nécessité de faire correspondre les poids à la valeur relative des dépenses ou des ventes découle d’une préoccupation centrale concernant les indices: ils cherchent à distinguer, dans les changements de valeur, les composantes prix et les composantes quantité. Silver (2002) a démontré qu’un estimateur MCP recourant à des pondérations en valeur ne donnerait pas nécessairement à chaque observation un poids égal à sa valeur relative. Il donnera plus de poids aux observations ayant des effets de levier et des résidus importants. Les observations dont les caractéristiques ont des valeurs très déviées par rapport à leurs moyennes, par exemple les modèles très anciens ou nouveaux, ont un effet de levier relativement élevé. Les prix des modèles nouveaux et des anciens seront probablement très différents de ceux prévus par la régression hédonique, même en tenant compte de la diversité de leurs caractéristiques. Ces prix résultent, par exemple, d’une stratégie visant à écrémer les segments du marché disposés à payer une prime pour un nouveau modèle ou encore d’une stratégie de tarification relativement basse d’un ancien modèle, afin de s’en débarrasser et d’ouvrir la voie à un nouveau. Dans de telles situations, l’influence de ces modèles sur le calcul des coefficients estimés dépassera celle qui est imputable à leur pondération en valeur. Silver (2002) suggère de calculer les effets de levier pour chaque observation: celles ayant des effets de levier importants et des pondérations faibles seraient éliminées et l’on recommencerait la régression. On voit donc que, si les pondérations en quantité ou en valeur sont préférables à l’absence de pondération (c’est-à-dire à MCO), les secondes sont plus appropriées que les premières, et, même ainsi, on doit tenir compte des observations ayant une influence indue.

14. Diewert (2002e) a également traité le problème de la pondération pour les indices hédoniques à variables indicatrices temporelles évoqués aux paragraphes 21.40 à 21.42. L’usage des MCP par valeur suppose d’appliquer des pondérations aux observations dans les deux périodes. Mais en cas, par exemple, d’inflation élevée, les valeurs de ventes d’un modèle dans la période actuelle seront généralement plus élevées que celles du modèle correspondant au cours de la période de base et il est peu probable que l’hypothèse de résidus homoscédastiques se vérifie. Diewert (2002e) propose d’employer comme pondérations MCP, pour les indices hédoniques à variables temporelles, des parts des dépenses dans chaque période et non des valeurs. Il propose aussi d’utiliser aussi, pour les modèles appariés, une moyenne des parts de dépenses dans les périodes que l’on compare.

15. Les données de ventes ne sont pas toujours disponibles aux fins de pondération, mais les principaux produits élémentaires vendus peuvent généralement être identifiés. Il importe alors de restreindre le nombre d’observations de produits à ventes relativement faibles, le degré de restriction dépendant du nombre d’observations et du caractère asymétrique de la distribution. Dans certains cas, les produits peu vendus donnent la variabilité nécessaire à des estimations efficaces de l’équation de régression. Dans d’autres, la faiblesse des ventes pourrait être due à des facteurs qui les rendent non représentatives de la surface hédonique, leurs résidus étant inhabituellement élevés. On peut citer l’exemple des modèles peu vendus, qui sont sur le point d’être retirés pour faire place à des nouveaux. C’est pourquoi les régressions non pondérées peuvent être affectées d’un problème d’échantillonnage: même si l’ajustement des prix en fonction de la qualité est parfait, l’indice peut être biaisé, parce qu’il est indûment influencé par des produits à faibles ventes dont la relation prix-caractéristiques n’est pas représentative. En l’absence de pondérations, les diagnostics de régression ont un rôle à jouer pour contribuer à déterminer si la variance injustifiée de certaines observations est le fait de ce type de produits inhabituels et à ventes limitées43.

La multicolinéarité

16. Il y a des raisons a priori de prévoir que, pour certains produits, la variation de la valeur d’une caractéristique de qualité ne soit pas indépendante d’une autre caractéristique de qualité ou d’une combinaison linéaire de plusieurs de ces caractéristiques. En conséquence, les estimations de paramètres ne seront pas biaisées, mais imprécises. Pour illustrer cela, on décrit souvent comme elliptique la représentation graphique de l’intervalle de confiance d’une estimation de paramètre par rapport à un autre colinéaire; en effet, les différentes combinaisons de valeurs possibles peuvent facilement passer, par exemple, de valeurs élevées de β1 et de valeurs réduites de β2 et à des valeurs élevées de β2 et à des valeurs réduites de β1 Comme la dimension de l’échantillon pour les estimations est effectivement diminuée, les additions et les soustractions à l’échantillonnage peuvent affecter les estimations de paramètres bien plus que l’on ne s’y attendrait. Ce sont des problèmes statistiques habituels, traités par Maddala (1988) et Kennedy (1998). Dans une régression hédonique, la multicolinéarité est prévisible, car certaines caractéristiques peuvent être technologiquement liées à d’autres. Les producteurs introduisant une caractéristique seront éventuellement obligés d’en ajouter d’autres, pour que le produit fonctionne, tandis que le consommateur qui achète, disons, une marque de haute gamme s’attendra qu’elle s’accompagne d’un certain ensemble d’attributs. Triplett (2002) insiste pour que le chercheur connaisse les spécificités du produit et le marché de consommation. Il s’agit là d’indicateurs habituels, sans être complètement fiables, de la multicolinéarité (comme les facteurs de variance de l’inflation); mais la connaissance de sa nature est beaucoup facilitée par la compréhension du marché ainsi que par l’étude des effets de l’inclusion et de l’exclusion de variables individuelles sur les signes, les coefficients et sur d’autres statistiques de tests de diagnostic; voir Maddala (1988)44.

17. Si l’on veut utiliser un sous-ensemble de coefficients estimés d’une régression hédonique pour ajuster de l’effet de qualité un prix de remplacement non comparable—et s’il y a multicolinéarité entre les variables de ce sous-ensemble et d’autres variables indépendantes—les estimations des coefficients à employer pour l’ajustement seront imprécises. La multicolinéarité réduit en fait la dimension de l’échantillon et certains effets des variables du sous-ensemble risquent d’être attribués à tort à d’autres variables indépendantes. L’importance de cette erreur sera déterminée par le niveau du coefficient de corrélation multiple entre toutes ces variables «indépendantes» (la multicolinéarité), l’erreur type ou la qualité de l’ajustement de la régression, la dispersion de la variable indépendante concernée et la taille de l’échantillon. Tous ces éléments affectent la précision des estimations, puisque ce sont des composantes de l’erreur type des statistiques–t. Même si l’on prévoit une multicolinéarité très élevée, de larges échantillons et un modèle bien ajusté aux données peuvent éventuellement réduire les erreurs type sur les statistiques-t à des niveaux acceptables. Si l’on s’attend à une multicolinéarité importante, on peut calculer la valeur prédite du prix d’un produit en utilisant l’ensemble de la régression et procéder à un ajustement au moyen de cette valeur prédite, comme on l’expliquait aux paragraphes 17.103 à 17.109 du chapitres 17. Il importe peu, semble-t-il, que la variation qui aurait dû, par exemple, être attribuée à β1 l’ait été à tort à β2, ou vice-versa, si l’on emploie le prix prédit basé à la fois sur β1et β2.

Le biais dû à l’omission de variables

18. On a déjà évoqué l’exclusion des caractéristiques en matière de goûts, de technologies et de communautés. On se préoccupe ici des caractéristiques des produits. Considérons de nouveau l’emploi d’un sous-ensemble de coefficients estimés d’une régression hédonique, pour ajuster de l’effet de qualité un prix de remplacement non comparable. Il est bien établi que la multicolinéarité de variables omises avec des variables incluses aboutit à un biais dans l’estimation des coefficients de ces dernières. Si les variables omises sont indépendantes des variables incluses, les estimations des coefficients de variables incluses ne sont pas biaisées. C’est acceptable dans le présent exemple, sous la seule réserve que l’ajustement de l’effet de qualité du produit remplaçant peut aussi exiger un ajustement au titre de ces variables omises; comme l’a noté Triplett (2002), il doit être effectué au moyen d’une méthode et de données séparées. Mais qu’arrive-t-il si la variable omise est multicolinéaire avec un sous-ensemble de variables incluses qui doivent être utilisées pour ajuster de l’effet de qualité un produit non comparable? Dans ce cas, le coefficient du sous-ensemble des variables incluses risque d’intégrer à tort certains des effets des variables omises. On aura recours au sous-ensemble en question pour ajuster de l’effet de qualité les prix des produits qui ne diffèrent qu’au regard de ce sous-ensemble et la comparaison des prix sera biaisée, si les caractéristiques des variables incluses et omises montrent des changements de prix différents. Pour les indices hédoniques utilisant un trend de variables indicatrices temporelles, les estimations des changements de prix ajustés de l’effet de qualité seront affectées d’un biais similaire, si l’on exclut de la régression les variables omises qui sont multicolinéaires avec le changement temporel. Les changements de prix dans le temps, ajustés de l’effet de qualité, que l’on appréhende risquent d’être en partie imputables au prix de ces variables exclues. Cela se produit quand les prix des caractéristiques omises suivent une tendance différente. Des effets de ce type sont le plus probables en cas d’amélioration progressive de la qualité des produits; c’est le cas, par exemple, en matière de fiabilité et de sécurité des biens de consommation durables45, qu’il est difficile de mesurer, au moins pour l’échantillon de produits élémentaires en temps réel. Les modifications de prix, ajustés de l’effet de qualité, seront donc exagérées dans des exemples de ce type.

Cette terminologie est attribuable à Dalén (1998a); voir aussi l’appendice 8.1.

L’absence peut être temporaire dans le cas d’un produit saisonnier; les méthodes de traitement des produits élémentaires provisoirement indisponibles sont exposées au chapitres 8. Mais on s’occupe ici des produits qui disparaissent définitivement.

Ces méthodes et leurs hypothèses sont discutées en détail au chapitres 7.

Voir Boskin, Dullberger, Gordon, Griliches, and Jorgenson (1996 et 1998) ainsi que Schultze and Mackie (2002).

On fait l’hypothèse d’une continuité de la gamme de produits en ce qui concerne les conjonctions de caractéristiques qui les définissent. On peut dire qu’il y a non-continuité quand les fonctions de prix sont linéaires par morceaux et quand on obtient un ensemble optimal de caractéristiques par des achats combinés de produits élémentaires différents; voir Lancaster (1971) et Gorman (1980).

On remarquera que l’enveloppe est définie de façon plus formelle en laissant f(x,y,k) = 0 être une fonction implicite de x et de y. On suppose que la forme de la fonction dépend de k, en l’occurrence des goûts. Une courbe différente correspond à chaque valeur de k dans le plan xy. L’enveloppe de cette famille de courbes est elle-même une courbe qui a pour propriété d’être tangente à chaque membre de la famille. On obtient l’équation de l’enveloppe en prenant la dérivée partielle de f(x,y,k) par rapport à k et en éliminant k des deux équations f(x,y,k) = 0 et ∂f(x,y,k)/∂k = 0; voir Osgood (1925).

Le bien numéraire représente tous les autres biens et services consommés—les biens «normaux» non hédoniques. On fixe le prix de x comme égal à l’unité tandis que p(z) et le revenu sont mesurés au moyen de cette unité.

C’est le prix hypothétique pour lequel la demande du produit est égale à 0, c’est-à-dire celui qui fixe la demande à 0 quand on l’insère dans la fonction de demande. On suppose que la fonction d’utilité est strictement concave, de sorte que θ est concave sur z et que la fonction de valeur augmente avec zi à un taux décroissant.

On suppose que la fonction d’utilité est strictement concave, de sorte que θ est concave sur z et que la fonction de valeur augmente avec zi à un taux décroissant.

Les indices de temps ne sont pas nécessaires dans ce contexte.

On suppose que la fonction de coût est convexe sans indivisibilités; on suppose aussi que le coût marginal de fabrication d’un produit supplémentaire, présentant une combinaison donnée de caractéristiques, est positif et croissant. De même, le coût marginal d’augmentation de la production de chaque caractéristique composante est positif et non décroissant.

Rosen (1974) considérait deux autres caractérisations de l’offre: le court terme, où seul M est variable, et le long terme, dans lequel on peut ajouter et retirer des unités de production. La détermination de l’équilibre de l’offre et de la demande n’est pas simple. On a besoin d’une fonction p(z) pour que la demande sur le marché de tous les z soit égale à l’offre et pour obtenir l’équilibre du marché. Mais la demande et l’offre dépendent de la totalité de p(z), puisque tout ajustement des prix pour égaliser la demande et l’offre d’une combinaison de produits élémentaires induira des substitutions et des changements pour d’autres. Rosen (1974, p. 44–48) donne des précisions sur ce point.

Pour que les choix entre combinaisons de z soient continus, on suppose aussi que p(z) possède des dérivés de second ordre continues.

De façon correspondante, si les courbes d’offre étaient parfaitement inélastiques—de sorte qu’un changement de prix ne modifierait l’offre d’aucun des produits différenciés—la variation des prix sousjacente aux données et alimentant les estimations hédoniques serait déterminée par des facteurs de demande. Les coefficients donneraient des estimations de valeur d’utilisation. De même, si le marché de l’offre était parfaitement concurrentiel, les estimations porteraient sur le coût des ressources. Aucun des écarts de prix entre produits élémentaires différenciés ne serait attribuable, par exemple, aux nouvelles configurations des caractéristiques et aucun profit temporaire de monopole ne serait réalisé grâce à cette situation ou du fait de l’exercice d’un pouvoir de marché; voir Berndt (1991).

Berry, Levinsohn et Pakes (1995) donnent un exemple détaillé et intéressant pour les automobiles, où les marques sont utilisées comme segments du marché. Tauchen et Witte (2001) procèdent à une étude systématique des problèmes d’estimation des fonctions d’offre, de demande et des fonctions hédoniques, dans laquelle les consommateurs, les producteurs et leurs transactions sont indexés par les communes d’habitation.

On ne fait pas l’hypothèse que tous les modèles possibles existent sur le marché. En fait, nous supposerons qu’il existe seulement, dans chaque période, un ensemble limité de modèles. Mais on présume que le consommateur a des préférences pour tous les modèles possibles, chacun d’entre eux étant indexé par son vecteur de caractéristiques z = (z1,…,zN). Ainsi, chaque consommateur préférera un modèle potentiel avec le vecteur de caractéristiques z1=(z11,,zN1) par rapport à un autre modèle potentiel ayant le vecteur de caractéristiques z2=(z12,,zN2), si et seulement si f(z1) > f(z2).

Si la courbe d’indifférence de la période t est en intersection avec les deux droites, gt(ut, Z) ne sera défini que pour les Z non négatifs jusqu’à une limite supérieure.

Si un consommateur achète, par exemple, au prix P deux unités d’un modèle qui a les caractéristiques z 1,…,zN, nous pouvons alors modéliser cette situation en introduisant un modèle artificiel qui vend au prix 2 P et présente les caractéristiques 2z 1,…,2zN. Ainsi, la surface hédonique Z= f(z) se compose seulement des modèles les plus efficients, y compris les modèles artificiels. Nous ne faisons pas l’hypothèse que f(z) soit une fonction quasi-concave ou concave de z. Dans la théorie normale de la demande de consommation, on peut supposer que f(z) soit quasi-concave sans perte de généralité. En effet, les contraintes budgétaires linéaires et l’hypothèse de divisibilité parfaite impliqueront que les courbes d’indifférence «effectives» intègrent des ensembles convexes. Mais, comme le signale Rosen (1974, p. 37–38), on ne peut, dans le cas des produits hédoniques, délier les diverses caractéristiques. On ne peut pas non plus faire l’hypothèse que la divisibilité soit parfaite et que toutes les combinaisons possibles de caractéristiques soient disponibles sur le marché. Les hypothèses habituelles de la théorie «normale» de la demande de consommation ne sont pas satisfaites dans le contexte hédonique. Dernière remarque: nous supposons que les macro-fonctions gt(u,Z), soient continues, avec l’existence de la dérivée partielle ∂gt(u,Z)/∂Z, mais nous ne plaçons pas de restrictions de continuité sur la fonction de sous-utilité hédonique f(z).

L’hypothèse d’identité qui est très forte, nécessite une certaine justification. Elle est tout à fait analogue à celle selon laquelle les consommateurs ont les mêmes préférences homothétiques pour, par exemple, l’alimentation. Bien que cette hypothèse ne se justifie pas à certaines fins, elle suffit pour la construction d’un indice de prix de l’alimentation: on cherche surtout à appréhender les effets de substitution dans le prix agrégé de l’alimentation, quand les prix relatifs de ses composantes varient. De façon analogue, nous voudrions déterminer comment le consommateur «moyen» apprécie la rapidité accrue d’un ordinateur relativement à un développement de sa mémoire. En d’autres termes, nous nous intéressons surtout aux effets de substitution hédoniques.

Nous n’exigeons pas que la courbe d’indifférence soit globalement linéaire, mais qu’elle le soit localement pour une gamme d’achats. Ou bien nous pouvons estimer que la courbe d’indifférence linéaire donne une approximation de premier ordre à une courbe d’indifférence non linéaire.

En comparant l’équation 21.17 à l’équation 21.15, on s’aperçoit que les hypothèses simplificatrices (21.16) permettent de se débarrasser des termes gt(uit,f(zkt))/Z, qui dépendent des courbes d’indifférence des consommateurs individuels entre le produit hédonique et les autres produits. Si nous disposions de données sur la consommation de produits hédoniques des ménages individuels, nous pourrions utiliser des techniques normales de demande de consommation pour estimer les paramètres caractérisant ces courbes d’indifférence.

On est passé des indices aux exposants conformément aux conventions pour les paramètres des modèles de régression. Les constantes rt seront donc les paramètres de régression dans ce qui suit. On notera aussi que rt est le résultat de la multiplication du prix de l’«autre» produit pt par le paramètre de pente at de la période t. Nous devons laisser ce paramètre de pente se modifier dans le temps, afin de pouvoir modéliser la demande de produits hédoniques de haute technologie, dont les prix relatifs ont baissé relativement aux «autres» produits; nous pensons donc que at diminue au fil du temps pour les produits de haute technologie.

Le modèle de base finit par ressembler beaucoup aux modèles hédoniques de Muellbauer (1974, p. 988–989); voir notamment son équation (32).

Il est possible de réviser la théorie ci-dessus et de lui donner une interprétation selon la théorie de la production. La contrepartie du problème de minimisation de la dépense (21.8) devient le problème suivant de maximisation du profit: max X,Z{PtZwtX: X= gt(kt, Z)} où Z est la production hédonique et Pt un prix de la période t pour une unité de la production hédonique, wt est le prix pour la période t d’un intrant variable et X la quantité utilisée de celui-ci, kt est la quantité d’un facteur fixe (par exemple le capital) pour la période t et gt est la fonction de besoins en facteurs de la firme. En supposant que Z= f(z), nous arrivons à la contrepartie suivante de théorie de la production à l’équation (21.15): Pkt=f(zkt)gt(kt,f(zkt))/Z. La contrepartie à l’hypothèse (21.16) est, pour la firme i,git(kitZ)=atZbitkit et la contrepartie à l’équation (21.17) devient Pkt=wtatf(zkt). Mais les hypothèses du modèle de théorie de la production ne sont pas aussi plausibles que les hypothèses correspondantes du modèle de théorie de la consommation. En particulier, il est peu probable que chaque producteur aura le même prix agrégé de la période t pour une unité d’intrant variable wt; il y a également peu de chances que toutes les firmes qui produisent sur le marché hédonique aient le même paramètre technologique at. L’hypothèse clé, généralement non satisfaite dans le contexte de la production, est que chaque producteur soit en mesure de produire tout l’éventail des modèles hédoniques; du point de vue de la consommation, en revanche, il est tout à fait plausible que chaque consommateur ait la possibilité d’acheter et de consommer chaque modèle.

On définit c comme c(pt) = minx {pt ×: h(x) = 1}, où ptx représente le produit compris entre les vecteurs pt et x.

On trouve une description générale de divers mécanismes d’ajustement dans les paragraphes 7.103 à 7.109 ainsi que dans Triplett (2002). Ils comprennent l’utilisation des coefficients de l’ensemble saillant de caractéristiques ou celle des valeurs prédites de la régression dans son ensemble. Dans les deux cas, on ajuste l’ancien prix pour le comparer au nouveau ou le nouveau pour le comparer à l’ancien, ou bien on fait une moyenne effective des deux.

Triplett (1987) et Diewert (2002d), à la suite de Pollak (1975), considèrent un processus de budgétisation en deux étapes, dans lequel la fraction d’utilité relative aux produits élémentaires définis par des caractéristiques a un indice théorique défini en termes de sélection de caractéristiques minimisant les coûts, sous condition d’un niveau de production optimal pour les produits composites et hédoniques. Ces quantités sont ensuite réintroduites dans la deuxième étape de maximisation du revenu global.

Ioannidis et Silver (1999) ainsi que Bode et van Dalén (2001), qui ont comparé les résultats de ces divers estimateurs, ont trouvé des différences notables, mais pas dans tous les cas; voir aussi Silver and Heravi (2003).

Les hypothèses sont tout à fait différentes de celles faites par Fixler et Zieschang (1992), qui ont suivi une autre approche pour construire des indices hédoniques exacts.

C’est une contrepartie de l’indice de quantité défini par Muellbauer (1974, p. 988) dans l’un de ses modèles hédoniques; voir son équation (30). Traiter rt en tant que prix de l’agrégat de quantité de produits hédoniques défini par l’équation (21.31) peut bien sûr se justifier en faisant appel au théorème d’agrégation de Hicks (1946, p. 312–313); en effet, les prix des modèles Pkt=rtf(Zk) ont tous le facteur commun de proportionnalité rt.

Si l’on dispose de données pour qkt, le mieux est de procéder à des régressions pondérées en fonction des ventes, comme on l’indique à l’appendice 21.1. Si, en l’absence de données de marché complètes sur les ventes individuelles de modèles, on connaît les ventes totales de chaque période, il est possible de faire fonctionner le modèle de régression hédonique avec un échantillon de prix des modèles et de diviser les ventes de la période t par notre paramètre estimé afin d’obtenir un estimateur pour Qt.

Même si l’on calculait des prix virtuels, il subsisterait des problèmes d’inclusion des nouveaux produits dans les indices, comme celui de Laspeyres, en raison de l’absence de pondérations dans la période de base.

Elles équivalent à des fonctions inversées de demande (ou d’offre), dans lesquelles les prix dépendent des quantités demandées (ou fournies) et des caractéristiques du consommateur (ou du producteur) individuel.

Cette méthode en deux temps est répandue dans la littérature économique, bien que Wooldridge (1996) conteste l’estimation conjointe des fonctions hédoniques, de demande et d’offre en tant que système.

Arguea, Haseo et Taylor (1994) proposent une forme linéaire sur la base de l’arbitrage de caractéristiques, censées probables sur des marchés concurrentiels, mais, selon Triplett (2002), ce scénario n’est sans doute pas réaliste sur la plupart des marchés de produits.

Il y a une certaine validité à employer R¯2 comme critère pour choisir entre les modèles semi-logarithmique et log-log quel est le plus approprié; mais son utilisation n’est pas conseillée pour comparer des modèles linéraires avec l’une ou l’autre de ces formations logarithmiques, un certain nombre de tests convenant à ce type de comparaisons. Voir Maddala (1988).

Il y a deux réserves. D’abord, on a besoin de e–1 pour interpréter les coefficients, quand θ est le coefficient estimé. En deuxième lieu, les anti-logarithmes des coefficients estimés par MCO sont biaisés—l’estimation des fonctions semi-logarithmiques comme régressions linéaires transformées exige un ajustement pour donner des estimations non biaisées à variance minimum des paramètres de la moyenne conditionnelle. Il y a un ajustement habituel, qui consiste à ajouter au coefficient estimé la moitié de l’erreur type au carré; voir Goldberger (1968) ainsi que Teekens and Koerts (1972).

Le fait d’ajuster la base par rapport au prix de la période actuelle implique la nécessité de données différentes; voir paragraphe 7.49 au chapitres 7.

On peut bien sûr proposer d’autres moyennes. Ainsi, on répondrait mieux aux besoins d’un indice représentatif de l’établissement «typique» avec une moyenne ou une médiane élaguée de ses points extrêmes.

Diewert (2002e) suggère aussi d’apparier les produits élémentaires quand c’est possible, et d’utiliser les régressions hédoniques pour imputer les prix des produits manquants anciens et des nouveaux. Différents systèmes de pondération, y compris superlatifs, peuvent être appliqués dans chaque période à cet ensemble de données sur les prix, appariées et non appariées.

De telles observations auraient des termes d’erreur à variance plus élevée, ce qui conduirait à des estimations imprécises des paramètres. Cela militerait en faveur de l’usage d’estimateurs de moindres carrés pondérés où la quantité vendue servirait de pondération. C’est l’un des traitements habituels des erreurs hétéroscédastiques; voir Berndt (1991).

Silver et Heravi (2002) montrent que des produits élémentaires anciens ont des effets de levier supérieurs à la moyenne et des résidus inférieurs à la moyenne. Non seulement ils sont différents, mais ils exercent une influence injustifiée compte tenu de leur taille (nombre d’observations). On trouvera des exemples dans Ling and Kyle (2003), Cockburn and Anis (1998) ainsi que Silver and Heravi (2002).

Une procédure moins formelle consiste à prendre les résidus normalisés de la régression et à les représenter sur un graphique avec les caractéristiques des modèles qui peuvent avoir de faibles ventes, comme certaines marques ou générations (si elles ne sont pas directement intégrées) ou encore certaines spécificités techniques qui rendent peu probables des achats importants du produit. On pourra peut-être ainsi faire apparaître des variances plus élevées. Si certaines caractéristiques sont censées générer, en moyenne, de faibles ventes, mais semblent présenter un niveau élevé de variances, d’effets de levier et de restes (voir Silver and Heravi (2002)), il peut paraître justifié de diminuer au moins leur influence. Bode et van Dalén (2001) utilisent des critères statistiques formels pour choisir entre différents systèmes de pondération et comparent les résultats des MCO et des MCP; ils concluent, comme Ioannidis et Silver (1999), à la possibilité de résultats différents.

Triplett (2002) souligne que R¯2 seul ne suffit pas pour cela.

Il existe bien sûr certains domaines de produits, comme le confort dans les avions, dont on a soutenu qu’ils avaient des tendances globales au déclin de la qualité.

    Other Resources Citing This Publication