Chapter

11. Errores Y Sesgos

Author(s):
International Monetary Fund
Published Date:
November 2006
Share
  • ShareShare
Show Summary Details

Introducción

11.1 En este capítulo se analizan las clases de errores en los que, en general, pueden incurrir todos los índices de precios. La bibliografía que estudia los índices de precios al consumidor (IPC) analiza estos errores desde dos perspectivas, ambas presentadas en este capítulo. En primer lugar, se describen las fuentes de los errores de muestreo y errores ajenos al muestreo que surgen al estimar un IPC de la población a partir de una muestra de precios observados. En segundo lugar, se revisan los argumentos sostenidos en muchos estudios recientes que atribuyen sesgos al IPC como consecuencia de un tratamiento impreciso del cambio de calidad, de la sustitución que realiza el consumidor y de otros factores. Debe subrayarse que muchos de los temas de peso que se analizan aquí se estudian con mucha mayor profundidad en otras secciones del manual.

Clases de error

11.2 Uno de los objetivos principales de una encuesta por muestreo es computar estimaciones de las características de la población. Estas estimaciones nunca serán iguales a las características poblacionales, sino que siempre habrá algún margen de error. El cuadro 11.1 ofrece una taxonomía de las diferentes clases de error. También Balk y Kersten (1986) y Dalén (1995) exponen perspectivas generales de varias fuentes de errores estocásticos y no estocásticos experimentados al elaborar el IPC. Pueden distinguirse dos grandes categorías: errores de muestreo y errores ajenos al muestreo.

Cuadro 11.1Taxonomía de los errores en el índice de precios al consumidor
Error total:
Error de muestreo
Error de selección
Error de estimación
Error ajeno al muestreo
Error observacional
Sobrecobertura
Error de respuesta
Error de procesamiento
Error por no observación
Subcobertura
Ausencia de respuesta

Error de muestreo

11.3 Los errores de muestreo ocurren debido a que cada IPC estimado se basa en muestras y no en enumeraciones completas de la población estudiada. Los errores de muestreo desaparecen si las observaciones cubren la población completa. Tal como se mencionó en capítulos anteriores, las oficinas de estadística suelen adoptar un índice de precios de ponderación fija como objeto de la estimación. El índice de ponderación fija puede considerarse una media ponderada de índices parciales de grupos de productos, en los que las ponderaciones son las participaciones en el gasto. La mayoría de las oficinas de estadística utiliza diversos tipos de muestras para estimar el IPC. Los tipos más importantes son los siguientes:

  • Para cada grupo de productos, una muestra de estos para calcular el índice de precios parcial de ese grupo.

  • Para cada producto, una muestra de puntos de venta para calcular el índice de precios elemental del producto a partir de observaciones individuales de precios.

  • Una muestra de hogares, necesaria para la estimación de las participaciones promedio de los grupos de productos en el gasto (algunos países utilizan datos de las cuentas nacionales en lugar de encuestas de gasto de los hogares para obtener las participaciones en el gasto).

11.4 El error de muestreo puede clasificarse en error de selección y error de estimación. El error de selección ocurre cuando las probabilidades efectivas de selección se desvían de las probabilidades de selección especificadas en el diseño de la muestra. El error de estimación representa el efecto causado por la utilización de una muestra basada en un procedimiento de selección aleatoria. Cada nueva selección de muestra dará como resultado elementos distintos y, por lo tanto, un valor posiblemente distinto del estimador.

Error ajeno al muestreo

11.5 Los errores ajenos al muestreo pueden ocurrir incluso cuando se observa la población completa. Pueden subdividirse en errores observacionales y errores por no observación. Los errores observacionales son los que se cometen durante el proceso de obtención y registro de las observaciones básicas o de las respuestas.

11.6 La sobrecobertura se produce cuando en las encuestas se incluyen algunos elementos que no corresponden a la población objetivo. Las oficinas de estadística no suelen tener marcos muestrales adecuados para los puntos de venta. En algunos países, por ejemplo, se utiliza un registro de empresas como marco muestral para estos puntos. En este registro, los puntos de venta se clasifican según su actividad principal. Así, por lo general, el registro incurre en una sobrecobertura, dado que contiene numerosos puntos de venta que no entran en el alcance del IPC (como, por ejemplo, empresas que venden a comercios pero no a hogares). Además, generalmente, no se ofrece información detallada de todos los productos vendidos en cada punto de venta, por lo que es posible que un punto de venta incluido en la muestra simplemente no venda un determinado producto.

11.7 Los errores de respuesta se producen en las encuestas de gasto de los hogares o en las encuestas de precios cuando el encuestado no comprende la pregunta o no quiere proporcionar la respuesta correcta, o cuando el entrevistador o agente encargado de recopilar los precios comete un error al registrar la respuesta. En las encuestas de gasto de los hogares, por ejemplo, los hogares parecen subdeclarar sistemáticamente su gasto en grupos de productos tales como el tabaco y las bebidas alcohólicas. En muchos países, el método principal de recopilación de precios es a través de personas que regularmente visitan los puntos de venta, las que pueden obtener los precios de productos superfluos.

11.8 Los datos de precios se procesan en varias etapas, tales como codificación, ingreso, transferencia y edición (control y corrección). En cada uno de estos pasos pueden ocurrir errores, llamados errores de procesamiento. Por ejemplo, en los puntos de venta, los recopiladores de precios escriben los precios en formularios de papel. Cuando los recopiladores terminan su tarea, se utiliza una computadora como medio para el ingreso y la transmisión de información. Es evidente que este modo de procesar los precios es susceptible de errores.

11.9 Los errores de no observación se producen cuando no pueden realizarse las mediciones esperadas. La subcobertura ocurre cuando algunos elementos de la población objetivo no aparecen en el marco muestral. El marco muestral de los puntos de venta puede tener una subcobertura, lo que significa que no pueden contactarse algunos puntos de venta en los que se venden productos relevantes. Algunas oficinas de estadística excluyen de su marco muestral de puntos de venta a las empresas de venta por correo y a los puestos de mercado que no venden alimentos.

11.10 Otro error de no observación es la ausencia de respuesta. Los errores de ausencia de respuesta pueden surgir cuando no se obtiene en forma puntual la información requerida a las unidades seleccionadas en la muestra. Puede trazarse una distinción entre la ausencia de respuesta total y la ausencia de respuesta parcial (o de artículo). La ausencia total de respuesta ocurre cuando un punto de venta seleccionado no puede ser contactado o se rehúsa a participar en la encuesta de precios. Otra instancia de ausencia total de respuesta ocurre cuando el encuestado y el agente encargado de recopilar los precios devuelven por correo los cuestionarios y los formularios de recopilación, respectivamente, después de vencido el plazo correspondiente. Los cuestionarios y los formularios de recopilación solo parcialmente completos son ejemplos de ausencia parcial de respuesta. Si los cambios de precios de los puntos de venta no encuestados difieren de los puntos de venta encuestados, habrá un sesgo en los resultados de la encuesta de precios.

11.11 También puede encontrarse ausencia total o parcial de respuesta en la encuesta de gasto de los hogares. La ausencia total de respuesta ocurre cuando los hogares incluidos en la muestra se rehúsan a cooperar; la ausencia parcial de respuesta ocurre, por ejemplo, cuando algunos de los hogares seleccionados se rehúsan a dar información acerca de sus gastos en determinados grupos de productos.

Medición de errores y sesgos

Estimación de la varianza

11.12 El estimador de varianza depende tanto del estimador elegido para el IPC como del diseño muestral. Boon (1998) ofrece un panorama de los métodos de muestreo que aplican varios institutos de estadística europeos en la elaboración del IPC. En él se observa que solo cuatro de ellos utilizan algún tipo de técnica probabilística para la selección de puntos de venta y que solo uno utiliza el muestreo probabilístico para la selección de artículos. A falta de técnicas probabilísticas, se aplican métodos de selección llamados “método de la muestra dirigida” y “por valores umbral”.

11.13 Dada la complejidad de los diseños muestrales (parcialmente conectados) para la elaboración del IPC, no parece sencillo lograr un enfoque integrador de la estimación de la varianza. Es decir, parece difícil encontrar una sola fórmula que mida la varianza del IPC y que capture todas las fuentes de errores de muestreo. Sin embargo, es posible desarrollar medidas parciales (o condicionales), en las que solo se cuantifique el efecto de una única fuente de variación. Por ejemplo, Balk y Kersten (1986) calcularon la varianza de un IPC provocada por la variación muestral de la encuesta de gasto de los hogares, condicional al supuesto de que los índices parciales de precios se conocen con certeza. Idealmente, todos los errores de muestreo condicionales deberían agruparse en un marco unificador para evaluar la importancia relativa de las distintas fuentes de error. Bajo supuestos bastante restrictivos, Balk (1989) elaboró un marco integrador para el error de muestreo total del IPC.

11.14 Existen varios procedimientos para intentar estimar la varianza muestral del IPC. Pueden utilizarse los estimadores de varianza basados en el diseño (es decir, las varianzas de los estimadores de Horvitz-Thompson), combinados con los procedimientos de linealización de Taylor, para los errores de muestreo derivados de un diseño muestral probabilístico. Por ejemplo, suponiendo un diseño muestral de clasificaciones cruzadas, en el que las muestras de productos y de puntos de venta se extraigan de manera independiente de una población bidimensional, con probabilidades proporcionales al tamaño en ambas dimensiones, puede obtenerse una fórmula de varianza basada en el diseño. De este modo Dalén y Ohlsson (1995) hallaron que el error de muestreo del IPC sueco de todos los productos para un cambio de 12 meses era del orden del 0,1%–0,2%.

11.15 El problema principal del muestreo no probabilístico es que no hay una manera teóricamente aceptable de saber si la dispersión de los datos de la muestra refleja con precisión la dispersión de la población. Por lo tanto, para estimar la varianza, es necesario recurrir a técnicas de aproximación. Una de estas técnicas es el muestreo cuasi aleatorio (véase Särndal, Swensson y Wretman [1992, pág. 574]), en el que se establecen supuestos acerca de las probabilidades de muestrear productos y puntos de venta. El problema de este método es que es difícil encontrar un modelo de probabilidad que se aproxime adecuadamente al método utilizado efectivamente en la selección de puntos de venta y de artículos. Otra posibilidad es utilizar un método de replicación tal como el método de los grupos aleatorios, el método de las mitades de muestra compensadas, el método herramental o el método autosuficiente. Se trata de una clase de métodos completamente no paramétricos para estimar las distribuciones muestrales y los errores estándar. Los métodos de replicación funcionan mediante la extracción de un gran número de submuestras de una muestra dada. El parámetro de interés puede estimarse para cada submuestra. Bajo condiciones relativamente débiles, puede demostrarse que la distribución de las estimaciones resultantes se aproxima a la distribución en el muestreo del estimador original. Särndal, Swensson y Wretman (1992, págs. 418–45) ofrecen más detalles acerca de los métodos de replicación.

Descripciones cualitativas de los errores ajenos al muestreo

11.16 Es aún más difícil obtener medidas cuantitativas de los errores ajenos al muestreo, por lo que la única posibilidad es utilizar medidas cualitativas. Por ejemplo, se puede tratar la cobertura de los marcos muestrales como variable representativa de la población objetivo (incluso las brechas, las duplicaciones y los problemas de definición). Se puede contar con el porcentaje de los puntos de venta objetivo de las muestras de las que se obtuvieron respuesta o datos de precios utilizables (esto es, las tasas de respuesta). Puede describirse cualquier diferencia conocida entre los precios de los puntos de venta encuestados y los precios de los no encuestados, así como también puede describirse el método de imputación o estimación utilizado para compensar la ausencia de respuesta. La mayor parte de las cuestiones acerca del sesgo, analizadas más adelante, se distribuye en diversas categorías de errores ajenos al muestreo.

Procedimientos para minimizar los errores

11.17 El error de estimación puede controlarse mediante el diseño muestral. Por ejemplo, si se aumenta el tamaño de la muestra o si se toman probabilidades de selección proporcionales a alguna variable auxiliar correctamente elegida, puede reducirse el error en el IPC estimado. La elección de un diseño muestral adecuado para el IPC es un tema sumamente complejo. La población objetivo es el conjunto de todos los bienes y servicios que los hogares adquieren, utilizan o pagan a los puntos de venta en un período determinado. Un procedimiento apropiado de muestreo probabilístico selecciona una muestra mediante un mecanismo aleatorio en el que cada bien o servicio de la población tiene una probabilidad de selección conocida. Combinado con un estimador de Horvitz-Thompson, este diseño muestral probabilístico genera un índice (aproximadamente) insesgado y preciso.

11.18 Los siguientes tres diseños muestrales probabilísticos tienen un uso extendido en la realización de encuestas: el muestreo aleatorio simple, el muestreo con probabilidad proporcional al tamaño y el muestreo estratificado con muestreo aleatorio simple o con probabilidad proporcional al tamaño en cada estrato. La ventaja del muestreo aleatorio simple es su simplicidad: asigna a cada elemento de la población la misma probabilidad de ser incluido en la muestra. El muestreo con probabilidad proporcional al tamaño ofrece la ventaja de que los elementos más importantes tienen más oportunidades de ser incluidos en la muestra que los menos importantes. Por ejemplo, en la Oficina de Estadística de Suecia, los puntos de venta se seleccionan con probabilidad proporcional a alguna variable representativa del tamaño, por ejemplo, el número de empleados con los que cuentan. Los diseños que asignan probabilidades desiguales pueden resultar en una reducción importante de la varianza en comparación con los diseños de probabilidades iguales. En el muestreo estratificado, la población se divide en subpoblaciones disjuntas llamadas “estratos”. Por ejemplo, en la Oficina Nacional de Estadística del Reino Unido, la población de puntos de venta se divide por clase de punto de venta (múltiple, independiente o especializado) para formar los distintos estratos. En cada estrato, se selecciona una muestra según un determinado diseño. Uno de los motivos de la popularidad del muestreo estratificado es que la selección estratificada con muestreo aleatorio simple en estratos bien construidos captura la mayor parte de la precisión que se podría ganar usando muestreo con probabilidad proporcional al tamaño. El muestreo estratificado es, en muchos aspectos, más simple que el muestreo con probabilidad proporcional al tamaño.

11.19 Debido a la falta de marcos muestrales apropiados, las muestras suelen obtenerse mediante métodos no probabilísticos. El muestreo dirigido (o por elección de un experto) es una forma de selección no aleatoria. En este caso, un experto selecciona determinados elementos “típicos” o característicos en donde deben recopilarse los datos. Si el experto es hábil, puede obtenerse una muestra bastante buena, pero no hay manera de asegurarse de ello. Un método no probabilístico más sofisticado es el muestreo por cuotas. En el muestreo por cuotas, la población se divide primero en determinados estratos. Para cada estrato, se fija el número (la cuota) de elementos que debe incluirse en la muestra. Luego, el encuestador de campo simplemente llena las cuotas, lo que significa que, en el caso del muestreo de puntos de venta, la selección de estos puntos, en definitiva, se basa en el criterio de los agentes encargados de recopilar los precios. Otro método no probabilístico es el muestreo por valores umbral, que implica que parte de la población objetivo se excluye deliberadamente del proceso de selección de la muestra. Este procedimiento se utiliza especialmente cuando la distribución de algunas variables auxiliares es muy asimétrica. Por ejemplo, gran parte de la población puede estar formada por puntos de venta pequeños que contribuyen modestamente a las ventas totales. En ese caso, puede tomarse la decisión de excluir del marco muestral a los puntos de venta con menores ventas. Dado que la selección no es aleatoria, los métodos no probabilísticos suelen dar como resultado estimaciones más o menos sesgadas. Sin embargo, en una investigación realizada por la Oficina de Estadística de los Países Bajos, los resultados empíricos demuestran que los métodos de selección no probabilísticos no se desempeñan necesariamente peor, en términos del error cuadrático medio, que las técnicas de muestreo probabilístico (De Haan, Opperdoes y Scout [1997]).

11.20 En general, y siempre que esté dado el diseño muestral, la varianza muestral de un IPC estimado (de todos los productos) puede reducirse por medio de:

  • – Ampliación de las muestras de hogares, productos y puntos de venta.

  • – Empleo de estratificaciones apropiadas en las diversas poblaciones (por ejemplo, agrupando los productos según la similitud de la variación de los precios).

11.21 Es importante asignar de manera óptima los recursos disponibles, tanto entre las diferentes muestras del IPC como dentro de ellas, ya que las muestras mal asignadas pueden provocar errores de muestreo innecesariamente altos. Los resultados de la estimación de la varianza en Suecia, presentados en Dalén y Ohlsson (1995), demuestran que el error que resulta del muestreo de productos es relativamente alto comparado con el error que resulta del muestreo de puntos de venta. En este caso, vale la pena aumentar el tamaño de la muestra de productos y reducir el de la muestra de puntos de venta.

11.22 Un análisis sistemático de los errores de muestreo ofrece la posibilidad de mejorar o bajar los costos. El problema de la asignación óptima de las muestras suele formularse como la determinación del tamaño de las muestras de productos y de puntos de venta, y su distribución en estratos, que minimizan el error muestral de un IPC de todos los productos, sujeto al presupuesto disponible.

11.23 Como ya se mencionó, un registro de empresas no es, por lo general, un marco muestral apropiado para los puntos de venta, porque incurre en una severa sobrecobertura. Se recomienda establecer un marco muestral adecuado enumerando los puntos de venta principales en cada distrito estudiado. Con esta enumeración se obtiene una lista de todos los puntos de venta de cada distrito, junto con los grupos de productos que ofrecen. Un modo menos costoso para organizar un marco muestral de puntos de venta es solicitar a los agentes encargados de recopilar los precios—de quienes puede suponerse que conocen bien la situación local—que confeccionen una lista de los puntos de venta en los que los hogares realizan sus compras.

11.24 Las poblaciones de productos (y variedades) y de puntos de venta cambian continuamente a lo largo del tiempo. La composición de la mayoría de los grupos de productos tampoco es constante, dado que algunos productos desaparecen del mercado, y otros nuevos aparecen. El paso del tiempo también altera la población de puntos de venta: algunos cierran, temporaria o permanentemente, otros abren y la importancia de otros disminuye o aumenta. Las muestras de productos (y variedades) y de puntos de venta deben ser revisadas y actualizadas periódicamente para que mantengan la representatividad de los hábitos de compra corrientes de los hogares.

11.25 Los errores de respuesta provocados por la subdeclaración de determinadas categorías de gasto de los hogares pueden ser ajustados utilizando estimaciones de las cuentas nacionales basadas en la producción (Linder [1996] ofrece un ejemplo). Los errores de medición que cometen los agentes encargados de recopilar los precios pueden reducirse si se los provee de computadoras de mano para el ingreso de datos. De este modo, la validación de los precios observados puede realizarse en el momento de la recopilación de los precios (es decir, en el punto de venta), mediante la comparación automática de los precios observados en ese momento con los precios observados previamente (estipulando un límite para el porcentaje de cambio de precios) y con los precios obtenidos de otros puntos de venta (estipulando un límite superior e inferior apropiados). Haworth, Fenwick y Beaven (1997) ofrecen más detalles al respecto.

11.26 Es conveniente designar supervisores de la recopilación de datos que realicen verificaciones de la calidad del trabajo de los recopiladores de datos. También puede ser una buena idea organizar reuniones regulares en las que los agentes encargados de recopilar los precios y los estadísticos de la oficina central puedan compartir sus experiencias. De este modo, estos últimos no pierden el contacto con las condiciones del campo y pueden aprovechar la oportunidad para brindar más información acerca de los errores frecuentes en la recopilación de precios y de los nuevos bienes representativos.

11.27 Es importante buscar los errores de procesamiento que pueda haber entre los datos de precios recopilados y, siempre que sea posible, corregirlos. Esta actividad se denomina “edición de datos”. Se llama “edición micro” a la edición de observaciones individuales. Cuando es necesario minimizar el gasto en edición de datos y, al mismo tiempo, mantener la calidad de los datos es posible recurrir a la edición selectiva y a la edición macro. La edición selectiva es una forma de la edición micro tradicional, en la que el número de correcciones se mantiene al mínimo: solo se realizan las correcciones que tienen un efecto en los resultados de la encuesta. La edición macro ofrece un enfoque de arriba hacia abajo: se corrigen los datos agregados (por ejemplo, los números del índice de precios de un grupo de productos) en lugar de los registros individuales (por ejemplo, las observaciones de precios). La edición micro de registros individuales solo se lleva a cabo si las correcciones macro resultan sospechosas. Se debe prestar especial atención a los valores atípicos que puedan encontrarse entre las observaciones.

11.28 La ausencia de respuesta suele introducir un sesgo de selección. Existen tres métodos para tratar las observaciones de precios faltantes. En primer lugar, el precio correspondiente puede excluirse del conjunto de datos de precios previos, de modo que el conjunto de precios previos se “equipare” con el conjunto de los precios corrientes. En segundo lugar, esta equiparación puede lograrse utilizando un precio imputado (o artificial) para el precio faltante. El precio imputado puede calcularse mediante el arrastre de la observación previa del precio o bien extrapolando la observación previa del precio mediante el cambio de otras observaciones de precios del mismo producto. En tercer lugar, existe la posibilidad de volver a ponderar la muestra. El propósito de rehacer las ponderaciones es incrementar la ponderación asignada a los precios de los puntos de venta encuestados. Esto compensa los precios que se pierden por ausencia de respuesta.

11.29 En una encuesta de gasto de los hogares, los datos faltantes suelen imputarse con ayuda de la información acerca del mismo hogar en un período previo de observación o de otros hogares en el mismo período de observación. Para reducir el sesgo en el patrón de gasto promedio originado por la ausencia de respuesta selectiva, la muestra de hogares de la encuesta de gasto de los hogares suele estratificarse a posteriori teniendo en cuenta una serie de características de los mismos tales como su ingreso, su composición y su tamaño.

Clases de sesgos

11.30 En esta sección se estudian diversas categorías de error, tanto al establecer los precios como al elaborar los índices, que pueden provocar sesgo en el IPC a nivel general. El capítulo se concentra en la categorización de los errores, así como en algunas consideraciones acerca de su magnitud posible, más que en los métodos para reducir o eliminar los errores. Podría surgir la pregunta de por qué es necesario este análisis, ya que cuestiones como los cambios de calidad y los métodos apropiados para tratarlos en el IPC son desarrolladas en otros capítulos tanto a nivel conceptual como operacional.

11.31 El motivo por el cual este capítulo trata el tema del sesgo del IPC per se es el gran interés que cobraron los problemas de medición de precios a mediados de la década de 1990. Especialmente en Estados Unidos, se generalizó la percepción de que el IPC se veía afectado por sesgos sistemáticos al alza debido a la dificultad para dar cuenta correctamente de la sustitución por el consumidor, las mejoras en la calidad de los productos y la introducción de artículos y servicios nuevos. Más aún, se reconocía, en primer lugar, que la existencia de estos sesgos al alza tendría implicancias fundamentales para la medición de tendencias recientes en la producción y la productividad. En segundo lugar, la eliminación de los sesgos al alza podría mejorar sustancialmente la situación presupuestaria del gobierno mediante la reducción del gasto gubernamental y el aumento de la recaudación de impuestos (véanse, por ejemplo, Eldridge [1999] y Duggan y Gillingham [1999]). Estos descubrimientos derivaron en una serie de documentos e informes sobre los problemas de medición del IPC, con frecuencia acompañados por estimaciones puntuales del sesgo agregado.

11.32 Algunos ejemplos prominentes de estos estudios cuantitativos acerca del sesgo son los realizados por la Comisión Asesora para el Estudio del IPC (Senado de Estados Unidos, 1996), la Oficina Presupuestaria del Congreso (1994), Crawford (1998), Cunningham (1996), Dalén (1999), Diewert (1996), Lebow, Roberts y Stockton (1994), Lebow y Rudd (2003), Shapiro y Wilcox (1996), Shiratsuka (1999), White (1999) y Wynne y Sigalla (1994). Entre las respuestas y estimaciones de agencias de estadística se cuentan las de Abraham y otros (1998), Oficina de Estadísticas Laborales de Estados Unidos (1998), Ducharme (1997), Edwards (1997), Fenwick (1997), Lequiller (1997), Moulton (1996) y Moulton y Moses (1996). Entre muchos otros análisis de la cuestión del sesgo en el IPC se encuentran los realizados por Baker (1998), Boskin y otros (1998), Deaton (1998), Diewert (1998), Krueger y Siskind (1998), Nordhaus (1998), Obst (1999), OECD (1997), Pollak (1998), Popkin (1997) y Triplett (1997).

11.33 Es conveniente aclarar desde el principio dos puntos respecto de la medición del sesgo en el IPC. Primero, que, por lo general, el tema ha sido abordado en el contexto del índice del costo de vida (ICV). Es decir, el sesgo del IPC ha sido definido como la diferencia entre la tasa de aumento del IPC y la tasa de aumento del verdadero ICV. Muchos de los que han escrito sobre el tema dan por sentado que el ICV debe ser el objetivo de medición del IPC. Si se toma como objetivo del índice un índice puro de precios, se puede llegar a conclusiones diferentes, la más llamativa de las cuales es que podría considerarse irrelevante el aumento del bienestar de los consumidores obtenido a partir de una mayor variedad de bienes nuevos o la posibilidad de los consumidores de sustituir artículos cuyos precios relativos aumentan. Un índice que no tenga en cuenta estos factores no será evaluado como sesgado por esta razón.

11.34 El segundo punto que conviene mencionar es que el sesgo del IPC no es susceptible de ser estimado con el mismo rigor que el utilizado en la estimación de la varianza del IPC. Dado que el ICV u otros índices objetivo ideales no son observables, los analistas se han visto forzados a confiar, en parte, en conjeturas y generalizaciones basadas en evidencia empírica fragmentaria para cuantificar el sesgo. Las notables excepciones se dan con respecto al sesgo por sustitución, ya que los índices tradicionales de Laspeyres y los índices que utilizan fórmulas superlativas pueden ser computados mediante los mismos datos subyacentes de precios y gastos, y las diferencias pueden ser interpretadas como una medida del sesgo al alza provocado por la utilización de la fórmula de Laspeyres.

11.35 En la bibliografía mencionada anteriormente se describen muchas taxonomías diferentes del sesgo. Sin embargo, bastará emplear cuatro categorías correspondientes, a grandes rasgos, a las expuestas en el estudio más conocido, el Informe final de la Comisión Asesora para el Estudio del IPC (la Comisión Boskin), realizado por el Comité de Finanzas del Senado de Estados Unidos en 1995. Las categorías son las siguientes: el sesgo por la sustitución a un nivel superior, el sesgo en un agregado elemental, el sesgo debido al cambio en la calidad o a la introducción de nuevos bienes y el sesgo debido a la incorporación de nuevos puntos de venta.

11.36 Estas categorías pueden, a su vez, dividirse en dos subgrupos según se refieran a errores en las mediciones individuales de precios o a errores en la elaboración de las series de índices. El sesgo por cambio de calidad y por bienes nuevos ocurre como consecuencia de la medición incorrecta del valor que obtienen los consumidores de bienes y servicios individuales que aparecen en el mercado (o que desaparecen del mismo). Cabe señalar que los análisis de los problemas de los “bienes nuevos” se aplican a todos los productos por igual, sean bienes o servicios. En un nivel conceptual, puede ser difícil distinguir entre estas dos clases de sesgo. Sin embargo, en el nivel operativo, el sesgo por cambio de calidad concierne a los procedimientos de comparación de productos o modelos nuevos con respecto a los productos viejos a los que reemplazan en las muestras del IPC. En general, puede considerarse que el sesgo por bienes nuevos se aplica a clases completamente nuevas de productos o a productos que no entrarían en las muestras de manera rutinaria mediante el reemplazo forzado. El sesgo por punto de venta nuevo, también llamado “sesgo por sustitución de puntos de venta”, es similar al sesgo por bienes nuevos, excepto que se relaciona con la aparición de nuevas clases de comercios o de métodos de comercialización que ofrecen bienes a precios más bajos o de mejor calidad.

11.37 Las demás categorías de sesgo se refieren a los procedimientos de construcción de valores del índice a partir de las series que lo componen. Tal como se señala repetidamente en este manual, puede considerarse que la elaboración del IPC se lleva a cabo en dos etapas o niveles. En el nivel inferior, se combinan precios individuales; en el nivel superior, se agregan estos índices básicos. A estos dos niveles corresponden dos formas de sesgo potencial. El sesgo del agregado elemental se relaciona con las fórmulas de promedio que se utilizan para combinar los precios en índices básicos. El sesgo por sustitución de nivel superior tiene que ver con las fórmulas utilizadas para combinar estos índices elementales en índices de nivel superior. Más adelante se analizan con mayor detalle estos componentes de sesgos potenciales y los medios utilizados para medirlos.

Componentes del sesgo

Sesgo por sustitución de nivel superior

11.38 El sesgo por sustitución de nivel superior es, posiblemente, la fuente de sesgo del IPC más aceptada y aquella con la que los economistas están más familiarizados gracias a la teoría y práctica de los índices de precios que se encuentran en los libros de texto. Para expresarlo de un modo sencillo, surge cuando los IPC utilizan la fórmula de Laspeyres (véase capítulo 17), que, como bien se sabe, bajo determinados supuestos acerca del comportamiento de los consumidores, provee una cota superior del índice del costo de vida. Tal como se señala en el párrafo 11.34, las medidas cuantitativas del sesgo por sustitución de nivel superior pueden obtenerse comparando índices de Laspeyres con el índice ideal de Fisher, el de Törnqvist u otros índices superlativos. Bajo determinados supuestos acerca de, por ejemplo, las preferencias constantes, las medidas así obtenidas constituirán estimaciones relativamente precisas del sesgo.

11.39Genereux (1983) y Aizcorbe y Jackman (1993) proporcionan estas comparaciones de índices y estas estimaciones del sesgo por sustitución de nivel superior utilizando series de IPC efectivas para Canadá y Estados Unidos, respectivamente. Otros estudios tempranos realizados por Braithwait (1980) y Manser y McDonald (1988) estiman el sesgo por sustitución en los índices de las cuentas nacionales de Estados Unidos. En lugar de índices superlativos, el estudio de Braithwait utiliza índices estimados del costo exacto de la vida basados en el sistema de estimación de la demanda. Balk (1990) ofrece una estimación similar para los Países Bajos. En estos estudios se demuestra de forma consistente la existencia de un sesgo al alza en la fórmula de Laspeyres. Los sesgos de los cambios anuales en los índices de años individuales son relativamente pequeños: su promedio es de 0,1 a 0,3 puntos porcentuales y dependen empíricamente de factores tales como la distancia respecto del período base de Laspeyres, el nivel de detalle con el que se aplican en el índice las fórmulas alternativas y si el índice superlativo es de una variedad de base fija o encadenado.

11.40 Las principales diferencias entre el índice de Laspeyres y los índices superlativos surgen de la variación en los precios relativos durante el período en que se comparan y del desplazamiento de las cantidades consumidas hacia las categorías del índice cuyos precios relativos cayeron. Esto conduce a varias conclusiones:

  • Si las variaciones del índice se caracterizan por movimientos continuos y uniformes de los precios relativos, acompañados por movimientos en el consumo, el tamaño del sesgo anual de Laspeyres tenderá a crecer a medida que se distancia del período base. (Greenlees [1997] señala, sin embargo, que hay poca evidencia de este fenómeno en Estados Unidos; véase también Szule [1983].)

  • Bajo las mismas circunstancias, la reducción del intervalo de encadenamiento de las ponderaciones del gasto, llevará a una reducción del sesgo por sustitución de nivel superior en el IPC de Laspeyres. La mayor frecuencia del encadenamiento aumentará la ponderación asignada a los índices cuyos precios relativos caen y de ese modo reducirá la tasa de crecimiento del IPC. Por el contrario, si los índices relativos experimentan movimientos de “rebote”, el encadenamiento frecuente puede llevar a un “movimiento en cadena” en alza en el índice de Laspeyres.

  • El sesgo por sustitución de nivel superior tenderá a ser mayor durante los períodos de inflación más alta, si estos períodos también se ven afectados por una mayor variación en los precios relativos. No obstante, hay poca evidencia empírica respecto de este punto.

11.41 El concepto de sesgo por sustitución de nivel superior se desarrolló y analizó en el contexto de la teoría del índice del costo de vida, pero puede definirse un sesgo equivalente desde la perspectiva del índice de precios puro. Si se considera preferible el índice ideal de Fisher u otro índice superlativo sobre la base de su tratamiento simétrico de los patrones de gasto del período base y del período corriente, la diferencia entre ese índice y el índice de Laspeyres puede interpretarse como una medida del sesgo de representatividad. Puede aplicarse un argumento similar respecto del sesgo por sustitución de nivel inferior dentro de las celdas elementales del índice.

11.42 Recientemente, Lebow y Rudd (2003) definieron y estimaron otra categoría de sesgo relacionada con la agregación de nivel superior. Concluyeron que las ponderaciones de la encuesta de gasto de los consumidores utilizadas en el IPC de Estados Unidos eran susceptibles de errores a causa de, por ejemplo, la subdeclaración de los gastos en alcohol y tabaco. Esto deriva en un sesgo de ponderación si los errores en la ponderación relativa guardan correlación con los cambios en los índices que la componen. (En el capítulo 4 se analizan detalladamente las fuentes de estimación de ponderaciones del gasto y los problemas que las afectan.)

Sesgo de los agregados elementales

11.43 El sesgo de un agregado elemental puede dividirse en dos componentes: sesgo de fórmula y sesgo por sustitución de nivel inferior. Un índice elemental del IPC está sesgado cuando su esperanza difiere de su objetivo de medición. El término “sesgo de fórmula” (o “sesgo de forma funcional”) se utiliza aquí para denotar una situación en la que la fórmula del índice elemental tiene un sesgo al alza en relación con el índice puro de precios. Cuando el objetivo de medición es un índice del costo de vida, la fórmula del índice elemental sufre un sesgo por sustitución de nivel inferior (o sesgo por sustitución dentro del estrato) si no refleja la sustitución que realiza el consumidor entre los artículos contenidos en esa celda del índice. De este modo, dada una fórmula de índice elemental, ambas formas de sesgo pueden distinguirse teniendo en cuenta el objetivo del índice elemental.

11.44 En los capítulos 9 y 20 de este manual se analizan las características de otras fórmulas de índice elemental. Un resultado clave es que la fórmula de Carli para el promedio aritmético de los cocientes tiene un sesgo al alza en relación con la tendencia de los precios promedio de los artículos. En consecuencia, Eurostat prohibió el uso de esta fórmula en la elaboración de los Índices Armonizados de Precios al Consumidor. Las fórmulas ponderadas utilizadas en índices básicos del IPC de Estados Unidos tenían algunas características de la fórmula de Carli antes de los cambios de procedimiento y cómputo efectuados en 1995 y 1996. Los problemas y los métodos elegidos para abordarlos se exponen, por ejemplo, en Reinsdorf y Moulton (1997) y Moulton (1996).

11.45 Las fórmulas del cociente de los promedios aritméticos (Dutot) y de la media geométrica (Jevons) eliminan el sesgo de fórmula tal como se lo define aquí, y Eurostat permite el uso de ambas. Sin embargo, sus esperanzas difieren cuando los precios de los artículos no cambian a un ritmo uniforme. Las diferencias proporcionan una manera de evaluar la importancia potencial del sesgo por sustitución de nivel inferior. La fórmula de media geométrica es exacta para el índice del costo de vida si los consumidores siguen el modelo Cobb-Douglas de comportamiento, mientras que la fórmula basada en el cociente de los promedios aritméticos corresponde a un comportamiento de sustitución cero. Así, si el propósito es aproximar el índice del costo de vida, es probable que se considere preferible la fórmula de la media geométrica.

11.46 En el futuro, es posible que los datos escaneados permitan registrar datos de consumo a nivel de artículo en forma diaria, semanal o mensual y utilizar estos datos en la elaboración de índices superlativos. Actualmente, sin embargo, es imposible emplear fórmulas superlativas para calcular índices IPC elementales. Debe realizarse algún supuesto, como el de Cobb-Douglas, para estimar un índice del costo de vida. Cabe señalar que la sustitución que idealmente debería reflejar el índice abarca la elección del consumidor entre todos los artículos de la celda: distintos productos, productos ofrecidos en distintos puntos de venta, envases de distintos tamaños del mismo producto o el mismo producto en oferta en distintos momentos del período al que se refiere el índice (véase Dalton, Greenlees y Stewart [1999]). Así, el grado adecuado de comportamiento de sustitución supuesto debería depender, en principio, de las dimensiones de la variedad existente en la categoría de artículos.

11.47 El método utilizado por la agencia de estadística para muestrear artículos dentro de una categoría determinará la efectividad de la elección de la fórmula para tratar el sesgo por sustitución de nivel inferior. Por ejemplo, si se elige un solo artículo representativo para representar una categoría, la fórmula del índice no reflejará la respuesta del consumidor a ningún cambio de precio relativo que ocurra en el universo de artículos. Desde un punto de vista más general, cuando se usa la fórmula de la media geométrica, el índice se ve afectado por un sesgo al alza en las muestras pequeñas, por lo que el sesgo por sustitución de nivel inferior puede subestimarse en las comparaciones empíricas de la media geométrica con otras fórmulas de índice. White (1999) analiza la relación entre el error de muestreo y las estimaciones del sesgo. Véase también McClelland y Reinsdorf (1999) respecto del sesgo por muestra pequeña en la media geométrica.

11.48 El impacto de la elección de la fórmula puede estimarse con cierta precisión a lo largo de un período histórico determinado. Sin embargo, cualquier sesgo correspondiente puede estimarse solo suponiendo que la media geométrica u otra forma funcional aproximan correctamente el objetivo de medición del índice.

11.49 Tal como sugieren los párrafos anteriores, la importancia del sesgo del agregado elemental varía de un país a otro según las fórmulas de índice específicas utilizadas, el grado de heterogeneidad dentro de los estratos del índice y los métodos de muestreo aplicados. Además, tal como con el sesgo por sustitución de nivel superior, el sesgo del agregado elemental varía con el nivel general de la inflación de la economía si los cambios en los precios absolutos y relativos están correlacionados.

11.50 El desempeño de cualquier fórmula para el cálculo del agregado elemental se verá afectado también por los métodos utilizados por la agencia de estadística para el tratamiento de situaciones especiales, tales como los bienes estacionales y otros productos que temporalmente no estén disponibles. Armknecht y Maitland-Smith (1999) analizan cómo no realizar imputaciones de los precios faltantes puede generar un sesgo en la fórmula modificada de Laspeyres y otras fórmulas de índice.

Sesgo por cambio de calidad y por productos nuevos

11.51 El análisis de sesgos potenciales en el IPC que surgen de ajustes por calidad inadecuados tiene una larga historia. Por ejemplo, el informe del Comité Stigler acerca de las estadísticas de precios de Estados Unidos (Price Statistics Review Committee [1961]) afirmó que “si se llevara a cabo una encuesta entre economistas profesionales y responsables de la estadística, con toda probabilidad estos señalarían (y por una amplia mayoría) como el defecto más importante de los índices de precios su incapacidad de dar cuenta pertinentemente de los cambios de calidad”. En la mayoría de los estudios sobre sesgo, el cambio de calidad no medido o mal medido es también la mayor contribución al sesgo estimado total. Sin embargo, así como se reconoce que el ajuste por calidad es un proceso extremadamente difícil, es igualmente difícil medir cualquier sesgo por cambio de calidad.

11.52 A diferencia del sesgo por sustitución, que puede estimarse comparando fórmulas alternativas, el sesgo por cambio de calidad debe ser analizado producto por producto. Los productos y sus componentes asociados en el índice experimentan tasas muy variadas de cambio de calidad a lo largo del tiempo. Asimismo, también varían los métodos utilizados para realizar los ajustes por calidad. Mientras que el método de encadenamiento puede ser el más utilizado, algunos componentes importantes del índice pueden emplear los métodos de costo de producción, de ajuste hedónico u otros métodos descritos en los capítulos 7 y 21.

11.53 Es un punto crucial comprender que la dirección del cambio de calidad global no determina la dirección de ningún sesgo por cambio de calidad. Algunas personas, no expertas en el tema, suponen que el ajuste por calidad que realiza el IPC es escaso o nulo y que, por lo tanto, el índice debe sobreestimar el cambio de precio en vista de las muchas mejoras demostrables en la calidad de los bienes y servicios a lo largo del tiempo. En realidad, para cualquier índice componente, la cuestión es si el método directo o indirecto elegido para el ajuste por calidad sobreestima o subestima la calidad relativa de los artículos de reemplazo en la muestra del IPC. El sesgo resultante puede ser tanto positivo como negativo.

11.54 La evidencia empírica del sesgo por cambio de calidad se basó, por lo general, en la extrapolación de estudios individuales de productos particulares. Estos estudios individuales podían contener, por ejemplo, comparaciones de índices de regresión hedónica con las series correspondientes del IPC o estimaciones del valor de la mejora de algún producto no tomada en cuenta en la elaboración del IPC. Si bien la mayoría de estos estudios sugirió sesgos con tendencia al alza y no a la baja, algunos observadores que señalan la existencia comprobada de deterioros en la calidad no sometidos a un análisis sistemático critican que se haya confiado en una evidencia incompleta.

11.55 Especialmente en el caso de los servicios, las tendencias globales de calidad también pueden ser una cuestión de valuación subjetiva. La nueva tecnología permitió mejoras inequívocas en la calidad de muchos bienes de consumo duraderos y otros bienes. Por el contrario, en los sectores de servicios como el correo, el transporte público y el cuidado de la salud, puede ser difícil evaluar los cambios de calidad. El traslado aéreo, por ejemplo, se ha vuelto más seguro y más rápido en las últimas décadas, pero, posiblemente, también menos confortable y menos confiable, y la ausencia de variación cruzada entre estas características dificulta la utilización del ajuste por calidad hedónico.

11.56 El sesgo por producto nuevo, tal como el sesgo del agregado elemental, puede dividirse conceptualmente en dos componentes. El primero corresponde a la imposibilidad de introducir productos nuevos en el IPC con la rapidez necesaria. Esto puede derivar en un sesgo al alza si estos productos nuevos experimentan más tarde importantes reducciones en sus precios que no se reflejan en el índice. El segundo componente es el aumento de bienestar que experimentan los consumidores cuando aparece un producto nuevo. Sin embargo, cuando no se acepta el índice del costo de vida como el objetivo de medición del IPC puede que este segundo componente no sea considerado como sesgo.

11.57 Tal como se explica en el capítulo 8, los “bienes nuevos” pueden ser productos que reemplazan artículos que los precedieron—como discos compactos que reemplazan a los de vinilo y los cassettes—, variedades de productos que amplían el rango de elección del consumidor—como cervezas importadas y restaurantes étnicos—o productos que representan categorías totalmente nuevas de consumo—como los hornos de microondas y los teléfonos móviles.

11.58 Así como ocurre con el sesgo por cambio de calidad, algunas veces, el sesgo por producto nuevo se estima principalmente mediante la generalización a partir de evidencia de productos individuales. Un enfoque frecuente para abordarlo es el de medir el cambio de precio de un producto o categoría durante un período anterior a su ingreso en la muestra del IPC. Los estudios realizados por Hausman (1997, 1999) de los cereales para el desayuno y los teléfonos móviles proporcionaron medidas cuantitativas de la mejora del excedente del consumidor generada por nuevos productos, pero este complejo enfoque econométrico no se aplica de manera extendida. Algunas estimaciones de la Comisión Boskin del sesgo por producto nuevo, especialmente en el caso de los alimentos, se basaron necesariamente en conjeturas.

11.59 Además, al igual que el sesgo por cambio de calidad, el sesgo por producto nuevo podría ser negativo si el rango de productos se contrae, si algunos bienes de consumo de valor alto desaparecen del mercado o si el índice no captura las etapas de aumento rápido de los precios de los artículos. De todos modos, la mayoría de los observadores parece coincidir en que la dirección del sesgo es al alza y en que lo que debe determinarse es su magnitud.

Sesgo por punto de venta nuevo

11.60 Conceptualmente, el sesgo por punto de venta nuevo es idéntico al sesgo por producto nuevo. Surge cuando no se reflejan o bien los cambios de precios en los puntos de venta nuevos aún no muestreados o bien el aumento de bienestar del que gozan los consumidores cuando aparecen puntos de venta nuevos. Son dos las razones de su existencia como una categoría de sesgo aparte. La primera razón es histórica: Reinsdorf (1993) identificó el sesgo por punto de venta nuevo como una explicación potencialmente importante de las variaciones anómalas en el IPC de Estados Unidos. El segundo motivo es que los métodos utilizados en el caso de muestrear y comparar puntos de venta difieren de los utilizados para los productos, y los problemas para controlar el sesgo por punto de venta nuevo son un tanto distintos.

11.61 Si no se mantiene una muestra actualizada de los puntos de venta vigentes, se puede generar un sesgo cuando los puntos de venta nuevos tienen una política de precios y de servicios distintiva. Reinsdorf (1993), por ejemplo, se concentró en el crecimiento de las tiendas de descuento. Cabe señalar, sin embargo, que el problema también puede ser de naturaleza geográfica; es importante emplear marcos muestrales de puntos de venta que reflejen tanto las localizaciones de los comercios nuevos como los puntos de venta tradicionales.

11.62 Una manera de que los productos nuevos ingresen en la muestra del IPC es mediante el reemplazo forzado, cuando algunos productos salientes o menos exitosos desaparecen de los puntos de venta. La desaparición de puntos de venta es menos frecuente, y los procedimientos de la agencia pueden no ofrecer reemplazos automáticos. Más aún, cuando un punto de venta nuevo ingresa en la muestra, no hay procedimientos estándar para comparar sus datos con aquellos de los puntos de venta viejos. Por lo tanto, el índice no incorporará los efectos de, por ejemplo, precios más bajos o inferior calidad del servicio del punto de venta nuevo.

11.63Reinsdorf (1993) estimó el grado del sesgo por punto de venta nuevo comparando los precios promedio de los puntos de venta que ingresan y que salen de las muestras del IPC de Estados Unidos. Sin embargo, es poco o nulo el trabajo empírico realizado sobre la medición de la calidad del punto de venta o su valuación por parte del consumidor. En consecuencia, hay poca evidencia con la que evaluar la precisión de las estimaciones del sesgo por punto de venta nuevo.

Resumen de los estimadores del sesgo

11.64 El informe de 1996 de la Comisión Boskin ofreció un rango de estimación para el sesgo al alza total del IPC de Estados Unidos de 0,8 a 1,6 puntos porcentuales, y la estimación puntual era de 1,1 punto porcentual. Este total refleja la simple sumatoria de las estimaciones del sesgo de los componentes. Sin embargo, tal como informó Estados Unidos en la Oficina de Contabilidad General (2000), los cambios en los métodos del IPC luego de 1996 llevaron a los miembros de la Boskin Commission a reducir sus estimaciones del sesgo total. A falta de evidencia de lo contrario, en la mayoría de estos estudios se supone que los sesgos son aditivos. Shapiro y Wilcox (1997) proporcionan las distribuciones de probabilidad y las correlaciones de los estimadores del sesgo de los componentes, que dan como resultado un intervalo global de confianza para el sesgo total. La mayoría de los estudios detallados acerca del sesgo también concluyen que el sesgo del IPC tiene una tendencia al alza, si bien esta conclusión recibió muchas críticas.

11.65 Es evidente que las agencias de estadística no pueden computar ni publicar regularmente las estimaciones del sesgo del IPC. Muchos de los obstáculos que impiden la eliminación del sesgo dificultan también su estimación. Entre ellos se cuentan la falta de datos completos acerca de las preferencias de los consumidores y el comportamiento del gasto a nivel de producto y la incapacidad de observar y valuar todas las diferencias de calidad entre los artículos existentes en el mercado. Sin esta información, es imposible calcular un verdadero índice del costo de vida, como también es imposible medir la divergencia entre su tasa de crecimiento y la del IPC.

11.66 Las agencias de estadística son renuentes a ofrecer sus propias estimaciones del sesgo del IPC. En algunos casos, han aceptado la existencia del sesgo por sustitución, reconociendo que la utilización de una fórmula de Laspeyres implica que el IPC suele exagerar el cambio de precios en relación con el índice del costo de vida. No obstante, las agencias de estadística se muestran reacias a sacar conclusiones, aunque más no fuera cualitativas, a partir de una evidencia incompleta y especulativa respecto del sesgo por cambio de calidad, por productos nuevos y por punto de venta nuevo.

Conclusiones

11.67 Debe publicarse una descripción detallada y actualizada de los métodos y las fuentes de datos utilizados a efectos de asegurar la confianza del público en el IPC. Este documento debe incluir, entre otras cosas, los objetivos y el alcance del índice, los detalles de las ponderaciones y, por último, un análisis de la precisión del índice. La descripción de las fuentes y de la magnitud de los errores de muestreo y de los errores ajenos al muestreo (cobertura, tasas de ausencia de respuesta, etc.) del IPC ofrece a los usuarios una información valiosa acerca de las limitaciones que podrían corresponder a sus usos del índice. Un ejemplo de manual de referencia de los métodos del IPC es el que publicó la Oficina de Estadísticas Laborales de Estados Unidos (1997), el cual dedica una sección a las variedades y fuentes de posibles errores del índice.

    Other Resources Citing This Publication