Chapter

5. Muestreo

Author(s):
International Monetary Fund
Published Date:
November 2006
Share
  • ShareShare
Show Summary Details

Introducción

5.1 El procedimiento que utilizan las oficinas nacionales de estadística para recopilar los precios a fin de elaborar un índice de precios al consumidor (IPC) es la encuesta por muestreo. De hecho, en muchos países se trata de una combinación de muchas encuestas distintas, cada una de las cuales abarca diferentes subconjuntos de los productos comprendidos en el índice. Comenzaremos por esbozar algunos de los conceptos generales de muestreo por encuesta que es necesario tener en cuenta al analizar una encuesta particular como la recopilación de precios para el IPC.

5.2 Existe una cantidad objetivo, por ejemplo el IPC, que se define con respecto a:

– Un universo que consiste en una población finita de unidades (por ejemplo, productos).

– Una o más variables que se definen para cada unidad del universo (por ejemplo, precio y cantidad).

– Una fórmula que combina los valores de una o más de estas variables para todas las unidades del universo en un único valor llamado parámetro (por ejemplo, el índice de Laspeyres).

Nuestro interés radica en el valor de este parámetro.

5.3 Por lo general, el universo tiene tres dimensiones: la dimensión del producto, que consiste en todos los productos comprados y todas las variedades de productos; la dimensión geográfica y de punto de venta, que consiste en todos los lugares y canales de venta del producto y, por último, la dimensión temporal, que consiste en todos los subperíodos comprendidos en el período para el cual se elabora el índice. Se le prestará menos atención a la dimensión tiempo, porque la variación de precios suele ser menor a lo largo de un lapso breve y porque se puede dar cuenta de los aspectos temporales en las especificaciones del producto y del punto de venta.

5.4 En este capítulo, se considera que las dos primeras dimensiones permanecen constantes durante los períodos de tiempo comprendidos en el índice. Es decir, se supone que los mismos productos y puntos de venta se encuentran en el universo en ambos períodos, o bien que los viejos productos y puntos de venta se reemplazan por otros nuevos uno a uno y sin inconvenientes. Las complicaciones que surgen de los cambios dinámicos en el universo se examinan en el capítulo 8, donde se analizan la reposición, la repetición del muestreo y los ajustes por calidad.

5.5 ¿Por qué solo se toma una muestra de unidades? Además de la virtual imposibilidad física y el costo prohibitivo de abarcar todos los productos en todos los puntos de venta, es probable que los datos sean de una mejor calidad si las unidades con las que se trabaja son menos, pues ello permite la participación de agentes más especializados y mejor capacitados y, además, la tarea insume menos tiempo.

5.6 En el muestreo probabilístico, las unidades se seleccionan de forma tal que cada unidad (punto de venta o producto) tenga una probabilidad de selección conocida que sea positiva. Por ejemplo, los puntos de venta se seleccionan aleatoriamente de un registro de empresas en el que cada punto de venta tiene la misma probabilidad de ser seleccionado. No obstante, en la elaboración del IPC tradicionalmente se han utilizado en mayor medida métodos de muestreo no probabilístico para elegir puntos de venta o productos. El método de artículos representativos es especialmente popular para seleccionar artículos. Otros métodos que se utilizan son el muestreo por valores umbral y el muestreo por cuotas (véase a continuación). En algunos casos también pueden combinarse ambos métodos; por ejemplo, los puntos de venta se seleccionan mediante técnicas de muestreo probabilístico mientras que los productos se seleccionan utilizando el método de artículos representativos.

5.7 Una vez que se decide tomar una muestra, hay dos cuestiones que deben considerarse: cómo seleccionarla y cómo utilizar los valores muestrales para estimar el parámetro. La primera refleja la elección de diseño muestral; la segunda tiene que ver con el procedimiento de estimación. En primer lugar consideraremos el diseño muestral.

Técnicas de muestreo probabilístico

5.8 En esta sección se presentan en forma sucinta algunos conceptos y técnicas generales del muestreo por encuesta que tienen aplicaciones importantes para los índices de precios. Nos ocuparemos de los conceptos de muestreo por encuesta que revisten mayor interés para las aplicaciones de los índices de precios. Existen muchos libros de texto que abordan este tema en forma exhaustiva, por ejemplo, Särndal, Swensson y Wretman (1992) o Cochran (1977).

5.9 La teoría del muestreo por encuesta considera que el universo está compuesto por un número finito (N) de unidades de observación designadas como j=1,…, N. Por lo tanto, el muestreo implica seleccionar n unidades de N asignando a cada unidad una probabilidad de inclusión, πj. Para los índices de precios existen dos diseños muestrales de especial interés.

5.10 En el muestreo aleatorio simple y en el muestreo sistemático, cada unidad se muestrea con igual probabilidad y tenemos πj= n/N. En el muestreo aleatorio simple, todas las unidades se seleccionan mediante un mecanismo aleatorio. En el muestreo sistemático, la primera unidad se selecciona aleatoriamente, y las demás se seleccionan de forma tal que guarden igual distancia entre sí dentro del marco muestral. Estas técnicas suelen recomendarse en aquellos casos en que las unidades son relativamente homogéneas.

5.11 En el muestreo con probabilidad proporcional al tamaño (ppt), la probabilidad de inclusión es proporcional a una variable auxiliar xj y tenemos πj=nxj/Σj=1Nxj. Las unidades para las que, inicialmente, esta cantidad es mayor que uno se seleccionan con certeza y, a partir de allí, las probabilidades de inclusión se calculan para el resto del universo.

5.12 El universo puede dividirse en estratos, designados como h = 1, …, H. En cada estrato, entonces, hay Nh unidades y tenemos Σh=1HNh=N. Por lo general, el propósito de la estratificación es agrupar unidades que o bien son homogéneas en algún sentido o bien satisfacen alguna conveniencia administrativa como, por ejemplo, hallarse físicamente próximas. Cada estrato es un universo en miniatura y el muestreo es independiente en cada uno de ellos. En el IPC, lo habitual es utilizar los agregados elementales como estratos. En el resto de este capítulo examinaremos el muestreo en un único estrato, correspondiente a un agregado elemental, y abandonaremos el subíndice h.

Implementación del muestreo probabilístico en los índices de precios al consumidor

5.13 El marco muestral es una lista de todas (o casi todas) las N unidades del universo. El marco puede tener un exceso de cobertura hasta el punto de incluir unidades que no pertenecen al universo o duplicados de unidades. También puede tener una deficiencia de cobertura en la medida en que algunas unidades del universo no estén incluidas en el marco.

5.14 Los marcos muestrales para la dimensión del punto de venta pueden ser:

  • Registros de empresas. Estos deben incluir la ubicación de las empresas de comercio al por menor, con sus direcciones, y actualizarse en forma periódica. Si en el registro se incluye alguna medida de tamaño (monto de facturación o cantidad de empleados), resultará útil para el muestreo con ppt, quedando así incluida en el parámetro poblacional.

  • Directorios telefónicos (“páginas amarillas”). Estos no suelen incluir medidas de tamaño, por lo que es necesario un muestreo simple aleatorio o un muestreo sistemático. En ocasiones puede recurrirse al conocimiento informal acerca de la importancia de los distintos puntos de venta para estratificar el universo en dos o más categorías y luego extraer una muestra relativamente mayor de los estratos más importantes.

  • Los registros municipales, de organizaciones de empresas, etc., pueden utilizarse para los mercados locales y otros similares, que tienen especial importancia en los países en desarrollo.

5.15 Los marcos muestrales para la dimensión del producto pueden ser:

  • Listas de productos que entregan los principales mayoristas y que incluyen los valores de venta de las variedades en un período anterior. El valor de venta es una medida de tamaño evidente para las ponderaciones y para el muestreo con ppt.

  • Listas de productos específicas de cada punto de venta. Los propios agentes encargados de recopilar los precios pueden elaborar estas listas tomando nota de los productos en exhibición en las góndolas. Así, el espacio ocupado por cada producto en las góndolas sirve como medida de tamaño para el muestreo con ppt.

Técnicas de muestreo basadas en ppt

5.16 Existen diversas técnicas para diseñar muestras con ppt. Se clasifican en dos categorías principales, conforme el tamaño de la muestra sea fijo o aleatorio. Para el IPC, sin duda, lo aconsejable es un tamaño de muestra fijo predeterminado, ya que el tamaño de la muestra en cada estrato suele ser reducido y el tamaño aleatorio entrañaría el riesgo de una muestra vacía. Por ello, a continuación presentamos dos técnicas que proporcionan muestras de tamaño fijo con ppt.

5.17Muestreo sistemático con ppt. La mejor manera de ilustrar este procedimiento es por medio de un ejemplo: en el cuadro 5.1 se observa cómo de 10 puntos de venta puede extraerse una muestra de 3. En este caso, la medida de tamaño está dada por la cantidad de empleados. En la lista incluimos los tamaños acumulados y los intervalos de inclusión. Tomamos el número total de nuestra medida—90 en este caso—y lo dividimos por el tamaño de la muestra, es decir, 3. Esto nos da un intervalo de muestreo de 30. A continuación elegimos un número aleatorio entre 1 y 30 (las planillas de cálculo de Excel, por ejemplo, ofrecen funciones para obtener números aleatorios). Supongamos que obtenemos 25: la muestra comprenderá entonces los puntos de venta cuyos intervalos de inclusión cubran los números 25, 25 + 30 y 25 + 2 × 30.

Cuadro 5.1Muestreo sistemático de 3 puntos de venta entre 10, con ppt
Punto

de

venta
Cantidad

de empleados

dos = x
x acumuladoIntervalo

de

inclusión
Incluido

cuando el

punto de

partida

es 25
113131–13
221514–15
352016–20
492921–29X
513030
6255531–55X
7106556–65
867166–71
9118272–82
1089083–90X

5.18 El muestreo sistemático es fácil de llevar a cabo. Sin embargo, si el marco tiene un exceso de cobertura, el tamaño de la muestra no será el predeterminado. Supongamos que, en la primera visita a los puntos de venta, descubrimos que el punto de venta 6 no vende los productos incluidos en la muestra. En ese caso, nos quedaría una muestra de solo dos puntos de venta. O bien nos conformamos con ellos, o bien debemos buscar alguna reposición para el punto de venta no válido, lo que no está determinado en el procedimiento básico de muestreo. Más aún, la muestra seleccionada depende del orden en el que se enumeran los puntos de venta o los productos. Esto puede ser importante, en especial si el orden de la lista es correlativo con la medida de tamaño.

5.19Muestreo por orden con ppt. Este método de diseñar muestras con ppt es relativamente nuevo. Para su discusión teórica puede consultarse Rosén (1997a; 1997b). En este caso, se asocian con cada unidad de muestreo un número aleatorio uniforme Ui entre 0 y 1 y una variable zi =nxiixi, donde xi es una variable de tamaño, y se construye una variable de orden como función de estas dos variables. Luego las unidades del universo se disponen en orden ascendente y las n unidades con los valores más pequeños de la variable de orden se incluyen en la muestra. Dos ejemplos importantes de estas variables de orden Qi son:

  • Para muestreo secuencial con ppt: Qi = Ui / zi

  • Para muestreo con ppt de Pareto: Qi=Ui (1 − zi)/zi (1 – Ui).

5.20 Para el mismo universo, en el cuadro 5.2 puede apreciarse cómo funciona esto con el muestreo con ppt de Pareto. Ahora tenemos el universo dispuesto en orden ascendente respecto de la variable de orden. Nuestra primera muestra comprende los puntos de venta 6, 1 y 8. Pero supongamos que descubrimos que es inapropiado incluir el punto de venta 1. Recurrimos entonces a la cuarta unidad de la lista—el punto de venta 9—y la incluimos en lugar de aquel. Es decir, el muestreo por orden con ppt es fácil de combinar con una muestra de tamaño fijo y es más flexible que el muestreo sistemático.

Cuadro 5.2Muestra Pareto de 3 puntos de venta entre 10, con ppt
Punto de ventaxiUiQiMuestra
6250,7555090,036943X
1130,1980820,207721(X)
860,9151310,310666X
9110,2771310,346024X
1080,8341380,380468
7100,7090460,412599
490,463730,580264
350,5001621,25
510,0679411,836435
220,2975242,926051

5.21 Sin embargo, ninguno de los dos procedimientos de muestreo por orden es exactamente de ppt, porque las probabilidades de inclusión obtenidas varían ligeramente respecto de las deseadas. De todos modos, Rosén (1997b) demuestra que, a los fines de estimar medias y varianzas, estos son procedimientos de muestreo con probabilidades aproximadamente proporcionales al tamaño. En el caso del índice de precios, esto aun se verifica cuando hay sustitución en la muestra a causa de un exceso de cobertura. El muestreo con ppt de Pareto es marginalmente mejor que el muestreo secuencial con ppt y, por lo tanto, debe preferirse.

5.22 El muestreo por orden con ppt se utiliza actualmente en muchas áreas del IPC de Suecia, por ejemplo para tomar muestras de:

  • Puntos de venta del registro de empresas (la medida de tamaño es la cantidad de empleados + 1).

  • Productos a partir de bases de datos que proveen las grandes cadenas de comercios minoristas (la medida de tamaño son las ventas históricas).

  • Modelos de automóviles del registro automotor central (la medida de tamaño es la cantidad de automóviles registrados en el período de referencia).

5.23 La Oficina de Estadística de Suecia (2000) proporciona más detalles acerca de la aplicación de estos procedimientos. Rosén (1997b) demuestra que el muestreo con ppt de Pareto y el muestreo sistemático con ppt son los dos métodos óptimos de muestreo con ppt. El muestreo con ppt de Pareto permite una evaluación objetiva de la precisión de la estimación. Respecto de la precisión final, sin embargo, este tipo de muestreo es el mejor en algunas situaciones, mientras que en otras conviene utilizar el muestreo sistemático con ppt. Por lo tanto, la elección de uno u otro es una cuestión de criterio y practicidad en cada situación particular de muestreo. Debido a la gran flexibilidad del muestreo por orden con ppt con respecto a las imperfecciones en el marco muestral, un aspecto importante para las aplicaciones relacionadas con el IPC, nos lleva a elegir este procedimiento como nuestra primera recomendación entre todos los procedimientos de muestreo con ppt.

Métodos de muestreo utilizados por la Oficina de Estadísticas Laborales de Estados Unidos

5.24 La Oficina de Estadísticas Laborales de Estados Unidos utiliza métodos probabilísticos en todas las etapas de selección de la muestra. En la última se seleccionan artículos individuales de los puntos de venta en un proceso diseñado para aproximarse al muestreo con ppt con respecto a las ventas de cada uno de esos artículos. Para ello, los agentes de campo de la Oficina de Estadísticas Laborales pueden utilizar cualquiera de los siguientes cuatro métodos para determinar las proporciones de las ventas (Oficina de Estadísticas Laborales [1997]):

  • Obtener las proporciones directamente de un encuestado.

  • Clasificar los subgrupos/artículos por orden de importancia de ventas según indique el encuestado y luego obtener las proporciones directamente o utilizar proporciones preasignadas.

  • Utilizar el espacio en góndola para estimar las proporciones en los casos en que corresponda.

  • Utilizar probabilidades iguales.

5.25 La ventaja de este procedimiento, según la Oficina de Estadísticas Laborales, es que asegura un muestreo probabilístico objetivo y eficiente, cuando no sería posible aplicar ningún otro. Permite definiciones amplias de los estratos de artículos, por lo que no es necesario establecer los precios de la misma especificación en todos los casos. La gran diversidad de artículos específicos disminuye en gran medida el componente de varianza en cada artículo, atenúa la correlación de los movimientos de precios entre áreas y permite reducir el tamaño de muestra necesario para una determinada varianza.

5.26 Este enfoque entraña un riesgo potencial: si la medida del valor de las ventas se toma para un período de tiempo muy breve, puede coincidir con una campaña especial que reduzca los precios en forma temporaria. Por ello, podría ocurrir que a un artículo con un precio temporariamente reducido se le asigne una probabilidad de inclusión alta. Dado que este precio tenderá a aumentar más que el promedio, la consecuencia puede ser un sesgo de sobrestimación. Por lo tanto, es esencial que el muestreo del artículo se lleve a cabo en un momento anterior a la primera recopilación de precios, o bien que se utilicen valores de venta de un período anterior. Okamoto (1999) insiste en este punto para el caso de Japón, donde el rebote de precios parece ser un fenómeno muy corriente.

Técnicas de muestreo no probabilístico

5.27 La teoría moderna de muestreo estadístico se centra en el muestreo probabilístico, cuya utilización también se recomienda y se considera práctica estándar para todo tipo de encuestas estadísticas, entre ellas las encuestas económicas. Pero, en la mayoría de los países, la práctica de los índices de precios continúa dominada por las técnicas no probabilísticas. Por ello, puede ser provechoso especular acerca de las razones racionales e irracionales de tal circunstancia. En la sección siguiente comentaremos, una por una, algunas de estas posibles razones. Posteriormente consideraremos algunas técnicas no probabilísticas.

Razones para utilizar el muestreo no probabilístico

5.28No se dispone de un marco muestral. Este suele ser el caso para la dimensión del producto pero no para la dimensión del punto de venta, para la cual los registros de empresas y los directorios telefónicos sí proporcionan marcos, al menos en algunos países, sobre todo en Europa occidental, América del Norte y Oceanía. También existe la posibilidad de construir marcos muestrales a medida en un número limitado de ciudades o localidades, que en una primera etapa se toman en la muestra como un conglomerado. Para los productos, cabe señalar que la variedad que se exhibe en un punto de venta proporciona un marco muestral natural, una vez que el punto de venta es considerado en la muestra como una especie de conglomerado, como en el procedimiento de muestreo de la Oficina de Estadísticas Laborales ya presentado. Por lo tanto, la falta de un marco muestral no es excusa suficiente para no aplicar el muestreo probabilístico.

5.29El sesgo causado por el muestreo no probabilístico no es significativo. Existe cierta evidencia empírica a favor de esta afirmación para el caso de índices de alto nivel de agregación. Dalén (1998b) y De Haan, Opperdoes y Schut (1999) simularon la toma de muestras por valores umbral de productos dentro de los grupos de artículos. Dalén observó alrededor de 100 grupos de artículos vendidos en supermercados y notó importantes sesgos en los subíndices de muchos grupos de artículos, que, de todos modos, terminaban prácticamente anulándose entre sí tras la agregación. De Haan, Opperdoes y Schut utilizaron datos escaneados y observaron tres categorías (café, pañales y papel higiénico) y, si bien el sesgo era importante en cada una de ellas, el error cuadrático medio (definido como la varianza más el sesgo al cuadrado) resultó, por lo general, menor que el obtenido mediante muestreo con ppt. Se apreciaron sesgos en ambas direcciones y por ello podría decirse que respaldaban los resultados de Dalén. Los grandes sesgos de los grupos de artículos, sin embargo, pueden ser motivo de preocupación. Tanto Dalén como De Haan, Opperdoes y Schut informan de sesgos de varios puntos en los índices encontrados en grupos conformados por un único artículo.

5.30Es necesario hacer un seguimiento de las muestras durante un tiempo. Si no tenemos suerte con nuestra muestra probabilística, podemos acabar teniendo un producto que desaparece inmediatamente después de incluirlo en la muestra. Entonces tendremos un problema de reemplazo, con sus propios riesgos de crear sesgo. A su vez, puede ocurrir que algunos productos de ciclos de vida cortos tengan una variación de precios distinta de los productos con ciclos más largos y constituyan una parte significativa del mercado, por lo que su exclusión generaría un sesgo.

5.31Una muestra probabilística con respecto al período base no es un muestra probabilística apropiada con respecto al período corriente. Este argumento anticipa parte del análisis del capítulo 8. Es cierto que la necesidad de posteriores reemplazos no probabilísticos destruye en gran medida la protección contra sesgos que ofrece, en una primera instancia, el muestreo probabilístico.

5.32La recopilación de precios debe hacerse donde hay agentes que puedan recopilar los precios. Este argumento se aplica solamente al muestreo geográfico. Por supuesto, resulta más económico recopilar precios cerca de los hogares de los agentes encargados de recopilar los precios, y sería difícil y costoso emplear y despedir agentes cada vez que se toma una nueva muestra. Pero este problema puede morigerarse si se cuenta con una buena cobertura del país en términos de agentes encargados de recopilar los precios. Una manera de lograrlo es tener una organización de encuestas profesional, distribuida geográficamente, en la oficina nacional de estadística, que trabaje en numerosas encuestas a la vez. Otro modo de moderar el problema es extraer una muestra de regiones, ciudades o localidades en una primera etapa, cuyos cambios se produzcan muy lentamente.

5.33La muestra es demasiado pequeña. En algunos casos, la estratificación se hace tan fina que en el estrato final solo queda lugar para una muestra muy pequeña. En ocasiones, una selección aleatoria de 1–5 unidades da como resultado una muestra final asimétrica o bien de poca representatividad. Sin embargo, a menos que el índice para este pequeño estrato deba presentarse públicamente, el problema también es pequeño. La asimetría en muestras de nivel inferior se compensa en niveles superiores. El argumento de que la muestra es demasiado pequeña tiene mayor validez cuando se refiere a conglomerados de primera etapa (zonas geográficas) que se aplican en forma simultánea a la mayoría de los niveles de muestreo subsiguientes.

5.34Las decisiones respecto del muestreo se toman en un nivel bajo de la organización. A menos que los agentes encargados de recopilar los precios sean muy versados en estadística, puede resultarles difícil realizar un muestreo probabilístico in situ. Tal muestreo es necesario cuando la especificación del producto que proporciona la oficina central cubre más de un (precio del) producto en un punto de venta. No obstante, en Estados Unidos (Oficina de Estadísticas Laborales [1997]) los agentes de campo hacen precisamente esto. En Suecia, donde el muestreo central de productos (para necesidades diarias) llega incluso a especificar variedades bien definidas y tamaños de envases, no es necesario realizar ningún muestreo en los puntos de venta. En los países donde no se dispone de ninguna de estas dos opciones, llevar a cabo un muestreo probabilístico completo resulta más complicado.

5.35 En algunas situaciones existen, por lo tanto, razones válidas para utilizar técnicas no probabilísticas. A continuación analizaremos dos de ellas.

Muestreo por valores umbral

5.36 El muestreo por valores umbral es la práctica de elegir las n unidades mayores de muestreo con certeza y asignar a las demás una probabilidad de inclusión cero. En este contexto, el término “mayor” se refiere a una medida de tamaño altamente correlacionada con la variable objetivo. La palabra “umbral” se refiere al valor límite que constituye la frontera entre las unidades incluidas y las excluidas.

5.37 En general, la teoría del muestreo señala que el muestreo por valores umbral no produce estimadores insesgados (en los párrafos 5.51–5.60 se hallará un análisis del sesgo y la varianza), pues las unidades pequeñas pueden mostrar variaciones de precios que difieren sistemáticamente de las de las unidades mayores. La estratificación por tamaño o el muestreo con ppt también tienen la ventaja de incluir las unidades mayores con certeza y aun así asignar a todas las unidades una probabilidad de inclusión positiva.

5.38 Si el criterio de error no es el mínimo sesgo sino el mínimo error cuadrático medio (= varianza + sesgo al cuadrado), entonces, como todo estimador obtenido mediante muestreo por valores umbral tiene varianza cero, el muestreo por valores umbral puede ser una buena opción en los casos en que la reducción de la varianza compensa con creces la introducción de un sesgo pequeño. De Haan, Opperdoes y Schut (1999) demuestran que este bien puede ser el caso de ciertos grupos de artículos.

5.39 Con frecuencia, en un diseño muestral de etapas múltiples, solo hay lugar para una cantidad muy pequeña de unidades en cada etapa. Por ello, las dificultades de medición que suelen asociarse a las unidades pequeñas pueden ser un motivo, además de las grandes varianzas, para limitar la recopilación de precios a las unidades mayores.

5.40 Cabe señalar que también puede aplicarse un diseño híbrido en el que hay un estrato de certeza, algunos estratos de muestreo probabilístico y un umbral mínimo por debajo del cual no se extrae ninguna muestra. En la práctica, semejante diseño suele utilizarse en los casos en que en el universo la “sección por debajo del umbral” se considera no significativa y, tal vez, difícil de medir.

5.41 Una práctica particular del IPC afín al muestreo por valores umbral es que el agente recopilador de precios seleccione el producto más vendido en un punto de venta, dentro de una especificación definida por la oficina central. En ese caso, el tamaño de la muestra es uno (en cada punto de venta) y el umbral deja de ser exacto y queda más a criterio del agente, ya que rara vez se dispone de medidas de tamaño exactas. En todos los casos de muestreo según tamaño en un punto de venta, resulta esencial adoptar una perspectiva a largo plazo del tamaño, para no tomar como medida ventas temporariamente considerables que tengan lugar durante un breve período de precios más bajos. El precio de tales productos tenderá a aumentar en el futuro inmediato mucho más que el del grupo de productos que estos representan, lo cual generará un grave sesgo de sobrestimación.

Muestreo por cuotas

5.42 Numerosos grupos de productos, aun los pequeños, son heterogéneos por naturaleza y el precio varía de acuerdo con una gran cantidad de subgrupos y características. Dentro de un mismo grupo de productos puede perfectamente haber diferentes variaciones de precios, con lo cual un procedimiento que represente al grupo mediante un único producto o bien unos pocos definidos de manera estricta conlleva un riesgo innecesariamente grande de introducir un sesgo.

5.43 La definición de muestreo por cuotas es que la muestra elegida guarde las mismas proporciones de unidades que el universo en cuanto a ciertas características conocidas, a saber, subgrupos de productos, tipos de punto de venta y ubicación. La selección de las unidades de la muestra en sí se realiza luego mediante procedimientos llevados a cabo con criterio de manera tal que la composición de la muestra final cumpla con el criterio de la cuota.

5.44 El siguiente ejemplo ilustra el concepto de muestreo por cuotas. Supongamos que se quiere una muestra de 20 paquetes turísticos. Se sabe que, en el universo, el 60% tiene como destino España, el 30% Grecia y el 10% Portugal. En cuanto a los grupos turísticos, el 70% está compuesto por 2 adultos, el 20% por 2 adultos + 1 niño, y el 10% por 2 adultos + 2 niños. De la muestra, el 20% se aloja en hoteles de 2 estrellas, el 40% en hoteles de 3 estrellas, el 30% en hoteles de 4 estrellas y el 10% en hoteles de 5 estrellas. Con esta información, es posible diseñar la muestra en forma dirigida para que todas estas proporciones se mantengan en la muestra, que entonces pasa a contener las ponderaciones del universo en sí misma. Cabe señalar que estas proporciones reflejan volúmenes y no valores. Además, pueden requerir ajustes según la fórmula de agregado elemental que se utilice.

5.45 El muestreo por cuotas requiere que todo el procedimiento de muestreo sea administrado en forma centralizada, lo cual puede limitar su utilidad en algunas situaciones. Es más difícil, pero no imposible, administrar un sistema de muestreo por cuotas en el cual se recopilen los precios localmente. En ese caso sería necesario dividir los agentes encargados de recopilar los precios en subgrupos con instrucciones un tanto diferentes en cuanto a la selección de productos. Una limitación del muestreo por cuotas, al igual que otros tipos de muestreos no probabilísticos, es que no se puede determinar el error estándar de la estimación.

Método de artículos representativos

5.46 Este constituye el método tradicional del IPC. La oficina central confecciona una lista de tipos de productos con especificaciones por tipo de producto, las cuales pueden ser restrictivas, al prescribir rigurosamente los productos que está permitido seleccionar, o bien pueden ser laxas, y dar libertad a los agentes encargados de recopilar los precios para que elijan las variedades más populares a nivel local.

5.47 El método de especificaciones restrictivas es, en cierto sentido, diametralmente opuesto al método de muestreo por cuotas ya analizado. La representatividad se verá disminuida si los grupos de productos no se definen de manera de incluir una cantidad muy grande de tipos de producto, pues ningún producto que quede fuera de la especificación podrá incluirse en el índice. Otra desventaja de este método es que puede tener como consecuencia una mayor cantidad de productos no disponibles en los puntos de venta, con la consiguiente reducción de la muestra efectiva. Su ventaja principal es la simplicidad. Es fácil mantener un control centralizado sobre la muestra. Si se requieren ajustes por calidad, esto puede decidirse en la oficina central, lo cual puede o no ser una ventaja.

5.48 El método con especificaciones laxas brinda a los agentes encargados de recopilar los precios la oportunidad de ajustar la muestra según las condiciones locales, lo que normalmente redundará en una mayor representatividad de la muestra en su conjunto. Sin embargo, si el método se combina con el criterio de “lo más vendido”, tenderá sistemáticamente a subrepresentar las marcas menos conocidas y productos que quizá sean adquiridos por minorías importantes.

Muestreo en el tiempo

5.49 Por lo general, el IPC se refiere a un mes durante el cual los precios no son constantes. Surge, entonces, la cuestión del muestreo en el tiempo. Este problema suele pasarse por alto fijando, por ejemplo, el día 15 del mes o los días inmediatamente anteriores o posteriores como fecha objetivo para la medición de precios. En ciertos rubros, como los cines, teatros y restaurantes, existe un efecto sobre los precios relacionado con el día de la semana elegido. Pero este efecto se puede contemplar en la especificación de producto en vez de en el muestreo; por ejemplo, se podría especificar un precio vespertino de un día de la semana.

5.50 Hasta donde se sabe, en ningún lugar se practica el muestreo aleatorio en el tiempo. En algunos países el método que se emplea consiste en distribuir la recopilación de precios a lo largo de varias semanas siguiendo algún patrón, por ejemplo, distintas semanas para distintas regiones o para distintos grupos de productos. En algunos casos, también se utiliza una frecuencia de recopilación de precios mayor a la mensual, por ejemplo, para los productos frescos. Aún no hay un conocimiento sistemático sobre las ventajas y desventajas de dichas prácticas. En el capítulo 6 se analizan los aspectos prácticos de la distribución de la recopilación de precios en el tiempo.

Elección del método de muestreo

5.51 En esta sección analizaremos la manera en que la elección del método de muestreo puede depender de ciertos factores específicos de un país. Pero antes consideraremos la cuestión del tamaño de la muestra.

5.52Tamaño de la muestra. La precisión final de una estimación muestral depende solo del tamaño y de la distribución de la muestra y no del tamaño del país, por lo cual no tiene por qué haber una muestra más grande en un país de mayor tamaño. Se requerirán muestras más grandes si las diferencias regionales entre las variaciones de precios son de interés y si se desea publicar el índice con una alta desagregación por producto. Ciertamente, el presupuesto asignado a la elaboración del IPC puede ser mayor en países más grandes, lo cual permitirá que las muestras sean mayores.

5.53 Los estudios sobre sesgo (no el sesgo muestral descrito en los párrafos 5.61–5.64) y sobre errores de muestreo señalan que el sesgo en el IPC suele ser un problema mucho mayor que el error de muestreo. Esto lleva a concluir que en muchos casos las muestras más pequeñas cuyas reposiciones, repeticiones de muestreo y ajustes de precios por calidad son objeto de un mejor seguimiento podrían originar, con el mismo presupuesto, un índice de mejor calidad. En algunos países, los recursos para la recopilación local de precios son fijos y por lo tanto es difícil reasignarlos a las tareas de análisis central. Aun así, es aconsejable intentar utilizar los recursos locales para lograr una recopilación de precios de mayor calidad en lugar de simplemente recopilar un mayor número de observaciones. La calidad de la recopilación de precios se analiza con mayor profundidad en el capítulo 6.

5.54 El tamaño de las muestras mensuales en los distintos países parece variar de varios miles a varios cientos de miles. A menudo, estas diferencias obedecen más a la tradición que a un análisis racional de las necesidades de precisión. Los países con muestras muy grandes deberían buscar la manera de reasignar el total de sus recursos.

5.55La distribución geográfica de los agentes encargados de recopilar los precios. El muestreo supone un gasto mayor a medida que los agentes encargados de recopilar los precios se alejan más de sus hogares. Si la organización de la recopilación de precios se concentra en unas pocas ciudades importantes, será difícil recopilar muestras en puntos de venta en otros lugares. No obstante, debe tenerse en cuenta que la inflación rural puede diferir de la urbana, de manera que si no se recopilaran precios tanto en zonas urbanas como rurales no se lograría la mejor medición posible de la inflación promedio nacional. Convendría tener por lo menos una pequeña muestra de zonas rurales a efectos de poder tener en cuenta este factor. De esta manera, aún es posible obtener la mayor parte del ahorro conseguido al asignar los puntos de venta cercanos al lugar de residencia de los recopiladores de precios.

5.56Idoneidad de los agentes encargados de recopilar los precios. Si estos son personas instruidas, puede capacitárselos para llevar a cabo esquemas de muestreo más complejos en los puntos de venta, tales como el muestreo con ppt. De lo contrario, habrá que implementar métodos más simples.

5.57Acceso a la capacidad técnica en muestreo de la oficina central. El muestreo probabilístico requiere poder acceder a la pericia metodológica de la oficina central de estadística.

5.58Grupos de productos homogéneos y heterogéneos. El método del artículo representativo es el más adecuado para los grupos de productos homogéneos. En grupos heterogéneos, es más probable que queden excluidos importantes segmentos del universo de productos que presenten distintas variaciones de precios.

5.59Acceso a marcos muestrales y su calidad. El muestreo probabilístico requiere marcos muestrales. Pero no es necesario que estén disponibles a nivel nacional. Si en la primera etapa se implementa un muestreo por conglomerado geográfico (de forma tal que el marco muestral sea tan solo un mapa), se puede construir una lista de los puntos de venta importantes en cada conglomerado utilizando los directorios telefónicos o los listados locales, como se hace en el Reino Unido. Este método también se utiliza para seleccionar zonas urbanas para el IPC de Estados Unidos (Dippo y Jacobs [1983]).

5.60Datos escaneados. En este capítulo, el análisis toma como base la situación tradicional, en la cual los precios deben recopilarse en forma local y centralizada y luego registrarse individualmente en una base de datos central. En aquellos casos en que los precios y tal vez las cantidades se recopilen electrónicamente, como ocurre con los datos escaneados en los puntos de venta, el muestreo podría ser diferente. No habría así necesidad de muestrear los productos ni las variedades ni los puntos en el tiempo, dado que todos serían identificados en forma automática. No obstante, no todos los puntos de venta que ofrezcan un producto podrán ser revelados por medio de datos escaneados en el futuro próximo. Como todos los tipos de puntos de venta deberían verse representados en el índice, subsistirá la necesidad de combinar muestras de datos escaneados con muestras tradicionales de puntos de venta sin escáner.

Procedimientos de estimación

5.61 Es necesario distinguir entre lo que se habrá de estimar, el parámetro, que se refiere a todo el universo, y el estimador, que es una fórmula que se calcula usando los valores muestrales y que es una estimación del parámetro. Ahora bien, en el muestreo por encuesta en general buscamos estimar un total poblacional o una función de varios de estos totales, por ejemplo, un cociente entre totales. De esta forma, si tenemos dos variables y y z definidas para cada unidad de muestreo (por ejemplo, precios en dos períodos diferentes), podríamos estimar los siguientes parámetros:

5.62 Se pueden proponer varios estimadores diferentes para el mismo parámetro poblacional, en cuyo caso necesitamos decidir cuáles de estos estimadores utilizar. Cuando se evalúa la calidad de un estimador muestral, es decir, cuán bien este estima al parámetro, el paradigma de muestreo probabilístico suele tomar en cuenta dos medidas. La primera es el sesgo de un estimador, que es la diferencia entre el parámetro del universo y el estimador promedio de todas las muestras posibles que podrían extraerse de un diseño muestral específico (al que se define como la media de la distribución muestral del estimador). Cabe observar que este sesgo no se refiere al sesgo del número índice que se analiza en otras partes de este manual. Un estimador es insesgado si su sesgo es nulo. La segunda medida es la varianza del estimador con relación a la distribución muestral. Un estimador se considera bueno cuando tanto su sesgo como su varianza son pequeños, es decir que el estimador se encuentra, en promedio, muy próximo al parámetro y no varía mucho con respecto a su propia media.

5.63 No es frecuente tener la suerte de encontrar un estimador que minimice al mismo tiempo el sesgo y la varianza: un estimador con un sesgo reducido puede tener una gran varianza, y uno con una varianza pequeña puede tener un sesgo considerable. Por ello se utiliza a menudo un criterio denominado error cuadrático medio, que es la suma del sesgo al cuadrado y la varianza. Así, un “buen” estimador es aquel que minimiza este criterio.

5.64 De acuerdo con la teoría de muestreo, los siguientes estimadores son insesgados, respectivamente, para los parámetros Y y Z mencionados antes: Y^=ΣjSyj/πj,, Z^=ΣjSzj/πj,, donde S es la muestra, y R^=Y^/Z^ aproximadamente insesgado para R, sujeto a un sesgo técnico de estimador de cocientes, el que por lo general es no significativo.

Implementación de procedimientos de estimación en los índices de precios al consumidor

5.65 Como se afirmó anteriormente, en el IPC el muestreo es, por lo general, estratificado y los agregados elementales son los estratos. Supongamos que el parámetro del universo sea I y que el parámetro del estrato h se designe como Ih. Entonces tenemos:

donde wh es la ponderación del estrato h. La cuestión es estimar Ih para cada estrato. En el siguiente análisis, por lo tanto, nos concentraremos en la estimación para un único estrato y omitiremos el subíndice h.

5.66 Puede resultar apropiado utilizar distintos parámetros para distintos estratos según el contenido, el grado de homogeneidad, la elasticidad-precio y el acceso a información sobre ponderación dentro del estrato. La elección del parámetro es un problema de números índice que se debe resolver en función de los conceptos económicos subyacentes. Como se analiza en el capítulo 20, se podría elegir el índice de valor unitario, el índice de Laspeyres, el de Lowe o el geométrico de Laspeyres.

5.67 Supongamos que tenemos una muestra de tamaño n y que las unidades de la muestra se denotan como 1, 2,…, n. A menudo se utiliza alguna de las tres fórmulas siguientes como estimador del índice del estrato:

La media aritmética de los relativos de precios (índice de Carli):

El cociente de los precios promedio (índice de Dutot):

La media geométrica (índice de Jevons):

A efectos del análisis, también necesitamos introducir el cociente de las medias armónicas de los precios:

5.68 Al comparar los estimadores que anteceden con la forma funcional de los parámetros en el capítulo 20, observamos que se necesitan condiciones muy especiales que sean estimadores insesgados de esos parámetros. Para empezar, y a diferencia de los parámetros del capítulo 20, los estimadores muestrales no incluyen cantidades.

5.69 Presentamos, sin demostración, algunos resultados con relación a las propiedades estadísticas de los estimadores precedentes (véase Balk [2002]) para más detalles). Supongamos que tenemos N productos en el universo denotados como 1, 2,…, N. Sean pjt,qjt, respectivamente, el precio y la cantidad del producto j en el período t(t = 0 para el período base y 1 para el período corriente), y sea:

la participación del gasto en el producto j en el período base. Entonces:

  • En el muestreo simple aleatorio, ni r, ni a ni g son estimadores insesgados de los parámetros poblacionales. En cambio, es necesario utilizar ponderaciones también en los estimadores.

  • En el muestreo con ppt, si Πj α wj0 para todo j, entonces r, la media aritmética de los cocientes relativos de precios, es insesgado en el caso del índice de Laspeyres (el símbolo “α” significa “proporcional a”).

  • En el muestreo con ppt, si πjαqj0 para todo j, entonces a, el cociente de precios promedio, es aproximadamente insesgado en el caso del índice de Laspeyres.

  • En el muestreo con ppt, si Πj α wj0 para todo j, entonces g es aproximadamente insesgado en el caso del índice geométrico de Laspeyres. En este caso, log g es insesgado en el caso del logaritmo del índice geométrico de Laspeyres. El sesgo remanente tiende a ser de un orden similar al de a.

5.70 Todos estos resultados son, en cierta forma, de naturaleza teórica por cuanto ni wjo ni qjo se conocen en el momento en que se extrae la muestra. Esto justifica la introducción del índice de Lowe:

  • En el muestreo con ppt, si πjαqjb donde b es algún período anterior a 0) para todo j, entonces a es aproximadamente insesgado en el caso del índice de Lowe.

5.71 No existe una manera sencilla de relacionar ninguno de los estimadores con el índice de valor unitario. De hecho, estimar dicho índice requiere muestras distintas en ambos períodos, porque el numerador y el denominador se refieren a universos distintos.

  • En el caso de dos diseños muestrales diferentes, uno para el período 0 y otro para el período 1, que son, ambos, muestreos con ppt y donde πj0αqj0 yπj1αqj1,, entonces a es aproximadamente insesgado en el caso del índice de valor unitario. En este caso, sin embargo, la interpretación de la fórmula a será diferente, pues las muestras del numerador y del denominador son distintas.

  • En dos diseños muestrales diferentes, uno para el período 0 y otro para el período 1, ambos muestreos con ppt y donde a πj0αvj0=pj0qj0 y πj1αvj1=pj1qj1,, entonces h, el cociente de las medias armónicas de los precios, es aproximadamente insesgado en el caso del índice de valor unitario. La siguiente reformulación algebraica del índice de valor unitario ayuda a clarificar este hecho:

En cuanto a a, sin embargo, la interpretación de la fórmula h será distinta porque las muestras del numerador y del denominador son diferentes.

5.72 La expresión “aproximadamente insesgado” requiere una explicación. Se refiere al hecho de que el estimador no es exactamente insesgado sino que el sesgo es pequeño y tiende a cero a medida que el tamaño de la muestra y del universo tienden simultáneamente a infinito de una manera precisa y matemáticamente definida. En el caso del estimador de cocientes aplicable a a, el signo del sesgo es indeterminado y su tamaño tras la agregación probablemente sea insignificante. En el caso de la media geométrica, en cambio, el sesgo siempre es positivo, es decir, la media geométrica muestral tiende en promedio a sobrestimar la media geométrica poblacional a lo largo de varias extracciones de muestras. En el caso del muestreo simple aleatorio y una media geométrica no ponderada tanto en el universo como en la muestra, la expresión del sesgo es: b ≈ σ2/2n, donde σ2 es la varianza de los cocientes de precios. Para universos pequeños, es necesario multiplicar esta expresión por una corrección por población finita. Este resultado se deduce fácilmente de la expresión (4.1.4) en Dalén (1999b). Este sesgo puede ser significativo para muestras de tamaño reducido, por lo cual ha de tenerse cuidado con las muestras demasiado pequeñas en un estrato cuando se aplican medias geométricas.

Estimación de la varianza

5.73 Un IPC es un estadístico complejo cuyo diseño suele también ser complejo. Por lo tanto, estimar la varianza del IPC no es una tarea de rutina. En la medida en que las muestras no sean probabilísticas, la estimación de la varianza requiere utilizar algún tipo de modelo en el cual se supone que el muestreo es aleatorio. A falta de un conocimiento sistemático y de aceptación general, describiremos brevemente los enfoques adoptados en cuatro países respecto de la estimación de la varianza.

Varianzas de las fórmulas de índices elementales

5.74 Para comenzar, veremos algunas fórmulas de estimadores de la varianza de agregados elementales. A efectos de no saturar el texto de fórmulas presentaremos los estimadores de la varianza, pero no la varianza exacta. Los estimadores de la varianza son aproximadamente insesgados en el muestreo simple aleatorio, donde el correspondiente parámetro del universo no está ponderado. También se pueden aplicar al caso de muestreo con ppt para un parámetro del universo ponderado, donde la medida de tamaño es la misma que la ponderación del parámetro. Para definiciones de las fórmulas, véanse las ecuaciones (5.1)–(5.3).

Esta estimación se deriva del hecho de que a, a diferencia de r, es un cociente de variables estocásticas. Véase, por ejemplo, Cochran (1977) para una deducción de esta fórmula.

5.75 La media geométrica es más compleja, porque no se trata de un estimador lineal. Sin embargo, Dalén (1999b) obtuvo la siguiente expresión para la varianza, que es de fácil aplicación y resulta una buena aproximación siempre y cuando los cocientes de precios no tengan una variación demasiado extrema (σr/r < 0,2, por ejemplo):

Enfoque de Estados Unidos

5.76 El IPC de Estados Unidos utiliza procedimientos de muestreo y de estimación que en muchos aspectos son únicos en comparación con los de otros países. Desde luego, el diseño exacto va variando con el tiempo. La siguiente descripción se basa en Oficina de Estadísticas Laborales (1997) y Leaver y Valliant (1995).

5.77 El IPC de Estados Unidos toma para su construcción unidades consistentes en zonas geográficas cruzadas con estratos de productos hasta alcanzar un total de 8.487 “estratos básicos del IPC”, que corresponden a agregados elementales. Las 88 zonas geográficas se seleccionaron mediante muestreo con ppt en un procedimiento de selección controlado; de estas, 29 fueron incluidas con certeza (autorrepresentativas). Dentro de cada estrato básico del IPC se aplica un procedimiento de estimación en el cual los índices para un período determinado se basan en unidades muestrales superpuestas (puntos de venta y artículos) entre este período y el inmediato anterior. Los índices de un período a otro se multiplican entre sí para obtener un índice que abarque desde el período base hasta el período corriente. El muestreo dentro de los estratos básicos del IPC es aproximadamente como el de ppt, según la descripción anterior.

5.78 La estimación de la varianza para este diseño resulta demasiado compleja para usar un estimador directo de la varianza obtenido por diseño. En cambio, se emplea un método de replicación aleatoria de grupo mediante el software conocido como VPLX. También se han intentado otros métodos.

5.79Leaver y Swanson (1992) explican con detalle los métodos de estimación de la varianza utilizados hasta ese año. También presentan las siguientes estimaciones numéricas (de la mediana) de los errores estándar de las variaciones de los IPC durante diversos intervalos entre 1987 y 1991: 1 mes, error estándar 0,074; 2 meses, error estándar 0,103; 6 meses, error estándar 0,130; y 12 meses, error estándar 0,143.

Enfoque de Suecia

5.80 A continuación resumiremos la descripción que realizan Dalén y Ohlsson (1995). El IPC sueco emplea una primera estratificación por grupos de productos, que se miden en encuestas de precios independientes y separadas. El primer paso del enfoque sueco, por lo tanto, es constatar que la varianza del índice de precios que incluye todos los artículos sea la suma ponderada de las varianzas de las distintas encuestas:

5.81 La razón por la que se puede suponer que todas estas encuestas son independientes es que no se utiliza ningún esquema muestral regional que sea común a todas. En total hay aproximadamente 60 encuestas distintas. Algunas de ellas abarcan muchos grupos de productos y tienen un diseño complejo, y existe entre ellas dependencia estocástica. Otras abarcan un solo grupo y tienen diseños simples. Algunas comprenden sus universos, sin muestreo alguno, de manera que su varianza es nula.

5.82 En numerosos grupos simples de productos es bastante razonable suponer que los cocientes de precios obtenidos son efectivamente muestras aleatorias. En algunos casos esto puede llevar a cierta sobreestimación de la varianza, pues de hecho existe alguna subestratificación o muestreo por cuotas dentro del grupo. En esos grupos de producto se podrían estimar entonces las varianzas de los estratos mediante las fórmulas (5.5)–(5.7). Cuando se estratifica una encuesta de precios, se puede aplicar la fórmula (5.8) a los niveles inferiores por encima del agregado elemental.

5.83 No obstante, algunas encuestas de precios son más complejas. Este es, en especial, el caso de aquella gran parte del índice donde los puntos de venta y los productos se muestrean simultáneamente. En Suecia, estas encuestas se denominan “encuesta de precios locales” y “encuesta de necesidades diarias”. En ambos casos, la muestra de puntos de venta se extrae probabilísticamente (con ppt) del registro central de empresas. La muestra de productos se extrae de la encuesta de necesidades diarias con ppt pero mediante el método del artículo representativo en la encuesta de precios locales. En el modelo sueco de estimación de la varianza, se considera en estos casos que la muestra final se extrae de un universo bidimensional de productos y puntos de venta. Así, las unidades de muestreo finales son productos muestreados que se venden en puntos de venta muestreados: una muestra con clasificación cruzada.

5.84 En una muestra con clasificación cruzada, la varianza total se puede descomponer en tres partes:

– Varianza entre productos (en el mismo punto de venta).

– Varianza entre puntos de venta (para el mismo producto).

– Varianza por interacción entre punto de venta y producto.

Dalén y Ohlsson (1995) muestran las fórmulas exactas que se aplican.

5.85 En la encuesta de necesidades diarias, el modelo con clasificación cruzada se aproxima bastante al diseño muestral real. En la encuesta de precios locales se trata más bien de un modelo, porque de hecho los productos se extraen en forma dirigida. No obstante, se lo considera un modelo útil a los efectos de conseguir una primera aproximación del error de muestreo y para analizar problemas de asignación.

5.86 La varianza total del IPC sueco, según este modelo, fue estimada en 0,04 con un intervalo de confianza del 95%, de ±0,4. Esta estimación resultó bastante estable durante el período 1991–95 para el cual se calculó.

Enfoque de Francia

5.87 En Francia, actualmente, el cálculo actual de la varianza solo toma en cuenta artículos que, en conjunto, representan el 65% de la ponderación total del índice.

5.88 El elemento más pequeño del cálculo es un tipo de producto en una zona urbana. Para estos elementos se aplica una de dos fórmulas, según si el producto es homogéneo (cociente de las medias aritméticas) o heterogéneo (medias geométricas). Se supone una muestra aleatoria en dos etapas, la primera de zonas urbanas y posteriormente de un artículo (o variedad) particular en un punto de venta. La varianza así obtenida es la suma de los componentes de “zonas interurbanas” con “zonas intraurbanas”. Dada la naturaleza no lineal de los estimadores, se lleva la expresión a términos lineales a través de expansiones de segundo grado. Las varianzas de los niveles superiores se obtienen ponderando las varianzas de los niveles elementales.

5.89 Tras el ejercicio de optimización que tuvo lugar en 1997, la desviación estándar del índice que incluye todos los productos (para el 65% de la ponderación total del índice) alcanzó 0,03. Este valor se aproxima al estimado en 1993, aunque la cantidad de observaciones fue reducida en el ejercicio realizado en 1997. También mejoró la precisión de varios subíndices.

5.90 Se ignoran los términos de covarianza. Esto, de hecho, no afecta mayormente al componente de “zonas interurbanas”, pero tiene un impacto sin duda mayor sobre el componente de “zonas intraurbanas”. El efecto, sin embargo, se considera limitado en virtud de una regla que restringe la cantidad de productos que se observan en el mismo punto de venta.

5.91 Para el 35% de la ponderación que actualmente se excluye del cálculo de la varianza (llamada la categoría “aranceles”), dicho cálculo se incorporará para los seguros. Los elementos necesarios para el cálculo de la varianza también están presentes para los servicios médicos y odontológicos. En un futuro próximo se calcularán las varianzas de estos productos, así como también las de los autos nuevos. Para ciertos subíndices (tabaco y productos farmacéuticos) la muestra abarca todo el universo. Por ello son nulas sus varianzas.

5.92 Un intervalo de confianza del 95% para una comparación de 12 meses se puede expresar como el índice estimado ±0,06 para los artículos comunes que no están dentro de la categoría “aranceles”. Si se supone una varianza nula para el 35% restante del índice, el intervalo de confianza del índice que incluye todos los productos sería ±0,04. Este supuesto es, desde luego, demasiado optimista, pero a partir de todo el trabajo realizado hasta ahora sobre estimación de la varianza se puede concluir que el intervalo de confianza es ciertamente inferior a 0,1.

5.93 Para conocer más detalles sobre los cálculos franceses, véase Ardilly y Guglielmetti (1993).

Enfoque de Luxemburgo

5.94 El IPC de Luxemburgo se puede describir como una muestra estratificada dirigida con 258 estratos de productos. Se toman un poco menos de 7.000 observaciones por mes, de manera que se realizan, en promedio, 27 observaciones por estrato. En cada estrato se toman observaciones de varios puntos de venta diferentes, pero el mismo punto de venta aparece representado en muchos estratos de productos. El punto de venta se utiliza en este caso como el indicador de la organización que fija el precio (el propietario de la vivienda si se trata de alquileres, las compañías en el caso de los seguros, y así sucesivamente). Para cada estrato se llevan a cabo observaciones de varios puntos de venta. Como hay motivos para creer que cada punto de venta presenta su propio comportamiento en materia de fijación de precios, los precios y sus variaciones en el mismo punto de venta tienden a estar correlacionados, por lo cual la siguiente expresión de la varianza general arroja covarianzas positivas:

5.95 En el modelo muestral, cada muestra separada de puntos de venta dentro de un estrato de productos se considera una muestra aleatoria simple. Además, se supuso un modelo de dos etapas tal que, en la primera, se asumió que una muestra aleatoria simple de puntos de venta fue extraída de un marco muestral (ficticio) de todos los puntos de venta de Luxemburgo. Luego, en cada punto de venta muestreado, se supuso que se extrajo una segunda muestra de observaciones del estrato de productos h de manera que el estrato combinado productopunto de venta se convirtió en el mínimo nivel de cálculo dentro del índice. Se supuso que todas las muestras de la segunda etapa son mutuamente independientes y que las fracciones muestrales son pequeñas. Este modelo arrojó una varianza total con tres componentes:

  • Varianza dentro de los puntos de venta.

  • Varianza entre los puntos de venta.

  • Covarianza entre los puntos de venta.

Es difícil calcular covarianzas, aun con computadora. Por suerte, sin embargo, fue posible combinar algebraicamente los últimos dos componentes en uno, para disminuir así la cantidad de sumatorias.

5.96 Se hicieron estimaciones numéricas con este modelo para 22 variaciones consecutivas de 12 meses desde el período enero de 1996–enero de 1997 hasta el período octubre de 1997–octubre de 1998. La estimación de la varianza promedio fue de 0,02 (que corresponde a un error estándar de 0,14): un resultado sorprendentemente pequeño dado el tamaño reducido de la muestra. No se ha explorado en detalle la causa de esta pequeña varianza, pero puede estribar en una combinación de circunstancias especiales de los mercados de Luxemburgo y en los procedimientos utilizados en el sistema de estimación del índice.

5.97 El modelo completo de estimación de la varianza del IPC de Luxemburgo y los resultados obtenidos a partir de él se presentan en Dalén y Muelteel (1998).

Otros enfoques

5.98 En el Reino Unido se han ensayado varios modelos experimentales con sus respectivos cálculos, ninguno de los cuales se ha reconocido aún como método o estimación oficial. Kenny (1995 y anteriores) probó aplicar el enfoque sueco a los datos del Reino Unido y descubrió que el error estándar del índice de precios minoristas del Reino Unido en su conjunto era de alrededor de 0,1. Esta cifra se mantuvo razonablemente constante durante varios años a pesar de que el desglose detallado de la varianza varió considerablemente. Sitter y Balshaw (1998) utilizaron un enfoque pseudopoblacional pero no presentaron ninguna estimación de la varianza general.

5.99 Para Finlandia, Jacobsen (1997) planteó cálculos parciales a partir de un diseño similar al del enfoque sueco. Su análisis se utilizó para proponer modificaciones a la asignación de la muestra.

Asignación óptima

5.100 Elaborar un índice de precios al consumidor es una tarea importante en cualquier país y se gastan muchos recursos en la recopilación de precios. Por ello vale la pena dedicar cierto esfuerzo a asignar los recursos de la manera más eficiente.

5.101 El enfoque general con respecto a la asignación de la muestra fue establecido por Neyman y se describe en todos los libros de texto sobre muestreo. Utiliza una expresión matemática para la varianza de la estimación y otra expresión para el costo. Tanto la varianza como el costo son funciones del tamaño de la muestra. Así, la asignación óptima consiste ya sea en minimizar la varianza para un costo dado o bien minimizar el costo para una varianza dada.

5.102 La estimación de la varianza fue analizada antes. En cuanto al costo, es importante tener en cuenta que no cuesta lo mismo realizar cada observación de precios. Resulta menos oneroso recopilar un precio más en un punto de venta que ya está incluido en la muestra que agregar un precio en un punto de venta nuevo para la muestra. Por ejemplo, en el IPC sueco se utilizó la siguiente función de costo:

donde C se refiere al costo total y C0 a la parte fija del costo que es independiente del tamaño de la muestra,

nh es la cantidad de puntos de venta en el estrato de puntos de venta h,

mg es la cantidad de variedades de productos en el estrato de productos g,

ah es el costo unitario por punto de venta y refleja la duración del viaje hasta el punto de venta,

bh es el costo unitario por producto, que refleja el costo adicional de observar un producto cuando el agente encargado de recopilar los precios ya se halla en el punto de venta.

rgh es la frecuencia relativa promedio de los productos en el estrato g que se venden en los puntos de venta del estrato h.

5.103 En la fórmula (5.10), ah es por lo general mucho mayor que bh. Esto hace que sea más conveniente una asignación que contenga relativamente más productos que puntos de venta, es decir, varios productos por punto de venta. Esta asignación queda reforzada hasta el punto que las varianzas entre productos del mismo punto de venta y estrato de producto son, por lo general, mayores que las varianzas entre distintos puntos de venta para el mismo producto. Al menos así lo corrobora la experiencia sueca.

5.104 Es posible obtener, a partir de funciones de varianza y de costo especificadas y mediante el procedimiento matemático de multiplicadores de Lagrange, el tamaño óptimo de la muestra para cada estrato. Sin embargo, por lo general no es posible alcanzar expresiones explícitas, pues nos enfrentamos a un problema de optimización no lineal para el cual no es posible encontrar una solución explícita.

5.105 En un IPC, el estadístico de mayor importancia suele ser el índice que incluye todos los productos. Por lo tanto, la asignación de la muestra debería estar orientada hacia la minimización del error de dicho estadístico. También es importante que los otros subíndices que se publiquen sean de alta calidad, aunque la calidad del subíndice se puede tomar a menudo como el criterio para publicarlo, y no viceversa.

Resumen

5.106 El análisis que antecede se puede resumir en unas pocas recomendaciones específicas.

5.107Claridad: las reglas de muestreo deben estar bien definidas. En muchos IPC existe una amplia gama de muestreos y otras soluciones para distintos grupos de productos. A menudo para la recopilación de precios en el trabajo de campo se utiliza un método bastante bien definido, pero los métodos exactos que se utilizan para la recopilación centralizada de precios de algunos productos suelen estar en manos de uno o unos pocos responsables y, a veces, están pobremente documentados. Resulta esencial para la credibilidad básica del IPC que las reglas de muestreo y de estimación (por ejemplo, el tratamiento de los valores atípicos) se encuentren bien definidas y explicadas.

5.108Se debería considerar seriamente el muestreo probabilístico. Debería aumentar el empleo de diseños de muestreo probabilístico. En numerosas áreas ya existen marcos muestrales útiles o bien se podrían construir sin mayores dificultades. El muestreo estratificado por orden con ppt es un tipo de diseño importante que debería tenerse en cuenta en muchas situaciones. Las medidas de tamaño que se utilizan para el muestreo deben tener una interpretación de largo plazo, para evitar que se correlacionen con las variaciones de precios.

5.109Representatividad: no hay que excluir ninguna parte considerable del universo. A la hora de planificar diseños muestrales se debe tener en cuenta todo el universo de artículos y puntos de venta que corresponden al grupo del artículo en cuestión. Todas las partes significativas de ese universo deberían verse adecuadamente representadas, a menos que ello resulte excesivamente oneroso o que genere problemas de estimación.

5.110La varianza o el error cuadrático medio deben minimizarse. Se debería optimizar razonablemente la muestra, por lo menos a partir de un análisis rudimentario de la varianza muestral. Como aproximación de primer orden, los tamaños de las muestras podrían ser aproximadamente proporcionales a las ponderaciones de los grupos de productos básicos. Se consigue una aproximación mejor si se multiplica cada ponderador por una medida de la dispersión de la variación de precios en el grupo. En conjunto, las consideraciones de varianza y de costos requieren asignaciones en que se observen relativamente muchos productos por punto de venta pero se incluyan relativamente pocos puntos de venta en la muestra. Como los sesgos por lo general representan un problema mayor que los errores de muestreo, se recomienda elegir muestras más pequeñas pero mejores, porque permiten una renovación más frecuente y una supervisión más cuidadosa de la reposición y de los ajustes de precio por calidad.

    Other Resources Citing This Publication