Chapter

5. Cuestiones relativas al muestreo en la recopilación de precios

Author(s):
International Monetary Fund
Published Date:
September 2009
Share
  • ShareShare
Show Summary Details

A. Introducción

5.1 En un mundo ideal, siempre sería posible utilizar técnicas de muestreo estadísticamente sólidas para elaborar índices de precios con un alto grado de exactitud y sujetos a determinadas limitaciones de recursos. La realidad, sin embargo, suele distar mucho de este ideal. Casi siempre es imposible lograr muestras eficientes porque i) no suele disponerse de estimaciones de varianza poblacional exactas, necesarias para afijar unidades muestrales a estratos; ii) los marcos muestrales nunca son perfectos sino que carecen de ciertos datos clave, como la aparición de nuevos establecimientos o las variables de estratificación deseadas, y iii) las tasas de respuesta son impredecibles y pueden resultar deficientes, lo cual afecta la exactitud de los niveles de los índices de precios y las mediciones de las variaciones de precios.

5.2 Por lo tanto, el objetivo del especialista en muestreo es utilizar de la mejor manera posible aquello que se encuentra a su disposición y aplicar los principios de la teoría del muestreo con sentido común y practicidad. Posiblemente los pasos más importantes del muestreo sean establecer y comprender cabalmente lo que la encuesta busca estimar, las limitaciones del marco muestral y el entorno en el cual se desarrollará la encuesta, es decir, las tasas de respuesta probables, la calidad de los datos y los niveles de recursos.

5.3 Existe una relación directa entre los usos del IPP, el alcance de la cobertura de la encuesta del IPP y los requisitos de los marcos muestrales. Dos funciones importantes del IPP son la de indicador general de la inflación y la de deflactor de las cuentas nacionales. Cuanto más amplia es la cobertura del IPP en términos de actividades económicas, mayor es su utilidad en el análisis de la inflación y en la compilación de mediciones del PIB a precios constantes. Pero una cobertura amplia requiere poder desarrollar marcos muestrales para una gran diversidad de actividades económicas, no solo la producción de bienes sino también la prestación de servicios. Estos marcos muestrales también deben actualizarse registrando la aparición y desaparición de empresas en cada sector.

5.4 Una vez establecidos la cobertura y los usos, se puede generar un diseño de la muestra y determinar la estratificación, el tamaño de la muestra y la afijación. En países donde se dispone de muchos datos y pueden realizarse estimaciones razonables de la varianza, es posible utilizar técnicas de muestreo aleatorio. En muchos países se cuenta con pocos detalles de los parámetros muestrales y el responsable de estadística puede verse obligado a recurrir a procedimientos que requieren conocimiento de experto en muchas etapas de la selección. Sin embargo, en la medida de lo posible deberían utilizarse procedimientos de muestreo aceptables y factibles. Los enfoques por criterio de experto deberían utilizarse como último recurso.

5.5 Como sucede con la mayoría de las muestras de panel recopiladas a lo largo del tiempo, las encuestas de precios padecen los problemas asociados a los cambios poblacionales. Cualquier muestra de establecimientos y productos se va tornando menos representativa con el tiempo, y es probable que se agote a medida que los establecimientos dejen de vender o producir los productos seleccionados o directamente cesen su actividad. Conviene adoptar alguna forma de rotación o complementación del panel para las muestras a fin de minimizar el sesgo causado por el desgaste de la muestra y la falta de cobertura de nuevos productos, nuevos establecimientos y nuevas tecnologías de producción.

B. Problemas comunes de muestreo relacionados con las encuestas de precios

5.6 Existen numerosas razones por las cuales es posible que las encuestas de precios no se consideren representativas y se dude de la exactitud de sus resultados. Todas las encuestas nacionales de precios presentan problemas de algún tipo. A continuación expondremos algunos ejemplos:

  • Las muestras se seleccionan en forma dirigida en vez de utilizar un método de muestreo probabilístico, lo cual aumenta la probabilidad de sesgos. Por ejemplo, pueden seleccionarse establecimientos por la conveniencia de su ubicación geográfica o por su predisposición a responder.
  • Sin métodos de selección probabilística no puede realizarse una estimación estadísticamente precisa (pero sin una estimación inicial de la varianza, tampoco puede optimizarse una muestra seleccionada aleatoriamente, es decir, minimizar la varianza dadas las limitaciones de costos. Se trata de un problema difícil del que nos ocuparemos luego).
  • El tamaño de la muestra para un sector o producto puede quedar desactualizado si el nivel de actividad varió con relación al período base (aquel en el cual se seleccionó la muestra).
  • Es posible que en la encuesta no se identifiquen ni incluyan nuevos productos. Este problema puede superarse hasta cierto punto rotando la muestra de establecimientos.
  • Es probable que el marco muestral esté desactualizado o que no incluya ciertos grupos de la población objetivo. Por ejemplo, un problema frecuente del IPP es que la información sobre pequeños productores no es confiable porque este grupo suele ser volátil y difícil de seguir por parte de las autoridades administrativas, con lo cual la ponderación de los pequeños productores resulta errónea (por lo general están subrepresentados).
  • Por último, las encuestas pueden ser voluntarias, lo que aumenta la probabilidad de sesgo por ausencia de respuesta que surge de las distintas experiencias de precios de aquellos que responden y aquellos que no.

C. Punto de partida

5.7 Antes de comenzar a diseñar una encuesta de precios es fundamental comprender los propósitos de la encuesta y los usos que la misma tendrá. Ello determinará el formato de los resultados requeridos y permitirá decidir qué datos de entrada recopilar. Resulta esencial evaluar y comprender el entorno en el cual se realizará la encuesta, por ejemplo, la tasa de respuesta esperada y la posible calidad de los datos. Desde luego, algunas de las decisiones más importantes se refieren al nivel de los recursos disponibles. Por lo tanto, todos los parámetros expuestos a continuación afectan el diseño de la muestra y el posterior éxito de la encuesta.

5.8 Es de suma importancia establecer los objetivos de la encuesta, consultando a sus usuarios y contestando las siguientes preguntas:

  • ¿Los índices de precios se utilizarán como deflactores de la producción y/o como medida de la inflación?

Si el objetivo es deflactar la producción, serán prioritarios los índices detallados de sectores y productos para el IPP, mientras que para el IPC se requerirán índices detallados de artículos. Si, en cambio, se requieren indicadores de la inflación, se pondrá más énfasis en los índices agregados y deberá utilizarse una variedad de indicadores con distintos precios y ponderaciones, por ejemplo, índices de precios de los insumos, de la producción, al por mayor y minoristas.

  • ¿Cómo será la cobertura geográfica: nacional o regional?

La cobertura geográfica para el IPP suele ser nacional, pero en algunos países cuyas variaciones de precios manifiestan diferencias regionales pueden justificarse los índices regionales. Además, varios países compilan estimaciones de PIB regionales. Quizá se requiera utilizar IPP regionales como deflactores, en especial cuando se constatan diferencias regionales en las variaciones de precios.

  • ¿La serie cronológica será mensual o trimestral?

Por lo general, el IPP se recopila mensualmente como indicador de la inflación, pero en muchos países es trimestral por cuestiones de costos y porque se utiliza principalmente como deflactor de las cuentas nacionales, las que por lo general son de frecuencia trimestral.

  • ¿Cuáles son los precios que se desean estimar: precios básicos, al productor, al por mayor o al comprador?

El concepto para la determinación del precio variará según el tipo de índice que se elabore. Para el IPP de la producción se aplica el precio básico, es decir, el ingreso unitario recibido por el productor a cambio de la producción. Para un IPP de insumos se toma en cuenta el precio al comprador, es decir, el costo unitario pagado por el productor por los insumos materiales y energéticos del proceso productivo.

  • Suponiendo que, por razones de costos, deba elegirse entre un IPP por industria y un IPP por producto, ¿cuál es prioritario?

Si los IPP por industria son más importantes, se utiliza un sistema de muestreo en dos etapas para obtener estimaciones industriales y de producto confiables. En cambio, si los IPP por producto tienen mayor prioridad, es preciso compilar muestras confiables de productos y luego agregarlas para obtener IPP por industria, que probablemente no resulten tan confiables.

  • ¿Se compilarán distintos índices para los precios de mercado interno y los precios de exportación?

El IPP debería cubrir toda la producción de los productores internos, incluidos los productos para el mercado interno y los destinados a la exportación. A menudo los países recopilan información únicamente de productos para el mercado interno, aunque el IPP también podría servir como índice de precios de exportación.

  • ¿Qué industrias y productos deberían cubrirse y con qué nivel de detalle?

En el IPP suelen cubrirse básicamente el sector industrial (minería y manufactura) y las empresas de servicios públicos. Sin embargo, los servicios adquieren cada vez mayor importancia en términos de peso económico y crecimiento, por lo cual deberían cubrirse en las modificaciones futuras que se efectúen al IPP.

5.9 Es necesario identificar y comprender correctamente los datos que se recopilarán:

  • ¿Qué tipo de precios recopilar: precios de transacciones efectivas o precios de lista?

Puede resultar difícil definir y recopilar los precios de numerosos bienes y servicios. A menudo el precio de lista o el precio en libros no refleja el precio percibido por el establecimiento. Idealmente, lo que se busca es recopilar los precios efectivos percibidos por una muestra representativa de transacciones de establecimientos. En el caso de los bienes, ello se logra con bastante regularidad. Lo mismo sucede con la mayoría de los servicios. Sin embargo, para ciertos servicios—por ejemplo, los servicios bancarios y de seguros—el servicio y el precio de la intermediación financiera no resultan bien definidos y es probable que el precio efectivo tenga que obtenerse a partir de la información de la transacción. (En el capítulo 10 se brinda más información sobre el precio de estos servicios.) Además, si la principal utilidad de los índices es deflactar la producción, los precios recopilados deberían ser precios efectivos de transacción.

  • ¿Se recopilarán precios básicos (excluyendo los impuestos sobre los productos, incluyendo subsidios y excluyendo costos de transporte facturados por separado)?

Según el SCN 1993, la producción de bienes y servicios idealmente debería valuarse a precios básicos, al igual que los IPP, si estos se utilizan como deflactores. Si los IPP de la producción utilizan precios distintos de los precios básicos, su consecuente deflación arrojaría resultados espurios.

  • ¿Cuándo registrar los precios?

Siguiendo la línea de valuación de la producción del SCN 1993, deberían respetarse en la medida de lo posible las reglas contables en base devengado, de manera que en el IPP se registren los precios liquidados en el momento de embarque o entrega. Aunque las prácticas entre países a menudo difieren—por ejemplo, los precios pueden registrarse en el momento de la compra o de la orden—en general se utiliza el momento de embarque o entrega. Los precios podrían ser un promedio de varias observaciones del mes o el precio de un día determinado del mes: ambos enfoques son habituales y aceptables.

  • ¿Cómo debería describirse un precio (una transacción)?

Deberían identificarse las características que influyen sobre el precio de cada producto o variedad para poder detallar bien las especificaciones de la transacción. Por ejemplo, el precio del litro de pintura dependerá de la cantidad de latas que se despachen, el tipo y la calidad de la pintura, las condiciones de pago (pago dentro de los treinta días de recibido el producto), el tipo de cliente y todo descuento especial que corresponda.

  • ¿Puede haber falta de disponibilidad estacional de productos? De ser así, ¿cómo debe procederse con respecto a los precios no disponibles?

La falta de disponibilidad estacional ejerce una influencia directa en la calidad del índice porque se espera que el tamaño de la muestra sea menor en esos períodos. Ello debería tenerse en cuenta al diseñar los estratos de la muestra, de manera tal que en cada estrato se incluyan varios productos similares que estén disponibles durante todo el año. Además debería aumentarse el tamaño de la muestra para estos estratos en función de la mayor variabilidad de los movimientos de precios de productos estacionales.

5.10 Debe tomarse una decisión respecto del nivel de exactitud requerido:

  • Idealmente debería identificarse un error máximo de muestreo aceptable para cada índice que se publique.

El error de muestreo, no obstante, solo puede calcularse si se utilizaron técnicas de muestreo probabilístico. Ello a menudo significa empezar por algunas estimaciones de varianza del índice componente para determinar los tamaños iniciales de las muestras. Una vez recopiladas las muestras y calculadas las varianzas, es posible optimizar la muestra de acuerdo con la nueva información sobre la varianza. Sin embargo, es muy difícil lograr calcular las varianzas y los errores de muestreo (Leaver, Johnstone y Archer, 1991; Leaver y Swanson, 1992; Cope y Freeman, 1998, y Morris y Birch, 2001)1.

  • En la práctica existe una relación de compensación entre el costo y la exactitud.

Si se desea un nivel alto de exactitud se requiere un tamaño mayor de muestra que puede exceder el presupuesto. En estos casos, los costos suelen determinar el tamaño de la muestra, y el nivel de exactitud puede verse afectado.

5.11 Una vez decidida la cobertura es necesario identificar la población que se seleccionará y revisar el marco muestral para determinar si debe complementarse:

  • ¿Contiene el marco todas las unidades de la población objetivo? ¿Cubre todos los sectores que corresponde incluir y todos los establecimientos de esos sectores? ¿Deberán desarrollarse marcos específicos para cada sector, grupo o división?

La mayoría de los registros de empresas tiene un umbral que estipula un tamaño mínimo determinado (cantidad de empleados o valor de ventas) para la inclusión y probablemente algunos sectores que no están bien cubiertos, por ejemplo el de la construcción y el comercio minorista. Además, se requiere identificar los establecimientos en forma separada de la casa matriz.

  • ¿Cómo se definen las unidades del marco? Es probable que existan unidades en una situación límite, cuya pertenencia a la población resulte dudosa.

Habrá que desarrollar un marco muestral distinto para industrias o productos del IPP a efectos de facilitar la selección de la muestra de establecimientos para esas industrias y productos. Por ejemplo, las unidades subsidiarias de una empresa pueden estar fuera del alcance o ciertos productos secundarios a la industria deberían incluirse en el marco de otra.

  • ¿Son las unidades mutuamente excluyentes?

Podría haber doble computación si se registra un establecimiento por sí mismo y también como parte de la empresa matriz.

  • ¿Se dispone de información que permita estratificar?

Necesitamos ciertos elementos de datos que sirvan como variables de estratificación—por ejemplo, la clasificación industrial, producción o ventas, cantidad de empleados y ubicación del establecimiento—a fin de seleccionar la muestra.

  • ¿Se dispone de información para ponderar la selección por probabilidad proporcional al tamaño (PPT)?

Necesitaremos mediciones de tamaño, como producción, volumen total de ventas y valores de embarque. Si no se dispone de estas mediciones de valor se puede utilizar el empleo como variable representativa.

5.12 Debe decidirse el nivel de los recursos disponibles:

  • El nivel de los recursos condicionará el tamaño de las muestras.

Suele ser más oneroso aumentar la cantidad de establecimientos muestreados que aumentar la cantidad de precios recopilados en cada establecimiento. Aumentar únicamente esto último puede no agregar demasiado a la exactitud cuando la varianza dentro del establecimiento es baja en comparación con la varianza entre establecimientos.

  • Y ello puede determinar los métodos de medición.

Por ejemplo, si conviene recurrir a la recopilación de datos en forma personal además de telefónica, por correo o mediante cuestionarios electrónicos.

5.13 Ciertas cuestiones legislativas pueden afectar el diseño de la muestra:

  • ¿La encuesta será voluntaria u obligatoria?

Esto afectará las tasas de respuesta, lo cual a su vez influirá sobre la exactitud y el tamaño de las muestras. Las encuestas obligatorias presentan tasas de respuesta más altas pero pueden arrojar datos de calidad inferior.

  • ¿Existen normas de confidencialidad?

Tales normas pueden imponer un límite inferior al tamaño de las muestras, por ejemplo, que se requiera un mínimo de cuatro unidades por estrato.

D. Diseño muestral

5.14 Una vez fijados los objetivos de la encuesta del IPP, el formato de los insumos y productos, el nivel de exactitud deseado y los recursos disponibles, puede dar comienzo el proceso de diseño de la muestra2. Nuevamente será necesario tomar ciertas decisiones, pero el objetivo principal del proceso de diseño es claro: maximizar la eficiencia, es decir, minimizar los errores de muestreo y los errores no vinculados al muestreo, así como también minimizar los costos.

5.15 Deberán tomarse decisiones respecto de:

  • Las técnicas de muestreo (probabilístico o no probabilístico).
  • Los marcos muestrales.
  • Estructuras de la muestra y estratificación.
  • La afijación de la muestra entre estratos.
  • Los métodos para reducir los errores no vinculados al muestreo.

D.1 Técnicas de muestreo

D.1.1 Muestreo probabilístico y no probabilístico

5.16 Ante cualquier problema de medición, el experto en estadística debe en primer lugar considerar la posibilidad de realizar una rigurosa muestra probabilística. En el contexto del IPP, el muestreo probabilístico significa seleccionar un panel de muestra de productores y productos (transacciones) de un universo de actividades industriales en el cual cada productor y cada producto tengan una probabilidad conocida de ser seleccionados.

5.17 El muestreo no probabilístico se conoce como muestreo dirigido o por criterio, o elección del experto, y las muestras son seleccionadas por los expertos de manera que resulten representativas. En la práctica, sin embargo, los expertos raras veces concuerdan sobre lo que consideran representativo y las muestras están sujetas a sesgos de tamaño desconocido. El muestreo por criterio de expertos se justifica cuando el tamaño de la muestra es pequeño pero, a medida que crece el tamaño de la muestra, aumenta la preocupación sobre los sesgos.

5.18 El uso de una muestra probabilística redunda en dos ventajas muy conocidas. En primer lugar, se asegura la selección objetiva e imparcial de los artículos cuyos precios se determinarán. Si la muestra no es probabilística se corre el riesgo de seleccionar solo artículos cuyos precios sean fáciles de determinar, lo cual daría por resultado estimaciones sesgadas (y, por lo tanto, índices sesgados). En particular, es probable que en el IPP la cobertura de artículos tecnológicamente avanzados sea pobre, por ejemplo en el caso de maquinarias, equipos electrónicos, aviones o electrodomésticos. Es difícil determinar los precios de estos productos por los continuos cambios en sus especificaciones. Además se tiende a atribuir importancia excesiva a los productos más simples, como comestibles, cemento, textiles o barras de acero, para los cuales es fácil conseguir series comparables de cotizaciones de precios.

5.19 La segunda ventaja es que la muestra probabilística permite medir la calidad de los resultados de la encuesta a través de estimaciones de la varianza o el error de muestreo. En este contexto, la calidad de los resultados se relaciona con la posibilidad de que haya una diferencia entre los resultados obtenidos de las observaciones seleccionadas y los resultados que se habrían obtenido de una enumeración completa de todas las unidades de información del universo. Desde luego, aun cuando se utilice una muestra probabilística, no es posible medir errores por falta de respuesta, informes inexactos, ponderaciones obsoletas, falta de representatividad de los productos cuyos precios se registraron o cualquier otra fuente no vinculada con el muestreo.

5.20 En teoría, el muestreo probabilístico podría utilizarse en todas las etapas del proceso de selección. Por ejemplo, una muestra aleatoria de productos podría seleccionarse a partir de una lista completa de todos los bienes producidos por todas las empresas mineras y manufactureras. Para cada producto seleccionado podría escogerse una muestra aleatoria de productores utilizando una lista exhaustiva de productores; para cada productor seleccionado, podría elegirse una muestra aleatoria de marcas específicas para informar periódicamente los precios a partir de una lista completa de la producción de cada productor. Un método menos riguroso consistiría en elegir al azar productores o minoristas y luego seleccionar en forma dirigida productos o artículos individuales; otra posibilidad sería seleccionar productores o minoristas en forma no probabilística utilizando un muestreo por valores umbral (descrito a continuación), mientras se escoge una muestra aleatoria entre todos los artículos fabricados por los productores seleccionados. Esta mezcla de procedimientos de selección aleatoria, no aleatoria y muestreos por valores umbral restringe la interpretación de los errores de muestreo estimados pero aun así conserva la ventaja de infundir cierta cuota de objetividad al proceso de selección.

5.21 El diseño muestral óptimo requiere, para todas las unidades de la población, información que permita una estratificación eficaz y mayor eficiencia debido a la selección por PPT. Las oficinas de estadística pueden utilizar diferentes variantes de muestreo probabilístico:

Muestreo aleatorio simple: todas las unidades posibles tienen la misma probabilidad de ser elegidas.

Muestreo sistemático: tras un comienzo aleatorio, se selecciona cada k-ésima unidad. Este muestreo se verá afectado por cualquier ordenamiento o patrón del marco muestral. El ordenamiento produce una estratificación implícita, y un patrón en el marco puede sesgar las muestras.

PPT: cada unidad tiene una probabilidad de selección proporcional al tamaño (o algún otro indicador de importancia, pero suele utilizarse el tamaño). Una vez asignadas las probabilidades de selección, pueden utilizarse técnicas de muestreo aleatorio simple o de muestreo sistemático.

5.22 Si bien los métodos de muestreo probabilístico resultan atractivos, existen situaciones en las cuales no son necesarios ni convenientes. Los índices de precios constituyen un área de la estadística en la cual el riesgo que implica el no contar con una muestra probabilística es relativamente bajo. La diversidad potencial entre las variaciones de precios cobrados por distintos productores de un artículo dado a lo largo de muchos períodos es bastante baja. Comparemos esto con la diversidad potencial de las ventas o gastos de capital de empresas que fabrican el mismo producto a lo largo del mismo período. La empresa más grande puede convertirse en la más pequeña y viceversa. Incluso puede ocurrir que algunas dejen de producir ese artículo y que ingresen nuevas empresas. En una palabra, la medición de variaciones de precios parece requerir menos rigor con relación al muestreo probabilístico que otras áreas de la medición estadística. Los costos adicionales que supone el muestreo probabilístico pueden destinarse a otras áreas de la encuesta, como la recopilación de datos sobre precios o el perfeccionamiento de la fuente de los datos sobre ponderaciones.

5.23 No obstante, sin muestreo probabilístico las oficinas de estadística no pueden elaborar buenas mediciones del error de muestreo que ayuden a los usuarios a distinguir entre variaciones reales de precios y variaciones provocadas por ruido estadístico. También pueden experimentar dificultades al tomar decisiones estadísticas para mejorar el diseño muestral y asignar los recursos con mayor eficiencia. Las buenas mediciones del error de muestreo proporcionan a las oficinas de estadística los datos necesarios para una nueva afijación de la muestra a áreas de menor varianza y reducir así el error estadístico.

5.24 En varios países, la diversidad de productos industriales y mineros producidos internamente es tan limitada y la cantidad de empresas que los producen es tan pequeña que carece de sentido extraer una muestra; en estos casos, la encuesta debería procurar abarcar todos los productos y todos los productores.

5.25 En otros casos, puede no haber ninguna forma práctica de determinar el universo con anterioridad. Un requisito básico del muestreo probabilístico es definir el universo (población) e identificar todas las unidades que pertenecen a este. La lista de la población debe mantenerse actualizada y deben clasificarse todas las unidades mediante un código industrial como la CIIU o la NACE, lo cual en la práctica es costoso y complicado.

5.26 El costo de realizar y administrar una muestra probabilística se puede considerar excesivo. Sin duda hay costos altos implicados en el diseño, el proceso de selección, el control y la administración de una muestra probabilística para recopilar observaciones de precios.

5.27 También se necesitan estimaciones de la variabilidad de las variaciones de precios. Pocas veces se dispone de esta información para todas las unidades de la población, y menos aún para un nivel detallado de productos o artículos. Una solución posible es utilizar una muestra en dos fases, en la cual se recopila cierta información de una muestra de unidades y luego se reitera el muestreo de estas unidades a partir de esa información. En el IPP del Reino Unido, por ejemplo, se recopilan datos detallados de productos a partir de una muestra de productores como parte de la encuesta PRODCOM de la UE. Estos productores luego constituyen el marco muestral del IPP y los datos detallados se utilizan para la estratificación y para la aplicación del método PPT.

5.28 La selección probabilística a menudo resulta inadecuada porque la encuesta de los precios de productor idealmente debería formar parte de un programa integrado de estadísticas de precios. Ello significa que la elección de los artículos cuyos precios se registrarán en la etapa intermedia (es decir, los precios al productor) puede depender de los artículos seleccionados en una etapa anterior (por ejemplo, importaciones) o en una posterior (por ejemplo, exportaciones o consumo).

5.29 Así, para la mayoría de los países, el enfoque estrictamente probabilístico no resulta practicable, o bien los costos superan con creces las ventajas, por lo cual se recurre a una combinación de técnicas de muestreo probabilístico y de muestreo dirigido.

D.1.2 Muestreo por valores umbral

5.30 El muestreo por valores umbral es una estrategia utilizada con frecuencia para seleccionar muestras. Según este enfoque, se predetermina un umbral y se incluyen en la muestra todas las unidades que se encuentran en el umbral o por encima de este (seleccionadas con certeza) y no se incluyen las unidades que se hallan por debajo del umbral (probabilidad de selección nula). El muestreo por valores umbral suele traer aparejado un alto grado de cobertura con pocas unidades potenciales. Ello se debe a que la distribución de la variable de selección (por ejemplo, producción o ventas) se concentra en una cantidad reducida de establecimientos grandes3.

5.31 El problema de este enfoque es que la variación de precios de los establecimientos más pequeños puede diferir de la de los grandes, con lo cual se introduce un elemento de sesgo en el índice de precios. El sesgo sería la diferencia entre la variación de precios promedio de las unidades no cubiertas y la variación de precios de la población total. Si la importancia de las unidades excluidas es muy escasa o el sesgo es muy pequeño, el efecto sobre el error total puede ser muy pequeño. El error total suele medirse como la raíz del error cuadrático medio:

y la muestra con el menor error total se considera la más eficiente. Así, se preferirá el enfoque que produzca el menor error total o la menor raíz del error cuadrático medio. Es posible que una muestra por valores umbral sea más eficiente si el componente de sesgo de las unidades excluidas es pequeño. Por ejemplo, si las unidades no cubiertas varían sustancialmente respecto de la variación de precios pero con un sesgo pequeño (es decir, no difiere mucho la variación de precios promedio), la raíz del error cuadrático medio podría ser inferior si se utiliza una muestra por valores umbral, y los costos de la encuesta podrían ser mucho más bajos.

5.32 El muestreo por valores umbral resulta muy práctico para seleccionar industrias y productos en un sistema de muestreo en múltiples etapas. Por ejemplo, al seleccionar industrias del sector industrial que se incluirán como estratos de la muestra, puede establecerse un umbral en función del cual se seleccionen solo las industrias que representen el 1% o más de la producción. Otro aspecto del muestreo para el cual resulta útil el enfoque por valores umbral es la selección de productos representativos dentro de un establecimiento. Si, por ejemplo, al establecimiento seleccionado se le asignan cuatro observaciones de precios, se pueden seleccionar los cuatro productos de mayor venta.

5.33 El muestreo por valores umbral difiere del muestreo probabilístico. Los errores de muestreo con valores umbral carecen de exactitud porque la muestra no es necesariamente representativa de la población del índice. Las oficinas de estadística deberán poner especial cuidado en medir el sesgo de las empresas más pequeñas para calcular la raíz del error cuadrático medio y obtener una medición adecuada del error.

D.1.3 Estratificación con múltiples niveles

5.34 Por otra parte, puede resultar útil emplear muestras estratificadas en las cuales diversas clases de establecimientos se muestrean por separado. A menudo conviene identificar tres o cuatro estratos basados en su tamaño—por ejemplo, establecimientos grandes, medianos y pequeños—y asignar a cada estrato una tasa de muestreo diferente. Por ejemplo, los establecimientos grandes (en términos de volumen de negocios o cantidad de empleados) pueden muestrearse con certeza (es decir, seleccionarse todos para la muestra), los establecimientos medianos pueden ser muestreados a una tasa del 25% (uno de cada cuatro) y los pequeños a una tasa del 2% (1 de cada 50).

D.2 Marcos muestrales

5.35 Cualquiera que sea la técnica utilizada para tomar muestras, probabilística o no probabilística, es necesario definir el universo (población) del cual se extraerá la muestra, es decir, debe construirse un marco muestral. En la mayoría de los países es posible definir la población utilizando listas (registros de empresas) compiladas con fines administrativos. Para el IPP, sin embargo, estos registros de empresas probablemente disten del ideal de marco muestral y requieran algún tipo de manipulación antes de poder utilizarse. Por otra parte, es probable que los registros de empresas también sirvan de marco muestral para cualquier censo o encuesta oficial de producción, en cuyo caso dicha manipulación ya habrá tenido lugar. Los resultados de los censos y encuestas también se habrán utilizado para actualizar y mejorar el registro de empresas.

5.36 El marco muestral ideal

  • Es una lista completa de todas las unidades (productoras y exportadoras) que reúnen los requisitos para ser elegidas y se hallan dentro de la cobertura geográfica e industrial o de productos que corresponda.

5.37 Los registros suelen compilarse como producto derivado de un sistema administrativo como los sistemas de recaudación de impuestos o de la seguridad social. También se pueden compilar listas utilizando registros tales como los de las cuentas bancarias. Estas suelen contener, como mínimo, información sobre ubicación geográfica y tamaño (volumen de negocios o cantidad de empleados) pero pueden no indicar cuál es la actividad principal de una empresa o si es exportadora. Se necesitan listas complementarias cuando se sabe que ciertas áreas de cobertura son insuficientes. Por ejemplo, en el Reino Unido se lleva un registro de domicilio de constructores aparte del registro de empresas principal porque la actividad de la construcción se considera una problemática independiente. En Estados Unidos, los listados de viviendas de los censos de población se complementan con información sobre nuevas construcciones extraída de los registros de permisos de construcción. También se recopila información sobre la ubicación de los comercios y el valor de los gastos para el IPC como parte de la encuesta de presupuesto de los hogares o como una encuesta directa en los puntos de venta.

  • Se actualiza instantáneamente en función de las apariciones y desapariciones de unidades y las modificaciones de domicilios, números de fax, etc.

5.38 Mantener actualizado un registro insume muchos recursos. Suele ocurrir que la información sobre unidades grandes se halla más actualizada que la información sobre las pequeñas. Esto plantea un problema durante períodos de cambios económicos estructurales, cuando se expanden ciertos sectores industriales o áreas residenciales y aparecen numerosas unidades nuevas. Si las unidades que dejan de existir no se eliminan del marco muestral, es posible que se las seleccione como parte de la muestra. Se debe tener esto en cuenta cuando se determina el tamaño de la muestra. Asimismo, un error común en el muestreo sistemático cuando se selecciona una unidad que no está activada es reemplazarla por la siguiente unidad de la lista, práctica que debería evitarse porque aumenta la probabilidad de selección de esa unidad siguiente. El intervalo de muestreo debería repetirse como se venía haciendo, simplemente descartando las unidades desactivadas.

  • Mantiene ciertos campos para cada unidad, con lo cual permite el reordenamiento de la lista y la estratificación cuando corresponda.

5.39 Por ejemplo, la clasificación industrial de cuatro dígitos de la CIIU y la información sobre el valor de producción deberían mantenerse a los fines del IPP (idealmente de cada producto, a nivel de la CPA de seis dígitos, producido por cada unidad). Esta información se actualizaría anualmente.

5.40 Es probable que los listados confeccionados principalmente con fines de recaudación impositiva contengan información sobre los valores gravados por impuestos, por ejemplo, el valor agregado, las ganancias, las ventas. Los listados confeccionados para la seguridad social tendrán información sobre la cantidad de empleados, las remuneraciones, etc. En países donde las encuestas o censos de producción se realizan teniendo por objetivo las cuentas nacionales, en el registro de empresas también puede haber información sobre la producción y el consumo intermedio. En el Reino Unido se recopila anualmente información detallada sobre el valor de la producción de bienes (al nivel de nueve dígitos) a partir de una muestra de empresas, en conformidad con la legislación de la UE (PRODCOM), y esta información se guarda en el registro (solo para las empresas de la muestra).

  • Identifica cada unidad en forma unívoca en el nivel institucional correcto.

5.41 En la práctica algunas unidades pueden registrarse más de una vez y otras pueden agruparse en un único registro. Idealmente, una estructura identificaría a las empresas y a su correspondiente estructura de establecimientos con distintas clasificaciones y otra información de estratificación para cada establecimiento. Si el registro de empresas no brinda esta información, se necesitarán más pasos o encuestas para recopilarla como parte del procedimiento para mejorar el marco muestral.

D.3 Estructura de la muestra

5.42 La estructura de la muestra probablemente dependerá de si las estadísticas industriales o del sector en nuestras encuestas de precios tienen mayor prioridad que los subgrupos de productos o de población, o viceversa, y de la información contenida en el marco muestral.

5.43 Consideremos la estructura del IPP mediante el ejemplo siguiente:

  • Necesitamos IPP por industria (CIIU de cuatro dígitos) e IPP por producto (CPA de seis dígitos).
  • Nuestro sistema de clasificación de productos es coherente con nuestro sistema de clasificación industrial de manera que cada producto corresponde a una única industria.
  • Existen establecimientos que producen una variedad de productos que quedan clasificados dentro de más de una industria.

5.44 El primer paso en este proceso consiste en seleccionar las industrias y productos que se verán representados en el IPP. En la mayoría de los países algunas industrias y productos son muy pequeños en términos de producción o ventas: por ejemplo, las industrias o productos que comprenden menos del 0,02% del producto total y las ventas de un sector como el industrial. (Si no fuera así, todas las industrias y los productos podrían incluirse en la estimación.) Sería posible utilizar el muestreo por valores umbral según el cual aquellas industrias y productos que se hallan por debajo del umbral (en este ejemplo, el 0,02% de las ventas) se excluyen de la muestra de industrias o productos, pero su ponderación se reasigna a otro estrato de índole similar o se distribuye entre otros estratos. Así se construye un marco muestral para cada industria y producto.

5.45 La oficina de estadística debería examinar qué industrias caen por debajo del valor umbral y determinar si deberían incluirse algunas industrias o productos tradicionalmente importantes. También podrían incluirse nuevas industrias emergentes de las que se espera un importante crecimiento, pues en algún momento traspasarán el umbral. Finalmente, para el caso de las industrias no seleccionadas, la oficina de estadística debería determinar si existen combinaciones razonables de industrias que puedan alcanzar el umbral. Por ejemplo, las industrias de la CIIU 3118 (elaboración y refinamiento de azúcar) y 3119 (elaboración de cacao, chocolate y productos de confitería) pueden individualmente caer por debajo del umbral pero, combinadas, lo superarían. Así podría obtenerse una industria combinada (3118,9, elaboración de azúcar, cacao y chocolate)4.

5.46 Para construir un IPP por industria clasificaríamos cada establecimiento mediante una categoría de la CIIU de cuatro dígitos según su actividad principal, tomaríamos una muestra de los establecimientos de cada categoría, seleccionaríamos los productos y las transacciones cuyos precios se van a registrar en cada establecimiento de la muestra y luego los ponderaríamos en forma acorde a la elaboración de un IPP por industria.

5.47 Para construir un IPP por producto necesitaríamos información sobre la producción o las ventas de cada establecimiento para cada producto al nivel de seis dígitos, lo cual nos permitiría confeccionar una lista de todos los productores de cada producto del nivel de seis dígitos. De cada lista tomaríamos una muestra de transacciones y las ponderaríamos a fin de elaborar un IPP por producto.

5.48 Desde luego, manejar en forma paralela ambas listas y ambas muestras como acabamos de describir resultaría ineficiente y oneroso para las empresas y requeriría contar desde el comienzo con una gran cantidad de información sobre los productos. En la práctica suele buscarse un término medio. En algunos países (por ejemplo, el Reino Unido) donde se dispone de información detallada al nivel de los productos (al menos para un subgrupo de la población) y a los usuarios les interesan los IPP por producto, los establecimientos se ordenan de acuerdo con categorías de productos y luego se toman muestras para obtener IPP por producto, que posteriormente se ponderan en forma conjunta para elaborar IPP por industria. Este método no contempla que el comportamiento de los establecimientos no se corresponde estrictamente con la agrupación de productos por industria (el tercer punto del párrafo 5.43); es decir, algunos establecimientos clasificados en una industria (A) producirán bienes (como resultado de actividades secundarias) que se corresponden con una industria distinta (B). Los precios de estos productos secundarios deberían incluirse en el IPP por industria donde se clasifica el establecimiento (A), aunque la categoría del producto aparezca en otra parte (B).

5.49 Un término medio consiste en emplear un sistema de muestreo en dos etapas5, es decir, el marco se estratifica primero por las industrias de cuatro dígitos y luego por el tamaño dentro de cada industria. Seguidamente se seleccionan muestras de cada estrato y se extraen muestras de productos de los establecimientos seleccionados. Cada transacción seleccionada se ubica luego en una categoría de producto, y los IPP por producto pueden compilarse utilizando todos los precios de cada producto, con independencia de la industria a la cual se asignaron los establecimientos. Con este tipo de muestreo en dos etapas se sacrifica cierto grado de exactitud del IPP por producto. Esta es la estructura utilizada en Estados Unidos.

D.3.1 Conglomerados de unidades formadoras de precios

5.50 Puede resultar útil y más eficiente conglomerar las unidades básicas del marco en unidades formadoras de precios6. Una unidad formadora de precios es una entidad cuyos niveles y variaciones de precios son más o menos idénticos (perfectamente correlacionados). Por ejemplo, muchos establecimientos pertenecientes a una misma empresa pueden constituir un centro de maximización del beneficio y operar según el mismo régimen de determinación de precios. Estos establecimientos constituirían un conglomerado o una unidad formadora de precios. Si se utiliza una estructura de la muestra en dos etapas con industrias como estrato principal, los establecimientos se clasificarán por industria y luego se agruparán en conglomerados dentro de cada una.

D.4 Estratificación

5.51 Un principio básico del muestreo estipula que la estratificación en segmentos para los cuales la dispersión de las variaciones de precios es menor (más homogénea) que la dispersión total por lo general, al reducir la varianza, aumenta la eficiencia de la muestra.

5.52 Por ejemplo, en la muestra en dos etapas expuesta anteriormente, la lista de unidades formadoras de precios se estratifica primero por clasificación industrial, por ejemplo, al nivel de cuatro dígitos de la CIIU. Luego, es posible continuar la estratificación de cada estrato industrial según variables apropiadas para esa industria. La variante ideal para la estratificación es el valor objeto de medición de la encuesta—es decir, la variación de precios—, pero en la práctica utilizamos variables representativas que suponemos están correlacionadas con la variación de precios. Por ejemplo, el tamaño de la unidad de producción puede generar diferencias en las tecnologías de producción y, por ende, distintas respuestas a las variaciones en la demanda o los costos de los insumos.

5.53 En el IPP de Estados Unidos, el diseño de la muestra asegura la inclusión de todas las unidades (productos o productores) cuyo tamaño es superior a uno determinado previamente. Las unidades restantes se seleccionan con una probabilidad proporcional al tamaño. El enfoque alternativo que consiste en fijar estratos amplios, como aquellos con valor de ventas de 1 millón a 5 millones, 5 millones a 10 millones, etc., dará como resultado unidades dentro de cada estrato con la misma probabilidad de selección y, una vez seleccionadas, cada unidad tendrá ponderaciones iguales. En un diseño muestral con PPT, una unidad con ventas equivalentes a cinco millones tendrá una probabilidad aproximadamente cinco veces mayor de ser seleccionada que una unidad con ventas equivalentes a un millón. Además, la unidad seleccionada a partir de una muestra con PPT tendría una ponderación inversa a su tamaño, lo cual constituye una mejora respecto del muestreo por estratos amplios.

5.54 En teoría, debería optimizarse la estratificación para minimizar los errores de muestreo. Por ejemplo, la cantidad de estratos (L) puede optimizarse a partir de la siguiente relación:

donde Sy2 es la varianza de la variable estimada (y), en este caso la variación de precios; n es el tamaño de la muestra, y o es la correlación entre y y la variable utilizada para estratificar, en este caso una variable representativa de la variación de precios, como, por ejemplo, la producción o las ventas.

D.5 Afijación de la muestra

5.55 Dado que debido a la limitación de recursos, siempre existe un límite superior a la cantidad de datos, es preciso tomar decisiones respecto de cómo afijar la recopilación de datos entre los estratos, es decir, debemos decidir cuántos establecimientos seleccionar en cada estrato y cuántos precios recopilar en cada uno de ellos. Suele ser más oneroso aumentar la cantidad de establecimientos de la muestra que aumentar la cantidad de precios recopilados por establecimiento, aunque aumentar simplemente esta última no mejora demasiado la exactitud cuando la varianza dentro de cada establecimiento es baja. Por lo tanto, por lo general la limitación es la cantidad de establecimientos por muestra y no la cantidad total de precios recopilados.

5.56 Idealmente, la afijación de la muestra se optimizaría a fin de maximizar la exactitud dada la limitación de costos, conforme a alguna ecuación que relacione el tamaño de la muestra con la exactitud. Por ejemplo, la forma más simple de optimizar la afijación es tomar la fracción (fh) de la muestra en un estrato (h) de manera que sea proporcional a la desviación estándar del estrato Sh e inversamente proporcional a la raíz cuadrada del costo (ch) de incluir una unidad de ese estrato en la muestra; es decir:

Así, las tasas de muestreo de los estratos más heterogéneos y económicos son mayores. A menudo los costos no difieren entre estratos, de manera que la afijación óptima se reduce a fh α Sh, lo que se conoce como la afijación de Neyman.

5.57 Si se utilizan técnicas de muestreo probabilístico es posible, en teoría, estimar las varianzas para cada nivel. Tomemos las siguientes estructuras de muestra alternativas como ejemplo:

  • i) Solo se requiere elaborar IPP por industria, de manera que el marco se estratifica utilizando la CIIU de cuatro dígitos y luego por tamaño, y se emplea un muestreo con PPT en dos etapas para seleccionar primero establecimientos en cada categoría y luego transacciones en cada establecimiento.

5.58 La varianza de cada IPP por industria dependerá de la varianza entre los distintos establecimientos de esa industria (inter) y la varianza dentro de los establecimientos de la muestra (intra). Como la segunda etapa del muestreo no estratifica el marco de transacciones de cada establecimiento por producto, la varianza dentro de los establecimientos (intra) puede ser relativamente grande, en especial si la industria produce una amplia diversidad de productos. En este caso, un modelo de optimización afijará la cantidad total de establecimientos para ser muestreados entre las industrias y los grupos de tamaños según la varianza entre los establecimientos de cada estrato (inter). El modelo probablemente requerirá recopilar una gran cantidad de precios de cada establecimiento, sobre todo de aquellos con una gran varianza interna.

  • ii) Solo se requiere elaborar IPP por producto, por ende el marco se estratifica por códigos de producto de seis dígitos y se utiliza un muestreo con PPT en dos etapas para seleccionar primero los establecimientos dentro cada código y luego las transacciones de cada establecimiento.

5.59 También en este caso, la varianza de cada IPP dependerá de la varianza entre establecimientos (inter) que fabriquen un producto y la varianza dentro de cada establecimiento de la muestra (intra). La varianza dentro de los establecimientos se debe a diferencias en la diversidad o los términos de las transacciones, pero es probable que sea relativamente pequeña en comparación con la varianza entre establecimientos. Así, un modelo de optimización afijará la muestra de establecimientos en proporción a la varianza dentro de los estratos, pero requerirá recopilar una cantidad bastante pequeña de precios de cada producto por establecimiento.

  • iii) Se requiere elaborar IPP por industria y por producto, entonces el marco se estratifica utilizando la CIIU de cuatro dígitos y luego por tamaño, y se utiliza un muestreo con PPT en dos etapas para seleccionar primero los establecimientos en cada categoría y luego las transacciones en cada establecimiento. Las transacciones dentro de cada establecimiento se estratifican por código de producto.

5.60 El cómputo de las varianzas de los IPP por industria y por producto es complejo, y por ello también lo es calcular el algoritmo de optimización. Existen varianzas entre los establecimientos de cada industria y también dentro de cada estrato de productos en cada establecimiento de la muestra.

5.61 El supuesto de los ejemplos anteriores es que se utilizan técnicas de muestreo probabilístico y que, por lo tanto, pueden estimarse varianzas. En las encuestas de muestreo, sin embargo, por lo general suponemos que se cuenta con muy poca información acerca de la distribución de frecuencias que siguen las mediciones de la muestra. Ello significa que, en la práctica, la optimización se realiza utilizando diversas clases de información y aplicándola a modelos más o menos formales de optimización. La información disponible puede incluir:

  • El tamaño total de la muestra permitido por los recursos.
  • La cantidad de unidades dentro del marco de cada industria.
  • Las características económicas de cada industria, es decir, su valor de producción, la composición de la empresa y del producto, la dispersión de los productos, los mecanismos de fijación de precios, etc.
  • Qué IPP deben publicarse: puede ser necesario afijar mayores tamaños de muestra a algunos estratos de industrias o productos que los que se precisaría de utilizarse métodos empíricos simples para la difusión de los IPP a nivel detallado sin correr el riesgo de violar normas de confidencialidad.
  • Tasas de respuesta.

5.62 A menudo el propósito es simplemente producir índices industriales de exactitud equiparable y divulgar una cantidad adecuada de detalles de los productos. En cuanto a la cantidad de precios recopilados de cada establecimiento, puede ser necesario aplicar una regla general, por ejemplo que la cantidad promedio de precios ronde entre 4 y 5 y que ningún establecimiento proporcione más de 15 o 20.

E. Ejemplo de selección de la muestra e inclusión de nuevos establecimientos

5.63 Para seleccionar la muestra, es necesario completar todas las etapas previas al diseño muestral. Ya se han tomado decisiones respecto de las técnicas de muestreo que se utilizarán en cada etapa del proceso de muestreo. Para simplificar supongamos que, para calcular el IPP, se ha elegido al sector industrial como el primer sector a ser incluido. (Posteriormente se pueden agregar la minería, la agricultura, los servicios públicos, el transporte, etc.) Para esa finalidad, se dispone de información acerca de los establecimientos—por ejemplo, la industria, la producción, las ventas, la denominación social y la ubicación—, obtenida del último censo de la industria o de un censo de establecimientos. Se seleccionan industrias que corresponden a un nivel de cuatro dígitos de la CIIU mediante la estrategia de muestreo por valores umbral. Así, se seleccionan todas las industrias cuya producción (ventas) supera el 0,02% de la producción industrial total. (El valor umbral—0,02%—se determina en función del nivel de actividad económica que se considere significativo para el país. Si la cantidad de industrias resultantes es demasiado grande para los recursos disponibles, puede ser necesario elevar el valor umbral.)

5.64 Además, son varias las industrias cuya producción se encuentra concentrada en unas pocas empresas grandes, mientras que otras industrias tienen una producción más atomizada. Sería útil estratificar las industrias según el tamaño de las empresas que las componen. En aquellas industrias cuya producción está muy concentrada en unas pocas empresas grandes (por ejemplo, si tres empresas representan el 90% de la producción), se seleccionarán estas empresas grandes. En aquellas industrias más atomizadas, las empresas más grandes podrían seleccionarse con certeza (esto es, ser elegidas con una probabilidad de 1,0), mientras que podría seleccionarse una muestra de empresas más pequeñas utilizando técnicas de muestreo aleatorio (por ejemplo, mediante el muestreo con PPT descrito a continuación). En general, la cantidad de unidades de muestreo de empresas más pequeñas debería aumentar a medida que disminuye la tasa de concentración (el porcentaje de producción industrial de las empresas grandes). Por ejemplo, para industrias cuya tasa de concentración es del 70%, una muestra de cuatro unidades entre los establecimientos más pequeños sería suficiente, pero si la tasa de concentración no alcanza el 50%, cabría duplicar la cantidad de unidades. Este tipo de procedimiento también requiere asignar una ponderación adecuada a todas las unidades elegidas. Para las unidades seleccionadas con certeza, la ponderación sería la producción (ventas) de la empresa, mientras que para otras unidades sería el intervalo de muestreo (véase el ejemplo a continuación).

5.65 A esta altura ya se estratificó el marco muestral, se afijaron las unidades de muestreo y se decidió la técnica de muestreo a utilizar. Faltan tres fases para concluir la selección de la muestra:

  • i) Seleccionar los establecimientos.
  • ii) Incluir nuevos establecimientos.
  • iii) Seleccionar las transacciones.

E.1 Selección de los establecimientos

5.66 El marco muestral de establecimientos se estratificó por nivel de industria de cuatro dígitos y tamaño para el muestreo probabilístico (también podría utilizarse el muestreo dirigido, como se analiza en el apartado sobre “selección de productos y transacciones en el establecimiento”). En esta situación podría utilizarse un muestreo sistemático o con PPT, o bien una combinación de ambos. Una aplicación común del PPT es asignar una probabilidad del 100% a las unidades del estrato más grande (como se analizó antes) y luego seleccionar en forma aleatoria unidades de los demás estratos, con una probabilidad de selección proporcional al tamaño.

5.67 En Estados Unidos, donde el marco de los estratos se ordena por tamaño y se calculan los totales acumulados, se utiliza una combinación de muestreo sistemático y muestreo con PPT. Por ejemplo, supongamos que conocemos el costo promedio de recopilación de la información de precios por establecimiento y que dichos costos no varían sustancialmente entre una industria y otra. A partir de esta información determinamos que la cantidad de establecimientos de la muestra sería 400 (el total de los costos de recopilación de datos dividido por el costo promedio por establecimiento). Si la industria de la cual extraemos la muestra representa el 1,0% de la producción total del sector, afijaremos cuatro establecimientos a dicha industria (400 x 0,01) y procederemos a extraer la muestra del marco. Supongamos que el marco muestral proporciona la información que se exhibe en el cuadro 5.1.

Cuadro 5.1.Primer paso de selección de la muestra de establecimientos
Identificador del establecimientoTamaño (valor de producción en millones)Tamaño acumuladoPorcentaje acumulado
E20020034
C10030052
D8038066
B6044076
G5049084
F4053091
H3056097
A20580100

El intervalo de muestreo se calcula de la siguiente manera:

5.68 Todos los establecimientos cuyos valores de producción son mayores al intervalo de muestreo (145) tienen un 100% de probabilidad de selección y se los llama “unidades seleccionadas con certeza” (establecimiento E). Estas unidades seleccionadas se eliminan del marco y se recalcula el tamaño acumulado para obtener un nuevo intervalo de muestreo mediante la utilización del marco reducido y las restantes unidades muestrales que se afijarán (como se muestra en el cuadro 5.2).

Cuadro 5.2.Segundo paso de selección de la muestra de establecimientos
Identificador del establecimientoTamaño (valor de producción en millones)Tamaño acumulado
C100100
D80180
B60240
G50290
F40330
H30360
A20380

5.69 Si en la muestra reducida hay nuevas unidades seleccionadas con certeza, estas se eliminan (no ocurre esto en el caso que nos ocupa) y se repite el procedimiento hasta calcular un intervalo de muestreo en el que no haya unidades seleccionadas con certeza. Luego se utiliza este intervalo para el muestreo sistemático. El resto de la muestra se ordena (de mayor a menor como en el cuadro 5.3) y se genera un número aleatorio entre 0 y 1, se multiplica este número por el intervalo de muestreo a fin de obtener el punto de partida para el patrón de muestreo.

Cuadro 5.3.Tercer paso de selección de la muestra de establecimientos
Identificador del establecimientoTamaño (valor de producción en millones)Tamaño acumulado
C100100
D80180
B60240
G50290
F40330
H30360
A20380

Número aleatorio = 0,34128

Punto de partida: 0,34128 × 127 = 43

Patrón de muestreo:

43(43 + 127)(43 + 127 + 127)
43170297

Así quedan seleccionados los establecimientos C, D y F, con lo cual se obtiene una muestra total compuesta por C, D, E y F.

5.70 Las ponderaciones asignadas a cada establecimiento serían las siguientes. El establecimiento E tendrá una ponderación de 200. Fue seleccionado con certeza y mantendrá este valor de ponderación porque en la muestra se representa a sí mismo. Los establecimientos C, D y F tendrán una ponderación de 127 cada uno porque representan a los demás establecimientos no seleccionados en la muestra. Así, el total de estas ponderaciones debe ser igual al total de todos los establecimientos que no fueron seleccionados con certeza, los que en este ejemplo suman 380. En las secciones D y E del capítulo 4 se examinan en mayor detalle la fuente de las ponderaciones y los métodos para asignarlas proporcionalmente a los productos dentro de los establecimientos.

5.71 En algunos países se utiliza un enfoque distinto, que emplea muestras por valores umbral a fin de alcanzar cierto nivel de producción o ventas. Por ejemplo, puede necesitarse una muestra que represente el 70% de la producción de cada industria de la muestra. En ese caso se utiliza una muestra por valores umbral. Los establecimientos del marco muestral de industrias se ordenan por producción (de mayor a menor). Se calcula el porcentaje de producción que cada establecimiento representa en el total de la industria. Luego se deriva el porcentaje acumulado. Se establece un valor umbral del 70%, con lo cual todos los establecimientos que se hallan por debajo del umbral se descartan y la muestra abarca los establecimientos restantes. Este enfoque garantiza que la muestra esté formada por establecimientos grandes.

5.72 Si en el ejemplo anterior se utilizara el procedimiento de valores umbral, se seleccionarían los establecimientos E, C, D y B porque su porcentaje de producción acumulada es 76.

E.2 Inclusión de nuevos establecimientos

5.73 Incluir un nuevo establecimiento significa lograr la colaboración de su personal (en especial si la encuesta es voluntaria) para que los datos sean de alta calidad. Se recomienda especialmente visitar cada establecimiento en persona para explicar el propósito y la utilidad de la encuesta de precios y para seleccionar las transacciones o variedades cuyos precios se registrarán. Durante la visita también pueden recopilarse datos complementarios para calcular las ponderaciones de las transacciones. Resulta más eficaz desarrollar estas tareas mediante visitas personales que por teléfono o por correo.

E.3 Selección de productos y transacciones en el establecimiento

E.3.1 Procedimientos de muestreo probabilístico y muestreo por valores umbral

5.74 El enfoque probabilístico también puede utilizarse para seleccionar productos y transacciones a partir de información de los registros del establecimiento. Sin embargo, ya en el establecimiento, el encuestado puede negarse a proporcionar registros detallados, necesarios para seleccionar productos y transacciones. Una posibilidad es solicitarle que proporcione un listado de los productos fabricados y estime el porcentaje que representa cada uno en el total de las ventas. Esta información puede utilizarse para seleccionar la muestra ordenando los productos de mayor a menor y efectuando luego una selección mediante las técnicas ya analizadas.

5.75 Otra posibilidad, en el caso de que el encuestado se niegue a informar los porcentajes de los productos, es solicitarle que ordene los productos según su importancia, lo cual permitirá estimar los porcentajes. Consideremos la información del cuadro 5.4 brindada por el encuestado de un establecimiento con ocho productos, que logró ordenarlos de acuerdo a su importancia. Luego a cada producto se asigna una importancia en el sentido inverso a su orden de aparición: al producto G se asigna 5, al producto H se asigna 4 y así sucesivamente. Seguidamente se calcula el porcentaje estimado de ventas utilizando la importancia de cada producto como porcentaje del total de la importancia asignada. Supongamos que el diseño muestral indica que se necesitan tres productos de este establecimiento. Estos porcentajes se utilizan para seleccionar una muestra de productos mediante los procedimientos de muestreo probabilístico ya descritos o de muestreo por valores umbral.

Cuadro 5.4.Selección de productos con el método de clasificación por orden de importancia
ProductoOrdenImportanciaPorcentaje estimadoPorcentaje acumulado
G153333
H242760
I332080
J421393
K517100
Total15100

5.76 Si se utilizan procedimientos probabilísticos, primero se precisa calcular el intervalo de muestreo:

Intervalo de muestreo = 100/3 = 33.

Se selecciona un número aleatorio para determinar el punto de partida y el patrón de muestreo:

Número aleatorio = 0,45814

Punto de partida = 0,45814(33) = 15

Patrón de muestreo = 15, 48 (15 + 33) y 81 (48 + 33)

La muestra seleccionada estará conformada por los productos G, H y J. (Obsérvese que no seleccionamos el producto I porque está por debajo del tercer intervalo del patrón de muestreo.)

5.77 De aplicarse el procedimiento por valores umbral, se seleccionarán los primeros tres productos (G, H e I). Mediante este procedimiento se seleccionan los tres productos más importantes.

5.78 Asimismo, deben identificarse transacciones representativas que permitan determinar el precio en forma continua. Debe solicitarse al encuestado información acerca de diversas transacciones que correspondan a los productos seleccionados. Nuevamente, los datos pueden consistir en valores reales tomados de los registros de la empresa, porcentajes estimados o clasificación según importancia. Si se requieren dos transacciones por producto, para seleccionarlas se adoptarán los mismos procedimientos (ya descritos) para ambas transacciones.

5.79 En los ejemplos anteriores, si el encuestado no brinda información alguna o afirma que todos los productos son igualmente importantes, se asignará la misma probabilidad a todos. En este caso, se atribuiría idéntica importancia a cada producto o transacción (es decir, 100 dividido por la cantidad de productos) y el procedimiento de selección proseguiría como se expuso anteriormente.

E.3.2 Muestreo dirigido

5.80 Como la selección se basará principalmente en el criterio discrecional de los integrantes del personal del establecimiento presentes en la reunión de inclusión (los encuestados), es importante que estas personas sean expertos y ocupen cargos jerárquicos, por ejemplo en los departamentos de comercialización, ventas o contabilidad.

5.81 El primer paso consiste en estratificar según los productos elaborados por el establecimiento seleccionado para la muestra industrial. Como pauta general, conviene seleccionar entre 3 y 10 estratos de productos (según el tamaño del establecimiento) que se consideren representativos de su producción. Debería poder obtenerse una cifra o estimación de ventas para cada estrato o, al menos, ordenar los estratos por tamaño. Si las exportaciones del establecimiento constituyen más del 20% del total de sus ventas y se considera que los precios de exportación varían en forma diferente a los precios del mercado interno, idealmente los estratos de productos deberían estratificarse a su vez entre exportaciones y mercado interno. Si fuera necesario, los precios de exportación y los del mercado interno deberían recopilarse por separado.

5.82 A continuación habrá que elegir una o dos transacciones específicas para cada estrato, teniendo en cuenta la regla general de que la cantidad promedio de precios por establecimiento debe rondar entre 4 o 5 y que ningún establecimiento debe suministrar más de 15 o 20 precios (si la cantidad resulta demasiado grande, puede ser necesario combinar estratos). El objetivo es elegir transacciones y condiciones de venta que den cuenta de una parte sustancial de las ventas, que sean representativas de otros tipos de producción y que se espere que, en futuras recopilaciones de precios, los productos involucrados estén disponibles para la venta o se mantengan en producción.

5.83 Podría determinarse la ponderación de cada transacción seleccionada mediante la afijación proporcional de la ponderación del establecimiento a cada producto y cada transacción seleccionados. Este procedimiento se analiza en la sección E del capítulo 4.

E.4 Registro de las especificaciones de los productos

5.84 Una vez seleccionadas las transacciones, es necesario analizar cuidadosamente las características que influyen en la determinación del precio y registrarlas en el formulario de recopilación de datos. (Véanse más detalles acerca del registro de las especificaciones del producto en el capítulo 6.) Los siguientes son ejemplos de estas características:

Especificaciones de los productos:

  • Tipo de producto.
  • Marca o número de modelo.
  • Principales características que influyen en la determinación del precio: tamaño, peso, potencia, etc.

Especificaciones de las transacciones para el IPP:

  • Tipo de comprador: exportador, mayorista, minorista, fabricante, gobierno.
  • Tipo de contrato: entrega única o entregas múltiples, órdenes, plazo anual, volumen acordado.
  • Unidad de medida: por unidad, por metro, por tonelada.
  • Volumen de la entrega: cantidad de unidades.
  • Condiciones de entrega: precio libre a bordo, venta que incluya o no la entrega al cliente.
  • Tipo de precio: promedio, de lista, precio libre a bordo, neto de descuentos.
  • Tipo de descuento: estacional, por cantidad, por pago en efectivo, competitivo, comercial.

F. Mantenimiento y rotación de la muestra

5.85 Las encuestas de precios son encuestas de panel en el sentido de que los datos se recopilan de los mismos establecimientos más de una vez. Los problemas de estas encuestas surgen porque el panel se agota, a medida que los establecimientos dejan de producir, o se torna cada vez menos representativo a medida que el tiempo pasa y se modifica el universo; además, algunos establecimientos pueden resentirse por tener que responder a la encuesta y abandonan el panel o brindan información de poca calidad. Todos estos problemas generan sesgos.

5.86 Un método muy difundido para mitigar algunos de estos problemas es limitar el tiempo de permanencia de los establecimientos en el panel recurriendo a alguna forma de rotación7. La rotación presenta dos ventajas principales: i) asegura que la mayoría de los productores participen de la encuesta por un tiempo limitado y que, por lo tanto, la carga se distribuya entre distintas empresas y ii) ayuda a aliviar los problemas generados por una muestra desactualizada, a saber, el agotamiento de la muestra y su falta de representatividad de las tendencias actuales. La inclusión de nuevos establecimientos contribuye a garantizar la representación de nuevos productos en las encuestas de precios.

F.1 Métodos de rotación de la muestra

5.87 Desde luego, rotar la muestra es costoso, pues es necesario incluir nuevos miembros en el panel. Existen varias opciones en cuanto al método de rotación. En primer lugar, debe fijarse la tasa de rotación. Por ejemplo, si se rotara todo el panel cada cinco años, la tasa anual de rotación sería del 20%. Ello podría ejecutarse dividiendo las categorías industriales en cinco grupos y asignando un grupo por año. O bien cada año podría descartarse el 20% de los encuestados de todas las industrias y buscar reemplazos. El ciclo de rotación de un establecimiento podría relacionarse con su tamaño, de manera que los establecimientos grandes permanecieran en la muestra por más de cinco años y los más pequeños por menos tiempo.

5.88 La rotación de la muestra por grupo industrial, grupo de productos o ubicación geográfica constituye una excelente oportunidad para revisar el diseño muestral y reasignar y seleccionar nuevos establecimientos si fuera necesario. La rotación y la revisión de la muestra son más compatibles con un sistema de encadenamiento anual en el cual la estructura y las ponderaciones de los productos pueden actualizarse todos los años8.

F.2 Procedimientos para introducir una nueva muestra de establecimientos

5.89 Los procedimientos utilizados para introducir una nueva muestra de establecimientos son similares al procedimiento de superposición que se aplica para encadenar observaciones de precios de reemplazo o introducir una nueva estructura de productos en una actualización de ponderaciones. Supongamos que la estrategia de rotación requiere reemplazar el 20% de todas las industrias. Si la muestra del IPP consiste en 100 industrias de cuatro dígitos, todos los años la oficina de estadística reemplazará las muestras en 20 industrias. En cada una de las industrias objetivo, la selección de una nueva muestra de establecimientos requiere la elaboración de un marco muestral. El personal debe incluir los establecimientos, según se analizó en la sección E.2.

5.90 La nueva muestra de la industria tendrá nuevas ponderaciones para los establecimientos, productos y transacciones seleccionados. La nueva muestra y sus ponderaciones se utilizarán directamente para reemplazar la muestra anterior. Durante el mismo mes, el personal encargado de la recopilación de datos tendrá que recopilar observaciones de precios tanto para la muestra nueva como para la anterior. Los precios de la muestra anterior se utilizan para calcular el índice del modo habitual, y la muestra nueva proporcionará los precios del nuevo período base para calcular el índice del período siguiente utilizando las nuevas ponderaciones. Por ejemplo, la muestra anterior de una industria determinada comprende cinco establecimientos y 20 observaciones de precios, mientras que la nueva muestra consta de ocho y 32, respectivamente. Las dos muestras se extraen durante el mes de superposición, es decir, 52 observaciones de precios de los 13 establecimientos (suponiendo que ningún establecimiento de la muestra anterior se halle también en la nueva). Las 20 observaciones de la muestra anterior se utilizan para el cálculo del índice del período corriente. Las 32 observaciones de precios de la nueva muestra brindan datos básicos para establecer nuevos precios base en la nueva muestra.

5.91 La elección de la fórmula del índice a utilizar influirá en la relación entre el período de referencia de los precios para las ponderaciones y el período de referencia de los precios base. Si la oficina de estadística compila un índice de Lowe o de Laspeyres, utilizará el primer conjunto de precios recopilados en la nueva muestra para establecer los precios base del índice. Si se utiliza un índice de Laspeyres, el período de referencia de los precios base y el período de referencia de las ponderaciones deben alinearse entre sí. Si el período de referencia de las ponderaciones del establecimiento y las ponderaciones de los productos son, por ejemplo, el ingreso anual del año 2000 y los precios recopilados para la nueva muestra corresponden a junio de 2003, entonces los nuevos precios deberán estimarse retrospectivamente hasta la media anual de 2000. Ello se logra aplicando a las observaciones de precios de junio de 2003 la variación de precios de la industria entre junio de 2003 y el promedio anual de 2000. Por ejemplo, si los precios de la industria subieron un 10% entre el índice promedio anual del año 2000 y el índice de junio de 2003, entonces todas las observaciones de precios se deflactarán por el factor 1,109. Este cálculo ajusta las nuevas observaciones de precios para tener en cuenta la variación de precios promedio de la industria ocurrida entre el período de referencia de las ponderaciones y el período corriente.

5.92 Consideremos un ejemplo similar para el índice de Lowe. También aquí, supongamos que el período de referencia de las ponderaciones corresponde al año 2000 y que el período de referencia de los precios base es diciembre de 2001. En este caso, la oficina de estadística tendrá que actualizar las ponderaciones de las variaciones de precios entre el promedio anual de 2000 y diciembre de 2001. El índice de precios por industria se emplea en el cálculo de la variación de precios entre el año 2000 y diciembre de 2001, y esta variación de precios se aplica a todas las ponderaciones. Luego se ajustan retrospectivamente los precios desde junio de 2003 hasta diciembre de 2001. Para medir la variación de precios entre diciembre de 2001 y junio de 2003 se utiliza el índice de precios por industria. Este relativo de precios se utiliza para deflactar las observaciones de precios de junio de 2003 y así obtener los precios base de diciembre de 200110.

5.93 Si la oficina de estadística utiliza un índice de Young, el procedimiento es mucho más sencillo porque en la elaboración del índice se emplean directamente las nuevas ponderaciones y los nuevos precios sin ningún tipo de ajuste. (Véase un análisis de los índices de Lowe y de Young en las secciones D.2 y D.3 del capítulo 15.)

5.94 Estos procedimientos aseguran que los nuevos precios y ponderaciones guarden coherencia con la fórmula de número índice dentro de cada una de las industrias de cuatro dígitos seleccionadas para rotar la muestra. Para índices de nivel superior, el período de referencia de las ponderaciones puede no ser el mismo que para las industrias afectadas por la rotación de la muestra. En la práctica, las ponderaciones de agregación utilizadas para combinar industria y producto a menudo tienen un período de referencia de precios distinto del período de referencia de los grupos con rotación. Por ejemplo, las ponderaciones de grupos de industrias y de productos utilizadas para producir índices de nivel superior (tres dígitos, dos dígitos, etc.) pueden tener como fecha de referencia el año 2000 porque provienen de un censo de los establecimientos realizado ese año. El período de referencia del índice podría ser también 2000 = 100, debido a una política de la oficina de estadística de cambiar la referencia de los números índice una vez cada cinco años. Por otra parte, las ponderaciones del marco muestral de la industria utilizado para extraer la muestra rotada pueden ser del año 2001, porque las ponderaciones de las industrias rotadas se toman de una encuesta industrial anual (quizá con un suplemento especial para aquellas industrias designadas para la rotación de la muestra). El período de referencia del índice de precios podría ser diciembre de 2002 porque la información de los precios dada por los encuestados de la muestra está disponible fácilmente.

5.95 Así, puede haber una brecha entre el período de referencia de los precios base de la nueva muestra de nivel inferior (el agregado elemental), diciembre de 2002, y el período de referencia del índice para índices de nivel superior, el promedio anual de 2000. En estos casos, la variación de precios con respecto a los índices de nivel inferior se utilizará para trasladar hacia adelante los índices de nivel superior hasta el período corriente. Por ejemplo, en la industria 3411 (fabricación de pulpa, papel y cartón) el nivel del índice en diciembre de 2002 era 108,0 y, en septiembre de 2003, 110,2 con un período de referencia del índice de 2000 = 100. La muestra de 10 establecimientos y 40 observaciones de precios de esa industria se rotó en enero de 2003 utilizando precios base de diciembre de 2002. Los índices elementales de los productos de esta industria tienen como fecha de referencia los precios de diciembre de 2002. Para estimar el índice de la industria, la oficina de estadística tendrá que utilizar la variación de precios de la nueva muestra y encadenarla al índice de nivel superior. Esto se puede realizar de dos maneras, según si la oficina de estadística utiliza una fórmula de índice de precios directo o encadenado (véase la sección B.3 del capítulo 9). Supongamos que se utiliza un índice directo en el cual se compara el precio corriente de octubre de 2003 con el precio base de diciembre de 2002, lo que da como resultado un índice de precios de 102,96 (diciembre de 2002 = 100). El relativo de precios de largo plazo (1,0296) multiplicado por el índice de precios de la industria 3411 correspondiente a diciembre de 2002 (108,0) arroja un índice de octubre de 2003 de 111,2. Por el contrario, si se utiliza la fórmula de un índice mensual encadenado, en el cual se comparan los precios de octubre con los de septiembre, el índice de nivel inferior se encadena con el de nivel superior de septiembre de 2003. Supongamos que el relativo de precios mensual era 1,0091 en octubre de 2003. El índice de septiembre de 2003 para la industria 3411 (110,2, donde 2000 = 100) se multiplica por este relativo de precios para obtener un índice de la industria para octubre de 2003 de 111,2. Los resultados arrojados por las fórmulas deberían ser iguales. La ventaja de utilizar la fórmula del índice mensual encadenado es que permite realizar ajustes por calidad, como se analiza en la sección C.3.3 del capítulo 7.

G. Resumen de las estrategias de muestreo para el IPP

5.96 El enfoque respecto de la estrategia de muestreo para elaborar el IPP requiere una serie de pasos a fin de obtener información suficiente y diseñar una encuesta que arroje estimaciones razonables de la variación de precios, todo ello sujeto a la disponibilidad de recursos. A continuación presentamos una secuencia lógica para abordar las cuestiones sobre el muestreo planteadas en este capítulo.

  • i) Fijar los objetivos, usos, cobertura y recursos de la encuesta antes de decidir qué datos se recopilarán, la frecuencia de recopilación y el tipo de muestreo.

5.97 Es importante decidir al inicio del procedimiento el grado de exactitud requerido y si se necesitarán variaciones de precios tanto de la industria como de los productos. También es importante decidir si se elaborarán índices mensuales o trimestrales. Estos a su vez determinarán el nivel de recursos asignado al programa. Si, en cambio, solo se dispone de una cantidad dada de recursos, es posible trabajar con controles de costos para determinar un tamaño de muestra y una frecuencia de recopilación accesibles a expensas de la exactitud.

  • ii) Identificar las fuentes a las que debe recurrirse para desarrollar un marco muestral para seleccionar los establecimientos y productos de los sectores e industrias cubiertos.

5.98 Un registro de empresas actualizado con parámetros de selección apropiados (por ejemplo, códigos industriales y medidas de tamaño) podría servir de fuente para desarrollar marcos muestrales de industrias seleccionadas. También podrían utilizarse para desarrollar el marco muestral muchas de las fuentes de datos de ponderación analizadas en el capítulo 4, que incluyen censos industriales, encuestas y registros administrativos.

  • iii) Emplear técnicas de muestreo probabilístico en la medida de lo posible.

5.99 Si bien lo ideal es utilizar el muestreo probabilístico durante todo el proceso de selección, ello puede no estar completamente al alcance del presupuesto. Una alternativa es recurrir al muestreo por valores umbral en ciertas etapas del proceso, como la selección de las industrias dentro de un sector o la de los productos dentro de los grupos principales. Los marcos muestrales para cada industria o producto pueden establecerse para llevar a cabo el muestreo utilizando técnicas con PPT.

  • iv) Para aumentar la eficiencia de la muestra, utilizar múltiples niveles de estratificación en el diseño muestral.

5.100 En la mayoría de los casos se identificarán tres estratos dentro de la muestra: industria, producto y establecimiento. Sin embargo, la muestra podría ser más eficiente y representativa si se utilizaran más estratos, por ejemplo el tamaño del establecimiento (grande, mediano y pequeño), la región o ubicación (si hubiera diferencias en las tendencias de precios según la ubicación en el país) y la producción para el mercado interno en contraposición con la producción destinada a la exportación (si hubiera diferencias en las tendencias de precios entre estos mercados). Cuando existen distintas tendencias de precios o variabilidad de precios dentro del estrato elegido conviene agregar estratos.

  • v) La muestra de precios debería basarse en transacciones efectivas con una exhaustiva descripción de sus características.

5.101 A menudo existe la tendencia de utilizar precios promedio o valores unitarios (valor de ventas ÷ cantidad vendida) a los fines del IPP. Estos no son verdaderos precios de transacción porque representan el promedio de una cantidad de transacciones en las cuales podría haber diferencias de calidad o de características determinantes del precio. Por lo tanto, es importante seleccionar una muestra de transacciones individuales con una descripción detallada de todas las características que determinan el precio. Estos precios de transacción y sus características luego se observarán a lo largo del tiempo.

  • vi) La inclusión inicial de los establecimientos debería completarse mediante visitas personales.

5.102 La inclusión inicial en la muestra debería realizarse mediante entrevistas personales con los gerentes de los establecimientos a fin de seleccionar transacciones y productos representativos correctamente. Debe explicarse el propósito de la encuesta, así como la necesidad de que haya información periódica de los datos sobre los precios correspondientes a las transacciones seleccionadas.

  • vii) Las muestras de los establecimientos y productos deben mantenerse a lo largo del tiempo para preservar la confiabilidad del IPP. Para ello se requiere un programa de mantenimiento de la muestra y además es conveniente recurrir a la rotación.

Los productos elaborados por los establecimientos frecuentemente varían en función de los cambios de las condiciones de mercado. Además, algunos establecimientos cesan su actividad y aparecen otros nuevos. El tamaño de la muestra del IPP debe mantenerse a lo largo del tiempo para que las estimaciones de la variación de precios sean precisas. Por lo tanto, se necesita un programa que busque mantener la muestra intacta y procure que los productos sigan siendo representativos de la producción corriente tanto en términos de los bienes producidos como de los establecimientos que los producen.

1Estados Unidos posee estimaciones de la varianza para el IPC y, el Reino Unido, para el IPP. En ambos casos, el diseño muestral se realiza antes de tener información sobre las varianzas. Las varianzas resultantes son mayores de lo que serían si se las conociera con antelación al diseño muestral. Una vez calculadas estas primeras varian-zas, pueden utilizarse para mejorar la eficiencia del diseño muestral mediante la reasignación de los estratos de la muestra y la cantidad de observaciones de precios para cada uno de ellos.
2Existen numerosos libros de texto acerca de la teoría y práctica del muestreo. Una obra de consulta frecuente es Cochran (1977), que se consigue en todos los países.
3Véase De Haan, Oppredoes y Schut (1999) que contiene un análisis del muestreo por valores umbral en el IPC.
4Otra alternativa sería que la oficina de estadística desarrollara una muestra al nivel de tres dígitos combinando en un solo grupo todas las industrias de cuatro dígitos de nivel inferior.
5Debe diferenciarse el muestreo en dos etapas, donde primero se selecciona la muestra de establecimientos y luego una muestra de transacciones de cada establecimiento, del muestreo en dos fases, donde se selecciona una muestra de establecimientos que proporciona datos detallados de productos, la cual se utiliza luego como un nuevo marco muestral. Este nuevo marco puede reordenarse y estratificarse con mucha más eficacia que el marco original gracias a la información recopilada en la primera fase.
6No se trata de una aplicación de la técnica de muestreo llamada muestreo por conglomerado, en la cual las unidades se organizan en conglomerados, se seleccionan algunos conglomerados y luego se muestrean todas las unidades contenidas en ellos. En el muestreo por conglomerados estos deben ser internamente heterogéneos respecto de las variables de la encuesta, pues los agrupamientos seleccionados deben ser representativos de los que no se seleccionaron. Aquí, el término conglomerado se utiliza para describir un método para aumentar la eficiencia de la muestra agrupando las unidades homogéneas. Estrictamente hablando, estos conglomerados deberían llamarse “estratos”.
7En muchos países, la rotación se limita a los encuestados más pequeños, para los cuales se supone que responder a encuestas significa una gran carga. Este puede no ser el caso general, por lo cual se recomienda rotar el panel de la muestra en su totalidad.
8Al rotar muestras no es obligatorio actualizar anualmente las ponderaciones; simplemente facilita el proceso porque las ponderaciones se están actualizando para la mayoría de los niveles del índice. Cuando las ponderaciones no se actualizan en forma anual, la rotación de la muestra requiere un sistema de ponderación en dos niveles: ponderaciones fijas para los niveles superiores de agregación a efectos de agregar para obtener los índices de nivel superior y otras ponderaciones para los índices de nivel inferior que se actualizan en forma periódica.
9La oficina de estadística también podría realizar estos cálculos utilizando la información de los índices por producto. Esto requerirá derivar más factores de deflación para los precios base: uno por cada producto de la industria. Luego todas las observaciones se deflactarían por la variación de precios de su índice por producto en lugar de su índice por industria.
10Si se utilizan índices por producto, los cálculos deben realizarse utilizando las variaciones de los índices por producto. Nuevamente, esto implica calcular más variaciones de precios, una por cada producto.

    Other Resources Citing This Publication