Chapter

4. Métodos de la estratificación o del ajuste de la composición

Author(s):
Statistical Office of the European Communities;International Labour Office;International Monetary Fund;Organization for Economic Co-operation and Development;United Nations;World Bank
Published Date:
September 2014
Share
  • ShareShare
Show Summary Details

Índices simples basados en la media o la mediana

4.1 Los indicadores más sencillos de la variación del precio de la vivienda están basados en cierto indicador de la tendencia central respecto de la distribución de los precios de la vivienda vendida en un período, sobre todo la media o la mediana. Dado que las distribuciones de los precios de la vivienda suelen estar positivamente sesgadas (al reflejar predominantemente la naturaleza heterogénea de la vivienda, el sesgo positivo de las distribuciones del ingreso y el límite inferior cero de los precios de las transacciones), por lo general se usa la mediana, no la media. Como no se necesitan datos sobre las características de la vivienda para calcular la mediana, es fácil construir un índice de precios que replique las variaciones de los precios de la vivienda mediana vendida entre uno y otro período. Otro atractivo de los índices basados en la mediana es que son fáciles de comprender.

4.2 Una desventaja importante de los índices simples basados en la mediana es que producen estimaciones ruidosas de la variación de los precios. El conjunto de viviendas efectivamente vendidas en un período —o una muestra del mismo— suele ser pequeño y no es necesariamente representativo del stock total de la vivienda. Por ende, la variación de la combinación de inmuebles vendidos afecta al precio mediano de la muestra mucho más que al precio mediano del stock de viviendas. Por ejemplo, supongamos que una ciudad tiene dos regiones, A y B, y que la región A tiene viviendas más costosas que la región B. Supongamos que la vivienda mediana vendida en 2006 y 2008 corresponde a la región A, en tanto que la vivienda mediana vendida en 2007 corresponde a la región B. Se desprende que el índice basado en la mediana podría registrar un fuerte aumento de 2006 a 2007 y luego una fuerte caída de 2007 a 2008. Un índice tal sería un indicador muy poco fidedigno de lo que está ocurriendo realmente en el mercado de la vivienda. Por lo tanto, un índice basado en la mediana (o media) será una guía muy poco exacta de la variación de los precios cuando hay una variación sustancial de la composición de las viviendas vendidas entre períodos. Si existe una correlación entre los puntos de inflexión de los ciclos de precios de la vivienda y el cambio de composición, la mediana puede resultar especialmente engañosa en los períodos en que se necesita un máximo de exactitud.

4.3 Un problema quizá más grave que el ruido a corto plazo es el error sistemático, o sesgo. Un índice simple basado en la mediana está sujeto a sesgo cuando la calidad del stock de viviendas cambia a lo largo del tiempo. El índice basado en la mediana está sesgado al alza si la calidad promedio mejora con el correr de los años. También puede haber sesgo si ciertos tipos de vivienda se venden con más frecuencia que otros y, al mismo tiempo, exhiben diferentes variaciones de precios. Por ejemplo, cuando las viviendas de calidad superior se venden con más frecuencia y suben más rápido de precio que las viviendas de calidad inferior, puede surgir un sesgo a la baja si el número de ventas por tipo de vivienda no refleja debidamente el número de viviendas que conforman el stock. Esto se identifica a veces como un problema de selección de la muestra. El hecho de que las viviendas transadas generalmente sean una parte pequeña y no necesariamente representativa del stock total de viviendas también puede sesgar otros métodos de elaboración de índices de precios de inmuebles, como el hedónico y el de ventas repetidas (como explican los capítulos 5 y 6).

Estratificación

4.4 La posestratificación de una muestra es una técnica general para reducir el sesgo por selección de la muestra. En el caso de los índices de precios de inmuebles residenciales, la estratificación es la herramienta más sencilla para neutralizar las variaciones de la composición o “combinación de calidad” de los inmuebles vendidos. Por lo tanto, este método se conoce también como ajuste de la composición. La estratificación es necesaria asimismo si los usuarios desean contar con índices de precios para diferentes segmentos del mercado de la vivienda.

4.5 La estratificación consiste sencillamente en separar la muestra total de viviendas en una serie de submuestras o estratos. Una vez elaborado un indicador de la variación de la tendencia central en cada estrato, como un índice de precios basado en la media o la mediana, se suele calcular el IPIR agregado ajustado según la composición como promedio ponderado de los índices de cada estrato. Con M estratos diferentes, el índice ajustado según la composición —que calculan en la práctica distintos países— puede expresarse en la siguiente fórmula matemática:

donde Pm0t es el índice del estrato m que compara el precio medio (mediano) en el período corriente o de comparación t con el precio medio (mediano) en un período anterior o de base 0, y donde wm0 denota la ponderación del estrato m. Las ponderaciones son proporciones del valor correspondientes a los estratos. Están referidas al período base, que suele ser un año (en tanto que los períodos de comparación pueden ser meses o trimestres). Por motivos prácticos, las ponderaciones suelen mantenerse fijas durante varios años, pero mantenerlas fijas durante períodos prolongados no es generalmente una práctica idónea. Más adelante se presentan más detalles sobre las cuestiones vinculadas a la agregación y las ponderaciones en este contexto.

4.6 El tipo de ponderaciones de valor utilizado depende del índice que el IPIR busca estimar. Si su finalidad es hacer un seguimiento de la variación de precios del stock de viviendas, entonces se deben usar obviamente ponderaciones basadas en el stock; es decir, la proporción del valor del stock que les corresponde a los estratos. Si, por el contrario, la meta es un IPIR basado en las ventas o las adquisiciones, entonces se deben aplicar ponderaciones de ventas (gastos)1.

4.7 La eficacia de la estratificación depende de las variables empleadas porque un indicador ajustado según la composición neutraliza solamente los cambios de composición entre los distintos grupos. Por ejemplo, si las ventas de viviendas se separan únicamente de acuerdo con la ubicación, un índice ajustado según la composición neutralizará las variaciones de la composición de los tipos de inmueble entre las ubicaciones definidas. Pero el indicador ajustado según la composición no dará cuenta de las variaciones de la composición de los tipos de inmueble vendidos que no tienen que ver con la ubicación. Además, un índice ajustado según la composición no dará cuenta de las variaciones de la composición de los inmuebles vendidos dentro de cada subgrupo; en este caso, las variaciones de la composición de los inmuebles vendidos dentro de los límites de cada ubicación.

4.8 Una estratificación muy detallada de acuerdo con características de la vivienda como el tamaño de la estructura, el tamaño del terreno, tipo de vivienda, la ubicación y las comodidades incrementará la homogeneidad, reduciendo el problema de la composición en términos de la calidad, aunque probablemente persistirán algunas variaciones. Sin embargo, existe un equilibrio que es necesario tener en cuenta. Al aumentar el número de estratos se reduce el número promedio de observaciones por estrato, y una estratificación muy detallada podría incrementar el error estándar del IPIR global. De más está decir que se puede elaborar un sistema de estratificación detallado únicamente si se conocen, en el caso de todos los datos de la muestra, las características determinantes de los estratos. Otro problema práctico que podría presentarse es que podría resultar difícil obtener datos precisos sobre las ponderaciones (basadas en el stock) de subgrupos pequeños.

4.9 Si se utilizan únicamente variables de estratificación físicas y de ubicación, como las mencionadas arriba, el método de estratificación no neutraliza los cambios de calidad de los distintos inmuebles. Al hablar de cambios de calidad nos referimos al efecto de las renovaciones y remodelaciones incorporadas a los inmuebles en combinación con la depreciación de las estructuras. Esto puede denominarse también “depreciación neta”. La depreciación obviamente depende de la antigüedad de la estructura, aunque las tasas de depreciación pueden variar según los tipos de vivienda o incluso la ubicación. Esa es la razón por la cual la antigüedad de la estructura se mencionó en el capítulo 3 como uno de los atributos de calidad que más influyen en la determinación del precio. En consecuencia, estratificar de acuerdo con la clase de antigüedad puede contribuir a reducir el problema del cambio de calidad.

4.10 Al introducir una clase por antigüedad como otra variable de estratificación, se reduce el número promedio de observaciones por estrato, lo cual puede dar lugar a estimaciones poco fidedignas de las variaciones de precios. En estas circunstancias, las técnicas de regresión hedónica —que se describen en el capítulo 4— generalmente funcionan mejor que la estratificación. Como ya se mencionó, también se necesitará algún tipo de método de regresión hedónica para descomponer el IPIR global en componentes de terreno y estructuras si así lo requieren cualquiera de los objetivos analizados en el capítulo 2. Esa descomposición no se puede lograr con métodos de estratificación.

4.11 Numerosas oficinas estadísticas y otras entidades públicas, incluidos el Departamento de Protección Ambiental del Reino Unido (1982) y la Oficina Australiana de Estadística (ABS, 2006), compilan IPIR ajustados según la composición. Si bien el ajuste de la composición ha recibido relativamente poca atención en los estudios académicos2, existe un creciente corpus dedicado a la segmentación del mercado mediante técnicas estadísticas como el análisis de cúmulos y el análisis factorial; véanse, por ejemplo, Dale-Johnson (1982), Goodman y Thibodeau (2003), y Thibodeau (2003). Estas técnicas en principio podrían servir para definir submercados de vivienda, que podrían utilizarse posteriormente como estratos en la elaboración de un IPIR ajustado según la composición. La Oficina Australiana de Estadística experimentó con este enfoque (ABS, 2005).

4.12Prasad y Richards (2006,2008) propusieron un novedoso método de estratificación y lo sometieron a prueba con el conjunto de datos australiano. Agruparon suburbios de acuerdo con el nivel de precios promedio a largo plazo de las viviendas situadas en esas regiones, en lugar de limitarse a aglomerar regiones geográficas más pequeñas en regiones más grandes. Este método de estratificación estaba específicamente diseñado para neutralizar lo que podría ser la forma más importante de cambio de composición; a saber, variaciones de la proporción de viviendas vendidas en regiones con precios superiores e inferiores en cualquier período3. Obsérvese que emplearon índices de mediana de precios a nivel de estrato. Partiendo de ese estudio, McDonald y Smith (2009) elaboraron un indicador estratificado similar de precios medianos de la vivienda en Nueva Zelandia.

Cuestiones vinculadas a la agregación y la ponderación

Primera etapa de agregación

4.13 La estratificación es un procedimiento que abarca dos etapas: se compilan índices de precios a nivel de estrato y luego se realiza una agregación entre los diversos estratos. Como ya se mencionó, generalmente se utilizan como índices las medianas de los estratos, en particular porque suelen ser más estables que los correspondientes índices de media. Aun así, nos centraremos en las medias, no en las medianas. La teoría convencional de los números índice trata con las cuestiones vinculadas a la agregación; en este caso, la agregación de observaciones de precios de la vivienda dentro de estratos. A diferencia de las medianas, las medias son funciones de agregación, lo cual encaja con la teoría de los números índice. La cuestión que se plantea entonces es qué tipo de media corresponde utilizar.

4.14 El Manual del IPC (2004) contiene recomendaciones sobre la manera de elaborar índices de precios en la primera etapa de agregación si no se cuenta con información sobre las cantidades, y luego en la segunda etapa de agregación cuando se cuente con información tanto sobre el precio como sobre el valor (o la cantidad). En la primera etapa de agregación, el capítulo 20 del Manual del IPC generalmente recomienda utilizar un índice de Jevons (media geométrica no ponderada) para agregar en un índice cotizaciones de precios individuales. Sin embargo, esa recomendación general no puede aplicarse a este contexto.

4.15 Si el objetivo es elaborar un índice de precios de venta de inmuebles residenciales, el concepto adecuado de precio (elemental) en un período t para una celda o un estrato homogéneo en el sistema de estratificación es un valor unitario. Como cada venta de un inmueble residencial viene con su propia cantidad, que es igual a uno, la correspondiente cantidad para esa celda es la suma simple de los inmuebles transados en el período t. Formalmente, podemos expresarlo de la siguiente manera: Supongamos que en el período t se observan N(t, m) ventas de inmuebles en una determinada celda m y que el precio (valor) de venta del inmueble n es igual a Vnt para n = 1, …, N(t, m). Entonces, el precio y la cantidad correctos para la celda m en el período t son:

Este concepto de valor unitario con una definición estrecha es de hecho el que recomienda el Manual del IPC (2004; 356). Si el sistema de estratificación conduce a celdas con una definición que no es suficientemente estrecha, obviamente puede surgir un sesgo de valor unitario, lo cual equivale a decir que puede persistir cierto sesgo por composición de la calidad4.

Segunda etapa de agregación

4.16 La siguiente cuestión que hay que resolver es la fórmula de número índice que corresponde usar para agregar los precios y cantidades elementales en un IPIR global. El Manual del IPC examina esta cuestión a fondo. Se recomienda una serie de fórmulas de número índice, pero una buena alternativa general parece ser el índice de Fisher, ya que se lo puede justificar desde diversos puntos de vista5. El índice de Fisher es la media geométrica de los índices de Laspeyres y Paasche.

4.17 Para ilustrar este planteo, denoten Pt[P1t,,PMt] y Qt[Q1t,,QMt] los vectores de precios y cantidades incluidos en las celdas del período t. El índice de precios de Laspeyres, PLst, que va desde el período s (de base) al período t (de comparación), puede definirse de la siguiente manera:

Obsérvese que la ecuación (4.4) puede reescribirse en la forma de (4.1) si s = 0 con índices de precios de celda PL0t=Pmt/Pm0 y proporciones del valor wm0=Pm0Qm0/Σm=1MPm0Qm0. El índice de precios de Paasche que va del período s al t, PPst, se define de la siguiente manera:

El índice de precios de Fisher correspondiente al período t en relación con el período s, PFst, puede definirse como la media geométrica de (4.4) y (4.5):

Recordemos que todas las cantidades que ocurren en estas tres fórmulas son números de transacciones; es decir, números de precios observados. Por lo tanto, para calcular un índice de Laspeyres, Paasche o Fisher se necesita la misma información.

4.18 Los índices de precios de Laspeyres, Paasche y Fisher definidos por las ecuaciones (4.4), (4.5) y (4.6) son índices de base fija. Por ejemplo, si hay tres períodos de datos sobre ventas, incluido el período base 0, la fórmula de Fisher (4.6) generaría la siguiente serie de números índice para esos tres períodos:

Encadenamiento

4.19 Una alternativa al método de base fija es el encadenamiento. El método de encadenamiento usa los datos de los dos últimos períodos para calcular un índice encadenado de período a período que sirve para actualizar el nivel del índice respecto del período anterior. El encadenamiento generaría, por ejemplo, las siguientes series de números índice de Fisher para los tres períodos:

4.20 El siguiente tema a analizar es si los IPIR deben elaborarse con índices de base fija o en cadena. Tanto el Sistema de Cuentas Nacionales como el Manual del IPC recomiendan el uso de índices en cadena, a condición de que los datos sobre precios que les sirven de base tengan tendencias razonablemente suaves6. Por otra parte, si existe mucha variabilidad en los datos, especialmente cuando los precios fluctúan erráticamente en torno a una tendencia, se recomienda usar índices de base fija. Como las variaciones de precios de los inmuebles suelen ser más bien suaves7, es probable que los índices en cadena den buenos resultados en muchos casos. Sin embargo, habría que experimentar más con datos reales para poder brindar un asesoramiento definitivo sobre el tema. También pueden haber variaciones estacionales de los precios de la vivienda, como lo muestra más adelante el ejemplo de la población holandesa de “A”. También en estos casos es necesario usar con precaución los índices en cadena.

IPIR basados en el stock

4.21 La explicación precedente se refiere a la construcción de un índice de precios basado en las ventas de inmuebles residenciales y un método de estratificación. Ahora bien, ¿cómo elaborar un IPIR que abarque el stock de inmuebles residenciales? Suponiendo que, en cada celda m, los inmuebles vendidos son selecciones aleatorias (o “representativas”) del stock de unidades residenciales definido por la celda m, los precios de valor unitario del período t, Pmt, definidos por (4.2) se pueden utilizar como precios de celda (estimaciones) para un IPIR basado en el stock. Sin embargo, las cantidades Qmt definidas por (4.3) ya no son adecuadas; deben ser reemplazadas por el número (estimados) de unidades residenciales del tipo definido por la celda m que se refieren al stock en el momento t; por ejemplo, Qmt*, para m = 1,…, M. Con estas ponderaciones de la cantidad de población, los demás detalles de la construcción del índice son iguales a los de un IPIR basado en las ventas.

4.22 Para compilar ponderaciones basadas en el stock, es necesario hacer un censo periódico del stock de viviendas con suficientes detalles sobre los inmuebles como para poder descomponerlo en celdas adecuadas del sistema de estratificación en un período base. Si la información sobre la construcción de vivienda nueva y las demoliciones se publica de manera oportuna, se pueden actualizar los datos del censo y efectuar estimaciones del stock de viviendas por celda (Qmt*) de manera oportuna. El IPIR basado en el stock puede elaborarse con un índice de Fisher (en cadena), al igual que en el caso del IPIR basado en las ventas. Por otra parte, si no hay datos actualizados sobre la construcción nueva y las demoliciones, solo es posible construir un índice de Laspeyres de base fija usando datos sobre cantidad tomados del último censo de vivienda publicado (en el período 0, por ejemplo), Q0*=[Q10*,,QM0*], hasta que se den a conocer los resultados de un nuevo censo de vivienda (en el período T, por ejemplo). Por lo tanto, el IPIR de Laspeyres basado en el stock es

t = 0,…, T

4.23 En el capítulo 3 se mencionó que para algunas finalidades es útil contar con un IPIR basado en el stock de viviendas ocupadas por sus propietarios; es decir, excluir la vivienda alquilada. La construcción de un índice de ese tipo sigue los mismos pasos que la de un IPIR que abarque todo el stock de viviendas, excepto que las celdas del sistema de estratificación están limitadas a las viviendas ocupadas por sus propietarios. Esto es posible si el censo de vivienda periódico recoge información que indique si cada unidad residencial está ocupada por sus propietarios o por inquilinos.

4.24 Cabe señalar que la construcción de un IPIR estratificado (basado en el stock o en las ventas) se complica cuando algunas de las celdas del sistema de estratificación permanecen vacías en algunos períodos. Al final de este capítulo, donde presentamos un ejemplo empírico con datos sobre las ventas de viviendas en la población holandesa de “A”, se describe un enfoque de modelos equiparados que puede emplearse si algunas celdas están vacías.

Principales ventajas y desventajas

4.25 Resumimos aquí las principales ventajas y desventajas del enfoque de la mediana o la media con estratificación. Las principales ventajas son:

  • Según las variables de estratificación seleccionadas, el método se adapta al cambio de composición de las viviendas.

  • El método es reproducible, siempre que exista una lista acordada de variables de estratificación.

  • Se pueden elaborar índices de precios para diferentes tipos de vivienda y distintas ubicaciones.

  • El método es relativamente fácil de explicar a los usuarios.

4.26 Las principales desventajas del método de la mediana o la media con estratificación son:

  • El método no puede dar un tratamiento adecuado a la depreciación de las unidades residenciales a menos que la antigüedad de la estructura sea una variable de estratificación.

  • El método no puede dar un tratamiento adecuado a las unidades sometidas a reparaciones o renovaciones de envergadura (a menos que las renovaciones sean una variable de estratificación).

  • El método exige información sobre las características de la vivienda para poder asignar las transacciones de venta a los estratos que corresponda.

  • Si el sistema de clasificación es muy poco granular, las variaciones de la composición afectarán a los índices; es decir, podría surgir un sesgo de valor unitario en los índices.

  • Si el sistema de clasificación es muy granular, los índices de celda pueden verse sujetos a una considerable variabilidad de muestreo debido al tamaño pequeño de las muestras o algunas celdas pueden quedar vacías en algunos períodos, causando dificultades con los números índice.

4.27 Una evaluación global del método de estratificación revela que puede resultar satisfactorio si:

  • Se selecciona un nivel de detalle adecuado.

  • La antigüedad de la estructura es una de las variables de estratificación.

  • No se necesita una descomposición del índice en componentes de estructuras y terreno.

La estratificación puede interpretarse como un caso especial de regresión8. El capítulo 5 describe esta técnica más general, conocida como regresión hedónica cuando se la aplica a la construcción de índices de precios y al ajuste por calidad.

Un ejemplo con datos de la población holandesa de “A”

4.28 Este capítulo concluye con un ejemplo resuelto de la construcción de un índice estratificado usando datos sobre las ventas de viviendas independientes en una población pequeña (unos 60.000 habitantes) de los Países Bajos, denominada “A”, durante 14 trimestres, desde el primer trimestre de 2005 hasta el segundo trimestre de 2008. En los capítulos 5, 6, 7 y 8 se utilizarán los mismos datos para ilustrar los demás métodos de elaboración de índices de precios de la vivienda y las diferencias numéricas que pueden surgir en la práctica9.

4.29 Una unidad residencial tiene una serie de importantes características determinantes del precio:

  • La superficie del terreno del inmueble.

  • La superficie de la estructura; es decir, el tamaño de la estructura construida sobre el terreno que subyace y rodea a la estructura.

  • La antigüedad de la estructura; esto determina (en promedio) cuánto deterioro físico o depreciación ha sufrido la estructura.

  • El grado de renovación que ha experimentado la estructura.

  • La ubicación de la estructura; es decir, su distancia de comodidades como centros comerciales, escuelas, restaurantes y lugares de trabajo.

  • El tipo de estructura; es decir, unidad residencial independiente, vivienda adosada, edificio de apartamentos de poca altura o edificio de apartamentos de mucha altura.

  • El tipo de construcción utilizada para edificar la estructura.

  • Otras características especiales determinantes del precio que marcan una diferencia respecto de las unidades residenciales “promedio” de la misma ubicación general, como piscina, climatización, paisajismo complejo, altura de la estructura o vista a océanos o ríos.

Las variables utilizadas en este estudio pueden describirse de la siguiente manera:

  • Vnt es el precio de venta del inmueble n en el trimestre t en euros.

  • Lnt es la superficie del terreno utilizada para la venta del inmueble n en el trimestre t en metros cuadrados.

  • Snt es la superficie habitable de la estructura utilizada para la venta del inmueble n en el trimestre t en metros cuadrados.

  • Ant es la antigüedad aproximada (en décadas) de la estructura del inmueble n en el trimestre t.

4.30 Como puede observarse, en el presente estudio no se utilizaron todas las características determinantes del precio antes enumeradas. En particular, se prescindió de las últimas cinco. Se dio por supuesto implícitamente que las variaciones intertrimestrales del grado de renovación de las estructuras, la ubicación de la vivienda, el tipo de estructura, el tipo de construcción y otras características determinantes del precio de los inmuebles vendidos en el trimestre no cambiaron lo suficiente como para ser un factor determinante significativo del precio promedio de los inmuebles vendidos una vez que se tienen en cuenta las variaciones del tamaño del terreno, el tamaño de la estructura y la antigüedad de las estructuras10.

4.31 La determinación de los valores de la variable de la antigüedad Ant requiere cierta explicación. Los datos originales se codificaron de la siguiente manera: si la estructura se construyó en 1960–1970, se asignó a la observación la variable indicadora de la década BP=5; 1971–1980, BP=6; 1981–1990, BP=7; 1991–2000, BP=8; 2001–2008, BP=9. En este estudio, la variable de antigüedad se fijó en 9 – BP para una estructura recién construida n en el trimestre t, Ant = 0. Por ende, la variable de antigüedad da la antigüedad (aproximada) de la estructura en décadas.

4.32 Las viviendas con una antigüedad de más de 50 años en el momento de la venta se excluyeron del conjunto de datos. Se excluyeron dos observaciones con precios de venta excepcionalmente bajos (36.000 y 40.000 euros), así como 28 observaciones con terrenos de más de 1200 m2. No se excluyó de la muestra ningún otro valor atípico. Después de esta depuración de los datos, quedaron 2289 observaciones en los 14 trimestres de la muestra; o sea, un promedio de 163,5 ventas de unidades residenciales independientes por trimestre. El precio de venta medio de la muestra global fue 190.130 euros, en tanto que el precio mediano fue 167.500 euros. El tamaño promedio del terreno fue 257,6 m2, y el de la estructura (superficie habitable), 127,2 m2. La antigüedad promedio de los inmuebles vendidos fue de aproximadamente 18,5 años.

4.33 El enfoque de estratificación aplicado a la elaboración de un índice de precios de la vivienda es muy sencillo conceptualmente: para cada una de las características explicativas del precio más importantes, las ventas se dividen en grupos relativamente homogéneos. Por lo tanto, en este caso, las ventas se clasificaron en 45 grupos o celdas, con tres agrupamientos por superficie del terreno L, tres agrupamientos por superficie de la estructura S, y cinco grupos por antigüedad A (en décadas) de la estructura (3 × 3 × 5 = 45 celdas separadas). Una vez clasificadas las ventas trimestrales entre los 45 agrupamientos de ventas, se sumaron las ventas dentro de cada celda en cada trimestre y luego se las dividió por el número de unidades vendidas en esa celda para obtener precios de valor unitario, los precios de celda Pmt. Estos valores unitarios se combinaron a continuación con el número de unidades vendidas en cada celda, Qmt, para formar las p y q usuales que pueden insertarse en una fórmula de número índice bilateral, como las fórmulas ideales de Laspeyres, Paasche y Fisher antes definidas en (4.4)(4.6)11, y extraer un índice estratificado de precios de la vivienda correspondiente a cada uno de estos tipos. Sin embargo, como había solamente alrededor de 163 observaciones en cada trimestre y 45 celdas por llenar, cada celda tenía solo un promedio de más o menos tres observaciones en cada trimestre, y algunas estaban vacías en algunos trimestres. Este problema se abordará más adelante.

4.34 ¿Cómo seleccionar los límites de tamaño de los agrupamientos L y S? Un enfoque consiste en dividir por tres L y S en todo su alcance y crear tres celdas de igual tamaño. Sin embargo, eso concentra un gran número de observaciones en las celdas del medio. Por lo tanto, en el presente estudio se seleccionaron los límites de tamaño de manera tal que aproximadamente 50% de las observaciones caen en las categorías de tamaño intermedio, y alrededor de 25%, en las de tamaño pequeño y grande. En la variable de tamaño del terreno L, los puntos de corte seleccionados fueron 160 m2 y 300 m2, y en la variable de tamaño de la estructura S, 110 m2 y 140 m2. Por lo tanto, si L < 160 m2, la observación caía en la celda de terreno de tamaño pequeño; si 160 m2L < 300 m2, en la de tamaño mediano; y si 300 m2L, en la de tamaño grande. Las probabilidades muestrales resultantes de caer en estas tres celdas L a lo largo de los 14 trimestres eran 0,24, 0,51 y 0,25, respectivamente. Análogamente, si S < 110 m2, la observación caía en la celda de estructura de tamaño pequeño; si 110 m2S < 140 m2, en la de tamaño mediano; y si 140 m2S, en la de tamaño grande. Las probabilidades muestrales resultantes de caer en estas tres celdas S a lo largo de los 14 trimestres eran 0,21, 0,52 y 0,27, respectivamente.

4.35 Como ya se mencionó, los datos utilizados no daban una antigüedad exacta a la estructura; solo indicaban en qué década se la había construido. Por lo tanto, no existía la posibilidad de seleccionar puntos de corte exactos para la antigüedad de la estructura. A = 0 corresponde a las viviendas construidas en 2001–2008; A = 1, en 1991–2000; A = 2, en 1981–1990, A = 3, en 1971–1980; y A = 4, en 1961–1970. Las probabilidades muestrales resultantes de caer en estas cinco celdas a lo largo de los 14 trimestres eran 0,15, 0,32, 0,21, 0,20 y 0,13, respectivamente. Véanse en el cuadro 4.1 las probabilidades muestrales conjuntas de que la venta de una vivienda caiga en una de las 45 celdas.

Cuadro 4.1.Probabilidad muestral de venta en cada celda
LSA = 0A = 1A = 2A = 3A = 4
PequeñoPequeño0,004370,026650,016600,020530,02097
MedianoPequeño0,003490,028400,019660,010920,03888
GrandePequeño0,000870,001750,000440,002180,00612
PequeñoMediano0,012230,052420,042810,020530,00699
MedianoMediano0,032770,092620,088690,079070,02141
GrandeMediano0,007860,023150,010050,014420,01398
PequeñoGrande0,003060,002180,001750,005680,00000
MedianoGrande0,031450,034950,007860,020970,00306
GrandeGrande0,048930,054610,023150,024900,01660
Fuente: Cálculos de los autores basados en datos provenientes del Catastro Holandés.

4.36 El cuadro 4.1 presenta varios aspectos interesantes:

  • Como no se observaron viviendas construidas en la década de 1960 (A = 4) con terreno pequeño (L = pequeño) y estructura grande (S = grande), esta celda está completamente vacía.

  • Muchas celdas están casi vacías; en particular, la probabilidad de venta de un terreno grande con una vivienda pequeña es muy baja, al igual que la probabilidad de venta de un terreno pequeño con una vivienda grande12.

  • El “modelo más representativo” vendido durante el período muestral corresponde a un terreno de tamaño mediano, una estructura de tamaño mediano y una vivienda construida en la década de 1990 (A = 1). La probabilidad mues-tral de que la venta de una vivienda caiga en esta celda de máxima probabilidad es 0,09262.

4.37 El precio de venta promedio de la vivienda representativa —L mediano, S pequeño y A = 1— se ilustra en el gráfico 4.1, junto con el precio medio y mediano de la muestra global en cada trimestre. Estos promedios de precios han sido convertidos en índices que comienzan en 1 en el trimestre 1, el primer trimestre de 2005. Cabe señalar que estos tres índices de precios de la vivienda son bastante variables.

Gráfico 4.1.Índices de precios de Fisher basados en modelos equiparados en cadena y de base fija, índices de precios de media, mediana y modelo representativo

Fuente: Cálculos de los autores basados en datos provenientes del Catastro Holandés.

4.38 El gráfico 4.1 presenta también otros índices, como un índice de Fisher de modelos equiparados de base fija y un índice de Fisher de modelos equiparados en cadena. Es necesario explicar qué significa índice “de modelo equiparado” en este contexto. Si se vendiera como mínimo una vivienda en cada trimestre en cada una de las 45 celdas, los índices de precios ordinarios de Laspeyres, Paasche y Fisher que comparan los precios del trimestre t con los del trimestre s estarían definidos por las ecuaciones (4.4)(4.6) respectivamente, donde M = 45. Este cálculo se aplica cuando hay transacciones en todas las celdas de los dos trimestres comparados. Pero en el caso de este conjunto de datos, en promedio solo unas 30 de las 45 categorías pueden equipararse entre dos trimestres cualesquiera, y es necesario modificar las fórmulas (4.4)(4.6) para solucionar este problema de falta de equiparación. Por lo tanto, para formar una comparación de números índice entre los trimestres s y t es necesario definir el conjunto de celdas m que tienen como mínimo una transacción en el trimestre s y también en el t como el conjunto S(s, t). Entonces, las contrapartes de modelo equiparado, PMLst,PMPst y PMFst, a los índices regulares de Laspeyres, Paasche y Fisher entre los trimestres s y t dadas por (4.4), (4.5) y (4.6) se definen de la siguiente manera13:

En el gráfico 4.1, el índice de Fisher de base fija es el índice de precios de Fisher de modelos equiparados definido por (4.12), en el cual el período base s se mantiene fijo en el trimestre 1; es decir, los índices PMF1,1,PMF1,2,,PMF1,14 se calculan y rotulan como índice de Fisher de base fija, PFFB. El índice rotulado como índice de Fisher de modelos equiparados en cadena, PFCH, es el índice de precios PMF1,1,PMF1,1PMF1,2,PMF1,1PMF1,2PMF2,3,,PMF1,1PMF1,2  PMF13,14. Obsérvese que los índices de Fisher (basados en modelos equiparados) de base fija y en cadena son bastante parecidos y mucho más suaves que los correspondientes índices de media, mediana y modelo representativo14. Los datos de estas cinco series representados en el gráfico 4.1 se enumeran en el cuadro 4.2.

Cuadro 4.2.Índices de precios de Fisher basados en modelos equiparados en cadena y de base fija, índices de precios de media, mediana y modelo representativo
TrimestrePFCHPFFBPMediaPMedianaPRepresentativo
11,000001,000001,000001,000001,00000
21,023961,023961,020031,058061,04556
31,078401,068151,046931,022581,03119
41,040811,048991,050671,032421,04083
51,040831,044441,048781,048391,04564
61,057541,066761,136791,175811,09792
71,073401,073101,064901,069351,01259
81,067061,076841,070561,100001,10481
91,089501,068281,076851,058061,03887
101,114761,118911,166121,160481,07922
111,124711,121961,089521,062901,07217
121,104831,113211,097921,103231,03870
131,104501,110741,108241,129031,12684
141,111891,105771,121601,103231,08587
Fuente: Cálculos de los autores basados en datos provenientes del Catastro Holandés.

4.39 El índice de Fisher basado en modelos equiparados debe considerarse más exacto que los demás índices que solo utilizan un volumen limitado de información disponible sobre precio y cantidad. Como la tendencia de los índices de Fisher es bastante suave, el índice de Fisher en cadena resulta preferible al índice de Fisher de base fija, siguiendo las recomendaciones de Hill (1988, 1993) y del Manual del IPC (2004). Recordemos también que no hay necesidad de usar índices de Laspeyres o de Paasche en esta situación porque los datos sobre las ventas de viviendas contienen información tanto sobre el valor como sobre la cantidad. En esas condiciones, los índices de Fisher son preferibles a los de Laspeyres y Paasche (que no utilizan toda la información disponible sobre precio y cantidad para los dos períodos comparados).

4.40 Dado que existe considerable heterogeneidad en cada celda del sistema de estratificación, hay una gran posibilidad de cierto sesgo de valor unitario en el índice de Fisher de modelos equiparados. Sin embargo, si se hace una estratificación más granular, el grado de equiparación disminuye drásticamente. Ya con la presente estratificación apenas dos tercios de las celdas, aproximadamente, pueden equipararse entre dos trimestres cualesquiera. Es necesario encontrar un equilibrio entre tener demasiadas celdas, con la posibilidad de un sesgo de valor unitario, y tener un sistema de estratificación más detallado, con un grado mucho menor de equiparación de los datos dentro de las celdas entre los dos períodos comparados.

4.41 Como puede observarse en el cuadro 4.2 y el gráfico 4.1, el índice de Fisher en cadena muestra una caída de precios de la vivienda durante el cuarto trimestre de 2005, 2006 y 2007. Es posible que los precios de la vivienda retrocedan por motivos estacionales en el cuarto trimestre del año. Para tener en cuenta esa posibilidad, en la sección siguiente se elabora un índice de Fisher de modelos equiparados que abarca un año móvil.

El tratamiento de la estacionalidad en el ejemplo holandés

4.42 Suponer que cada artículo de cada estación del año es un artículo “anual” separado es el método más sencillo y teóricamente más satisfactorio para abordar los productos estacionales cuando el objetivo es elaborar índices anuales de precio y cantidad. Esta idea se remonta a Mudgett en el contexto de los precios al consumidor y a Stone en el contexto de los precios al productor:

“El índice básico es un índice anual y, como índice de precio o de cantidad, es del mismo tipo de los que han inspirado tantos libros y folletos a lo largo de los años”. Bruce D. Mudgett (1955; 97).

“La existencia de un patrón estacional regular de precios que más o menos se repite año tras año sugiere sin duda que las variedades de un artículo disponibles en distintas estaciones no pueden transformarse en otra variedad sin que ello acarree un costo, y que, por lo tanto, en todos los casos en que las variaciones estacionales de precio son significativas, las variedades disponibles en distintas épocas del año deben tratarse, en principio, como artículos separados”. Richard Stone (1956; 74–75).

Diewert (1983) generalizó el marco anual de Mudgett-Stone para hacer posibles comparaciones de años móviles de 12 meses consecutivos de datos con un año base de 12 meses de datos, o de 4 trimestres consecutivos de datos con un año base de 4 trimestres consecutivos de datos; es decir, la idea básica es comparar el año móvil corriente de datos sobre precio y cantidad con los correspondientes datos de un año base cuyos datos sobre cada estación se comparan15. En el contexto actual, tenemos en principio16 datos sobre precio y cantidad de 45 clases de artículos (viviendas) en cada trimestre. Si la venta de una vivienda en cada estación se trata como un bien separado, hay 180 artículos anuales.

4.43 Para el primer valor de número índice, los cuatro trimestres de datos sobre precios y cantidades de ventas de viviendas independientes en la población de “A” (180 series) se comparan con los mismos datos usando la fórmula ideal de Fisher. Naturalmente, el índice resultante es igual a 1. Para el siguiente valor de número índice, se excluyen los datos del primer trimestre de 2005 y los datos correspondientes al primer trimestre de 2006 se añaden a los datos sobre los trimestres 2–4 de 2005. El índice de Fisher resultante es la segunda entrada en la serie de modelos equiparados de año móvil (RY) que ilustra el gráfico 4.2. Sin embargo, como ocurrió con los índices de Fisher en cadena y de base fija presentados en el gráfico 4.1, no fue posible equiparar todas las celdas usando la metodología del año móvil; es decir, algunas celdas vacías del primer trimestre de 2006 correspondían a celdas del primer trimestre de 2005 que no estaban vacías, y viceversa. Por lo tanto, al construir el índice de año móvil PRY representado en el gráfico 4.2, la comparación entre el año móvil y los datos correspondientes a 2005 estuvo limitada al conjunto de celdas que no estaban vacías en ninguno de los dos años; es decir, los índices de Fisher de año móvil representados en el gráfico 4.2 son índices de modelos equiparados. Los modelos no equiparados se excluyen de la comparación de números índice17.

Gráfico 4.2.Índices de precios de Fisher de año móvil y base fija, de promedio móvil en cadena y de promedio móvil de base fija

Fuente: Cálculos de los autores basados en datos provenientes del Catastro Holandés.

4.44 Los resultados se presentan en el gráfico 4.2. Obsérvese que hay una clara disminución al final del período muestral, pero que las desaceleraciones registradas en los trimestres 4 y 8 del gráfico 4.1 pueden interpretarse como desaceleraciones estacionales; es decir, los índices de año móvil del gráfico 4.2 no disminuyeron hasta el final del período muestral. Obsérvese también que el valor índice de la observación 5 compara los datos del año civil 2006 con los correspondientes datos del año civil 2005 y que el valor índice de la observación 9 compara los datos del año civil 2007 con los correspondientes datos del año civil 2005; es decir, estos valores de índice corresponden a los índices anuales de Mudgett-Stone.

4.45 Construir índices de año móvil de Fisher de modelos equiparados es una tarea bastante laboriosa porque las celdas equiparadas entre dos períodos cualesquiera varían según el período. Un atajo (menos exacto) para desesta-cionalizar una serie, como el índice de Fisher de modelos equiparados en cadena PFCH y el índice de Fisher de base fija PFFB del cuadro 4.2, consiste en tomar sencillamente un promedio móvil de cuatro trimestres de estas series. Las series de año móvil resultantes, PFCHMA y PFFBMA, pueden compararse con las series de año móvil de Mudgett-Stone-Diewert PRY; véase el gráfico 4.2. Los datos que corresponden al gráfico 4.2 figuran en el cuadro 4.3.

Cuadro 4.3.Índices de precios de Fisher de año móvil y base fija, de promedio móvil en cadena y de promedio móvil de base fija
Año móvilPFFBRYPFCHMAPFFBMA
11,000001,000001,00000
21,010781,010211,01111
31,021111,018411,02156
41,021851,017251,02272
51,034531,023551,02936
61,040081,035721,03532
71,052871,049691,04805
81,062451,061591,05948
91,071351,070661,06815
101,080921,074411,07877
111,077741,073711,07556
Fuente: Cálculos de los autores basados en datos provenientes del Catastro Holandés.

4.46 Como puede observarse, un promedio móvil de los índices intertrimestrales de Fisher en cadena y de base fija, PFCH y PFFB, enumerados en el cuadro 4.2, es bastante próximo al índice de año móvil de Fisher de base fija PFFBRY teóricamente preferido. Sin embargo, existen diferencias de hasta 1% entre el índice de año móvil preferido y el índice de promedio móvil. Recordemos que el índice de Fisher de base fija comparaba los datos de los trimestres 1 a 14 con los correspondientes datos del trimestre 1. Por lo tanto, las observaciones de los trimestres 2 y 1, 3 y 1, y 4 y 1, por ejemplo, probablemente no sean tan comparables como los índices de año móvil en que los datos de un trimestre cualquiera siempre están alineados con los datos del correspondiente trimestre del año base. Se aplica un argumento similar al índice de promedio móvil PFCHMA; las comparaciones entre eslabones de este índice son intertrimestrales y tienen pocas probabilidades de ser tan exactas como las comparaciones del mismo trimestre entre distintos años18.

Los índices de precios de la vivienda compilados en la UE como parte de un estudio piloto de Eurostat son ejemplos de estos índices basados en la adquisición (véanse Makaronidis y Hayes, 2006, o Eurostat, 2010).

Sin embargo, los índices estratificados de precios medianos de la vivienda han sido utilizados por varios analistas, mayormente con fines comparativos; véanse, por ejemplo, Mark y Goldberg (1984), Crone y Voith (1992), Gatzlaff y Ling (1994), y Wang y Zorn (1997).

Una regla general es que no debe hacerse una estratificación de acuerdo con la variable de interés porque pueden sesgarse los resultados. La variable de estudio utilizada por Prasad y Richards (2006, 2008) es la variación de precios de la vivienda (a largo plazo), no el nivel de precios de la vivienda, de modo que quizá se podría defender su método de estratificación. Sin embargo, es poco lo que se sabe sobre las propiedades estadísticas de este tipo de índice de estratificación y sería aconsejable examinar el tema del sesgo potencial antes de elaborar un índice de ese tipo.

En la práctica, a menudo se utiliza una estratificación básica de acuerdo con la región y el tipo de vivienda. El método de estratificación de acuerdo con las bandas de precio propuesto por Prasad y Richards (2008) podría servir para reducir el sesgo de valor unitario. Véanse (1998, 2008; 72–74), Silver (2009a, 2009b, 2010) y Diewert y von der Lippe (2010), que contienen análisis más generales del sesgo de valor unitario.

Véase Manual del IPC (2004; capítulos 15–18), que presenta otras justificaciones del uso de la fórmula de Fisher.

Véanse SCN (2008) y Manual del IPC (2004; 349).

Aunque los precios no fluctúan erráticamente en el mercado inmobiliario, las cantidades sí exhiben considerable variabilidad, especialmente si hay un gran número de celdas en la estratificación y un número limitado de observaciones en cada celda. Las cantidades también exhiben variaciones estacionales considerables; es decir, las ventas de inmuebles residenciales disminuyen drásticamente durante los meses de invierno.

Diewert (2003a) muestra que las técnicas de estratificación o el uso de variables ficticias pueden considerarse una técnica de regresión no paramétrica. En la bibliografía estadística, estas técnicas de división o estratificación se conocen como análisis de modelos de varianza; véase Scheffé (1959).

Este material está tomado de Diewert (2010).

Para justificar este supuesto, cabe señalar que los modelos de regresión hedónica descritos en capítulos posteriores dan cuenta sin excepción de 80–90% de la variación de los datos sobre precios usando las tres mismas variables explicativas principales: L, S y A. La R2 entre los precios de venta efectivos y previstos fue de 0,83 a 0,89. El hecho de que no fuera necesario utilizar otras características determinantes del precio con este conjunto de datos en particular podría explicarse quizá porque la población “A” se encuentra ubicada en una zona llana sin accidentes geográficos y tiene un tamaño relativamente pequeño; en otras palabras, la ubicación no es un gran determinante del precio porque todas las localidades gozan de más o menos del mismo acceso a las comodidades.

Los manuales internacionales sobre medición de precios recomiendan este enfoque del valor unitario para elaborar índices de precios en la primera etapa de agregación; véanse Manual del IPC (2004), Manual del IPP (2004) y Manual del IPEI (2009). Sin embargo, la agregación por valor unitario debe realizarse con artículos homogéneos, y esa suposición no puede hacerse en este contexto porque hay considerable variabilidad en L, S y A dentro de cada celda. Pero como existe solo un pequeño número de observaciones en cada celda para el conjunto de datos en estudio, sería difícil introducir más celdas a fin de mejorar la homogeneidad ya que aumentaría la cantidad de celdas vacías y habría una falta de equiparación entre las celdas.

Por lo tanto, el tamaño del terreno y el tamaño de la estructura están positivamente correlacionados con un coeficiente de correlación de 0,6459. Tanto L como S exhiben una correlación bastante elevada con la variable de precio de venta P: la correlación entre P y L es 0,8234, y entre P y S, 0,8100. Estas correlaciones elevadas producen problemas de multicolinealidad en los modelos de regresión hedónica presentados más adelante.

Una justificación de este enfoque aplicado a la falta de equiparación en el contexto de la teoría de números índice bilaterales puede encontrarse en la exposición de Diewert (1980; 498–501) sobre el problema de los bienes nuevos y en desaparición. También son posibles otros enfoques. Para los basados en la equiparación máxima entre todos los pares de períodos; véanse Ivancic, Diewert y Fox (2011) y de Haan y van der Grient (2011) para los basados en métodos de imputación; véase Alterman, Diewert y Feenstra (1999). Un enfoque de imputación útil podría consistir en estimar los precios imputados de las celdas vacías usando regresiones hedónicas. Esa alternativa se verá más adelante, al examinar los diferentes métodos de regresión hedónica.

Las medias (y las desviaciones estándar) de las cinco series mencionadas hasta ahora son: PFCH = 1,0737 (0,0375), PFFB = 1,0737 (0,0370), PMean = 1,0785 (0,0454), PMedian = 1,0785 (0,0510), and PRepresent = 1,0586 (0,0366). Por lo tanto, el índice de precios de modelo representativo tiene una varianza más pequeña que los dos índices de Fisher de modelos equiparados, pero también tiene un sesgo sustancial en comparación con ellos: el índice de precios de modelo representativo está muy por debajo de los índices de Fisher durante la mayor parte del período que abarca la muestra.

Para consultar la teoría y ejemplos de este enfoque de año móvil, véanse los capítulos sobre estacionalidad del Manual del IPC (2004) y del Manual del IPP (2004), Diewert (1998) y Balk (2008; 151–169). Para justificar los índices de año móvil desde el punto de vista del enfoque económico sobre la teoría de números índice, se necesitan algunas restricciones a las preferencias; para más detalle, véase Diewert (1999; 56–61). Cabe señalar que las condiciones meteorológicas y el hecho de que las fechas de la Pascua no son fijas pueden hacer que las “estaciones” varíen y que el enfoque no funcione; véase Diewert, Finkel y Artsev (2009). Sin embargo, con datos trimestrales estas limitaciones del índice de año móvil no tienen tanta importancia.

En la práctica, como vimos en la sección precedente, muchas de las celdas están vacías en cada período.

Hay 11 comparaciones de años móviles que pueden hacerse con los datos disponibles de 14 trimestres. El número de celdas no equiparadas o vacías de los años móviles 2, 3, …, 11 es el siguiente: 50, 52, 55, 59, 60, 61, 65, 65, 66, 67. El número relativamente bajo de celdas no equiparadas o vacías de los años móviles 2, 3 y 4 se debe a que en el año móvil 2, ¾ de los datos están equiparados; en el año móvil 3, ½ de los datos están equiparados; y en el año móvil 4, ¼ de los datos están equiparados.

Cuanto más marcada sea la estacionalidad, más sólido será este argumento a favor de la exactitud del índice de año móvil. La solidez de este argumento puede comprobarse si todas las ventas de viviendas de cada celda resultan ser muy estacionales; es decir, si las ventas de una celda cualquiera ocurren solamente en un trimestre de cada año. Las comparaciones intertrimestrales son obviamente imposibles en esta situación, pero los índices de año móvil estarán perfectamente definidos.

    Other Resources Citing This Publication