Page 54 - REVISTA11
P. 54

la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
                                                estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
                                                área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
                                                del hogar en el levantamiento original, entre otras.
                                                Si se asume que la probabilidad de respuesta depende de alguna combinación lineal
                                                de las covariables disponibles en la muestra original, es posible ajustar un modelo en
                                                que la variable dependiente es D  y el vector de covariables se representa como x. Kim
                                                                           k
                                                y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
                                                probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:
                                                                              logit(ϕ k )=x k  β
                                                donde β  es el vector de coeficientes estimado de la regresión logística. Se debe prestar
                                                especial atención a la elección de predictores en el modelo de regresión logística, que
                                                debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
                                                explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
                                                beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
                                                errores estándares más grandes.
                                                Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan
                                                                             para respondientes y no respondientes de la muestra
                                                      k
                                                como d ,  y habiendo estimado ϕ k
                                                telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:
                                                                                 w k =d k
                                                                                     ϕ k
                                                Utilizar el factor de expansión w k  en el cálculo de los estimadores deseados minimizaría el
                                                sesgo de selección que se generó por el cambio de modo de recolección de la información.
                                                Los factores asociados con el sesgo de cobertura pueden no ser los mismos que los
                                                factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
                                                sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes
                                                de propensión como factores de ajuste independientes.
 para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
          para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
 la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
          la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
 estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
          estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
                                                C.
                                                       Calibración en dos etapas
 área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
          área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
 del hogar en el levantamiento original, entre otras.  para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
          del hogar en el levantamiento original, entre otras.dal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados
                                                Särn
                                                por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
 Si se asume que la probabilidad de respuesta depende de alguna combinación lineal
         Economía, Sociedad y Estadística
          Si se asume que la probabilidad de respuesta depende de alguna combinación lineal
                                                la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
 de las covariables disponibles en la muestra original, es posible ajustar un modelo en
 para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
          de las covariables disponibles en la muestra original, es posible ajustar un modelo en
                                                característica de interés en un estudio multipropósito. Los estimadores de calibración
 que la variable dependiente es D  y el vector de covariables se representa como x. Kim
 la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
 para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
          que la variable dependiente es D  y el vector de covariables se representa como x. Kim
                                                (Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para
                        k
                                     k
 y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
 estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
 la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
          y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
                                                paliar el sesgo generado por el cambio de modo de recolección de la información.
 probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:
 área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
          probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:
 estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
 del hogar en el levantamiento original, entre otras.  En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta   El propósito general del proceso de calibración es   D.   POSTESTRATIFICACIÓN BASADA EN MODELOS
 área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
                                                            para la encuesta telefónica (s ), es posible calibrarlos a
                           logit(ϕ k )=x k  β
                                                con la información que se utiliza usualmente para calibrar los factores de expansión en un
 del hogar en el levantamiento original, entre otras.
                                        logit(ϕ k )=x k  β
 Si se asume que la probabilidad de respuesta depende de alguna combinación lineal   t                                               encontrar un número de restricciones moderado,          MULTINIVEL
                                                            nivel de la información auxiliar disponible en la muestra
                                                levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
 de las covariables disponibles en la muestra original, es posible ajustar un modelo en  lineal                                      que permita tener estimaciones aproximadamente
 Si se asume que la probabilidad de respuesta depende de alguna combinación
 donde β  es el vector de coeficientes estimado de la regresión logística. Se debe prestar
          donde β  es el vector de coeficientes estimado de la regresión logística. Se debe prestar
                                                            original (s ), a nivel nacional (u), o por estratos de
          donde   es el vector de coeficientes estimado de la
                                                que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
 que la variable dependiente es D  y el vector de covariables se representa como x. Kim   m
 de las covariables disponibles en la muestra original, es posible ajustar un modelo en
 especial atención a la elección de predictores en el modelo de regresión logística, que
          especial atención a la elección de predictores en el modelo de regresión logística, que
          regresión logística. Se debe prestar especial atención
                                                            interés.
                                                después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
                    k
 y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la                                               insesgadas con una varianza menor que la generada   En caso de que una oficina de estadística no haya
 que la variable dependiente es D  y el vector de covariables se representa como x. Kim
 debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
          debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
          a la elección de predictores en el modelo de regresión
                                                nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
                        k
 probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:                                                 con los factores de expansión originales. En general, los   utilizado un panel definido por una muestra
 y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
 explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
          explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
                                                o por estratos de interés.
          logística, que debería funcionar bien si las variables
                                                            La primera etapa consiste, por tanto, en encontrar un
 probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:                                                 procesos de calibración pueden clasificarse en alguna   probabilística de un período anterior, no se podrá
 beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
          beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
          de información auxiliar disponibles son relevantes y
                                                            conjunto de pesos calibrados sujetos a la siguiente
 errores estándares más grandes.                La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos   de las siguientes tres categorías:         ejecutar ninguna de las opciones anteriores, puesto
                      logit(ϕ k )=x k  β
          errores estándares más grandes.
          explicativas de la respuesta telefónica; de otra forma,   restricción (Särndal, 2007):                                                                                        que no se contará con la información auxiliar necesaria
                                                a la siguiente restricción (Särndal, 2007):
                           logit(ϕ k )=x k  β
 donde β  es el vector de coeficientes estimado de la regresión logística. Se debe prestar
 Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan
          Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan
          esta metodología no tendrá ningún beneficio para la
                          para respondientes y no respondientes de la muestra
 especial atención a la elección de predictores en el modelo de regresión logística, que                                             a)   Calibración con variables continuas, que es el caso   para descifrar el mecanismo de respuesta del operativo
   k es el vector de coeficient
 como d ,  y habiendo estimado ϕ kes estimado de la regresión logística. Se debe prestar
                                       para respondientes y no respondientes de la muestra
          reducción del sesgo (y posiblemente lo exacerbará) y
 donde β
                k
          como d ,  y habiendo estimado ϕ k
 debería funcionar bien si las variables de información auxiliar disponibles son relevantes y                                             en que la calibración se realiza con los totales de   telefónico. En estos casos, y como último recurso, es
 telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:
 especial atención a la elección de predictores en el modelo de regresión logística, que
          telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:
          dará como resultado errores estándares más grandes.
 explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún                                                variables continuas como ingreso y gasto, entre   posible realizar algunos ejercicios empíricos basados en
 debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
 beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado                                               otras.                                        modelos predictivos para tener una idea de la magnitud
 explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
                              w k =d k
                                           w k =d k
 errores estándares más grandes.   ϕ k                      En una segunda etapa se deben usar los pesos                                                                                del sesgo y corregirlo.
 beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
          Teniendo en cuenta que los pesos originales de la
                                               ϕ k
 errores estándares más grandes.
          encuesta telefónica se representan como d , y habiendo
 Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan                                                b)   Postestratificación con variables categóricas, que
                                                            intermedios w  para calcular los pesos finales de
                                              k
 Utilizar el factor de expansión w k  en el cálculo de los estimadores deseados minimizaría el
          Utilizar el factor de expansión w k  en el cálculo de los estimadores deseados minimizaría el
                     para respondientes y no respondientes de
          estimado
                     para respondientes y no respondientes de la muestra
 Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan   1k                                                es el caso en que la calibración se realiza con los   La regresión multinivel con postestratificación (MRP) es
 sesgo de selección que se generó por el cambio de modo de recolección de la información.
 k
 como d ,  y habiendo estimado ϕ k                          calibración w  de la muestra telefónica, sujetos a la
          sesgo de selección que se generó por el cambio de modo de recolección de la información.
 telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:  k                                                      tamaños poblacionales (basados en proyecciones   una técnica útil para predecir un parámetro de interés
              4
          la muestra telefónica, entonces el factor de expansión
                         para respondientes y no respondientes de la muestra
                                                            siguiente r
 Los factores asociados con el sesgo de cobertura pueden no ser los mismos que los estricción:
   k
 como d ,  y habiendo estimado ϕ k              En una segunda etapa se deben usar los pesos intermedios w 1k  para calcular los pesos
          Los factores asociados con el sesgo de cobertura pueden no ser los mismos que los
 telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:                                                         demográficas o registros administrativos) de   dentro de dominios pequeños mediante el modelado
          ajustado tomaría la siguiente forma:
                                                                    de la muestra telefónica, sujetos a la siguiente restricción:
 factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
          factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
                                                finales de calibración w k
 sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes                                                     subgrupos de interés.                         de la media de la variable de interés condicional en
                         w k =d k
          sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes
 de propensión como factores de ajuste independientes.                                                                                                                                  los recuentos de postestratificación. Este método fue
                              w k =d k
          de propensión como factores de ajuste independientes.
                             ϕ k
                                  ϕ k
 Utilizar el factor de expansión w k  en el cálculo de los estimadores deseados minimizaría el                                       c)   Calibración por marginales con variables      propuesto inicialmente por Gelman y Little (1997)
 sesgo de selección que se generó por el cambio de modo de recolección de la información.                                                 categóricas (conocido como raking), que se    y ampliado por Park, Gelman y Bafumi (2004). Esta
          Utilizar el factor de expansión wk en el cálculo de los
 Utilizar el factor de expansión w k  en el cálculo de los estimadores deseados minimizaría el
 C.
    Calibración en dos etapas pueden no ser los mismos que los
          C.  con el sesgo de cobertura
 Los factores asociados   Calibración en dos etapas                                                                                       define como una calibración sobre los tamaños   técnica es ampliamente utilizada para corregir el sesgo
 sesgo de selección que se generó por el cambio de modo de recolección de la información.
          estimadores deseados minimizaría el sesgo de selección
 Los factores asociados con el sesgo de cobertura pueden no ser los mismos que
 factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente  los                                                 marginales de tablas de contingencia de subgrupos   de selección de las encuestas y su objetivo final es
                                                Para asegurar la coherencia entre las cifras oficiales ya publicadas y las que la encuesta
 Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados
          que se generó por el cambio de modo de recolección de
          Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados
 sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes                                                     de interés. A diferencia de los casos anteriores,   estimar un parámetro de interés (totales, medias o
                                                            Para asegurar la coherencia entre las cifras oficiales
 factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
                                                telefónica puede producir, es deseable el uso de los estimadores de calibración. Al aplicar
 por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
          por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
          la información. Los factores asociados con el sesgo de
 de propensión como factores de ajuste independientes.   este enfoque se asegura una estructura inferencial robusta en presencia de la información   en esta calibración no se tienen en cuenta los   proporciones, entre otros) para todos los estratos
 sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes
                                                            ya publicadas y las que la encuesta telefónica puede
 la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
          la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
          cobertura pueden no ser los mismos que los factores
 de propensión como factores de ajuste independientes.   disponible, puesto que se reduce tanto el error de muestreo (aumentando la precisión)   tamaños de los cruces, sino solo los tamaños   (dominios, categorías o subgrupos) en una población
                                                            producir, es deseable el uso de los estimadores de
 característica de interés en un estudio multipropósito. Los estimadores de calibración
          característica de interés en un estudio multipropósito. Los estimadores de calibración
                                                como el err
          asociados con el sesgo por ausencia de respuesta, por or debido a la ausencia de respuesta (eliminando el sesgo).
 (Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para                                                     marginales; por ende, este método induce menos   finita.
          (Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para te enfoque se asegura una
                                                            calibración. Al aplicar es
          lo que probablemente sería beneficioso modelar estos
 Calibración en dos etapas
 C.   paliar el sesgo generado por el cambio de modo de recolección de la información.                                                    restricciones.
                                                A manera de ejemplo, un procedimiento de calibración en dos etapas podría utilizar las
          paliar el sesgo generado por el cambio de modo de recolección de la información.
                                                            estructura inferencial robusta en presencia de la
          problemas por separado y luego usar los dos puntajes
 C.
                                                siguientes variables de referencia:
    Calibración en dos etapas
                                                            información disponible, puesto que se reduce tanto
 En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta
 Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados                                                                                                De manera similar al modelo de calibración en dos
          En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta
          de propensión como factores de ajuste independientes.
                                                i)  En la primera etapa, la calibración de los pesos de la muestra original podría basarse
 Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados  muestreo (aumentando la precisión) como
                                                            el error de
 con la información que se utiliza usualmente para calibrar los factores de expansión en un
 por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca                                                                                               etapas, para aplicar esta metodología se requiere contar
          con la información que se utiliza usualmente para calibrar los factores de expansión en un
                                                  en los totales de edad, región, área y sexo, disponibles en proyecciones demográficas
 levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
 la información auxiliar disponible y que sea eficiente al momento de estimar cualquier                                                                                                 con información auxiliar sobre los totales de personas
 por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
                                                            el error debido a la ausencia de respuesta (eliminando
          levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
                                                  robustas (o en los conteos censales, si el último censo es reciente).
          C.
               CALIBRACIÓN EN DOS ETAPAS
 que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
 característica de interés en un estudio multipropósito. Los estimadores de calibración                                                                                                 según las características de interés; por ejemplo,
 la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
          que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
                                                            el sesgo).
                                                ii)  En la segunda etapa, la calibración de los pesos de la muestra telefónica podría basarse
 después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
 (Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para                                                                                                   información censal agregada a nivel de regiones sobre
 característica de interés en un estudio multipropósito. Los estimadores de calibración
          después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
                                                  en las variables indicadas anteriormente, y además en los totales de ingreso per cápita,
 nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
          Särndal y Lundström (2006) afirman que cuando
 paliar el sesgo generado por el cambio de modo de recolección de la información.  A manera de ejemplo, un procedimiento de calibración                                                 el número total de personas para todas las posibles
          nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
 (Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para
                                                  condición de ocupación, rama de actividad y escolaridad, obtenidos de la publicación
 o por estratos de interés.
 paliar el sesgo generado por el cambio de modo de recolección de la información.
          los estudios por muestreo están afectados por la
          o por estratos de interés.
 En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta                                                                                                combinaciones de las variables sexo, edad y nivel
                                                            en dos etapas podría utilizar las siguientes variables
                                                  con los resultados de la encuesta original.
          ausencia de respuesta, es deseable tener un sistema
 La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos
 con la información que se utiliza usualmente para calibrar los factores de expansión en un                                                                                             educativo.
 En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta
          La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos
                                                            de referencia:
                                                El propósito general del proceso de calibración es encontrar un número de restricciones
          de ponderación que reproduzca la información auxiliar
 a la siguiente restricción (Särndal, 2007): ). Por otro lado, se dispone de las variables
          a la siguiente restricción (Särndal, 2007):
 con la información que se utiliza usualmente para calibrar los factores de expansión en un
 levantamiento regular (representada como x 1k  moderado, que permita tener estimaciones aproximadamente insesgadas con una varianza
 que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
 levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
                                                menor que
          disponible y que sea eficiente al momento de estimar la generada con los factores de expansión originales. En general, los procesos
                                                            i.
 después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a  En la primera etapa, la calibración de los pesos                                           El modelo MRP está compuesto por dos partes: la
 que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
                                                de calibración pueden clasificarse en alguna de las siguientes tres categorías:
          cualquier característica de interés en un estudio
 nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),  de la muestra original podría basarse en los                                         primera consiste en el ajuste de un modelo de regresión
 después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
          multipropósito. Los estimadores de calibración (Deville
                                                                totales de edad, región, área y sexo, disponibles
 o por estratos de interés.                     i)  Calibración con variables continuas, que es el caso en que la calibración se realiza con                                            multinivel sobre la base de la encuesta de hogares y la
 nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
          y Särndal, 1992) satisfacen estas condiciones y bien
                                                  los totales de variables continuas como ingreso y gasto, entre otras.
 o por estratos de interés.
 La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos  en proyecciones demográficas robustas (o en los                                            segunda corresponde a la postestratificación, utilizando
                                                ii)  Postestr
          pueden acomodarse para paliar el sesgo generado por atificación con variables categóricas, que es el caso en que la calibración se
                                                                conteos censales, si el último censo es reciente).
 a la siguiente restricción (Särndal, 2007):      realiza con los tamaños poblacionales (basados en proyecciones demográficas o                                                         los conteos censales. A continuación, se describen los
 La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos
          el cambio de modo de recolección de la información.
 a la siguiente restricción (Särndal, 2007):      registros administrativos) de subgrupos de interés.                                                                                   pasos de la metodología.
                                                iii) Calibración por marginales con variables categóricas (conocido como raking), que se
 4  4     En principio, se dispone de dos fuentes de información   ii.   En la segunda etapa, la calibración de los pesos                                                               i.   Tanto la característica de interés como las
                                                                de la muestra telefónica podría basarse en las
                                                  define como una calibración sobre los tamaños marginales de tablas de contingencia
          auxiliar. Por un lado, se cuenta con la información   variables indicadas anteriormente, y además                                                                                 covariables (demográficas y geográficas) auxiliares
                                                  de subgrupos de interés. A diferencia de los casos anteriores, en esta calibración no
          que se utiliza usualmente para calibrar los factores de
                                                  se tienen en cuenta los tamaños de los cruces, sino solo los tamaños marginales; por
                                                  ende, este método induce menos restricciones.
          expansión en un levantamiento regular (representada   en los totales de ingreso per cápita, condición                                                                             x son observadas en la encuesta. Se puede asumir
          como x ). Por otro lado, se dispone de las variables que   de ocupación, rama de actividad y escolaridad,                                                                         que las covariables definen un conjunto de J
                                                                obtenidos de la publicación con los resultados de
                1k
                                                D.
          fueron medidas en la muestra original (representadas  Postestratificación basada en modelos multinivel                                                                            celdas o postestratos (j=1,...,J). Por ejemplo,
 4        como x ). Ello implica que, después de calcular los pesos   la encuesta original.                                                                                                 se podría considerar que los postestratos están
 4              2k                              En caso de que una oficina de estadística no haya utilizado un panel definido por una                                                       conformados por los cruces entre 5 categorías de
                                                muestra probabilística de un período anterior, no se podrá ejecutar ninguna de las opciones
                                                anteriores, puesto que no se contará con la información auxiliar necesaria para descifrar el
      54                                        mecanismo de respuesta del operativo telefónico. En estos casos, y como último recurso,                                                                                               55
                                                es posible realizar algunos ejercicios empíricos basados en modelos predictivos para tener
                                                una idea de la magnitud del sesgo y corregirlo.
                                                La regresión multinivel con postestratificación (MRP) es una técnica útil para predecir un
                                                parámetro de interés dentro de dominios pequeños mediante el modelado de la media de
                                                la variable de interés condicional en los recuentos de postestratificación. Este método fue
                                                propuesto inicialmente por Gelman y Little (1997) y ampliado por Park, Gelman y Bafumi (2004).
                                                Esta técnica es ampliamente utilizada para corregir el sesgo de selección de las encuestas y
                                                su objetivo final es estimar un parámetro de interés (totales, medias o proporciones, entre
                                                otros) para todos los estratos (dominios, categorías o subgrupos) en una población finita.
                                                De manera similar al modelo de calibración en dos etapas, para aplicar esta metodología
                                                se requiere contar con información auxiliar sobre los totales de personas según las
                                                características de interés; por ejemplo, información censal agregada a nivel de regiones
                                                sobre el número total de personas para todas las posibles combinaciones de las variables
                                                sexo, edad y nivel educativo.
                                                                                                                                                        5
   49   50   51   52   53   54   55   56   57   58   59