Page 54 - REVISTA11
P. 54
la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
del hogar en el levantamiento original, entre otras.
Si se asume que la probabilidad de respuesta depende de alguna combinación lineal
de las covariables disponibles en la muestra original, es posible ajustar un modelo en
que la variable dependiente es D y el vector de covariables se representa como x. Kim
k
y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:
logit(ϕ k )=x k β
donde β es el vector de coeficientes estimado de la regresión logística. Se debe prestar
especial atención a la elección de predictores en el modelo de regresión logística, que
debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
errores estándares más grandes.
Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan
para respondientes y no respondientes de la muestra
k
como d , y habiendo estimado ϕ k
telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:
w k =d k
ϕ k
Utilizar el factor de expansión w k en el cálculo de los estimadores deseados minimizaría el
sesgo de selección que se generó por el cambio de modo de recolección de la información.
Los factores asociados con el sesgo de cobertura pueden no ser los mismos que los
factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes
de propensión como factores de ajuste independientes.
para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
C.
Calibración en dos etapas
área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
del hogar en el levantamiento original, entre otras. para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
del hogar en el levantamiento original, entre otras.dal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados
Särn
por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
Si se asume que la probabilidad de respuesta depende de alguna combinación lineal
Economía, Sociedad y Estadística
Si se asume que la probabilidad de respuesta depende de alguna combinación lineal
la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
de las covariables disponibles en la muestra original, es posible ajustar un modelo en
para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
de las covariables disponibles en la muestra original, es posible ajustar un modelo en
característica de interés en un estudio multipropósito. Los estimadores de calibración
que la variable dependiente es D y el vector de covariables se representa como x. Kim
la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
para determinar el mejor modelo a fin de estimar el patrón de ausencia de respuesta en
que la variable dependiente es D y el vector de covariables se representa como x. Kim
(Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para
k
k
y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
la muestra de respondientes efectivos. A manera de ejemplo, las covariables útiles para
y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
paliar el sesgo generado por el cambio de modo de recolección de la información.
probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:
área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión:
estimar la probabilidad de respuesta pueden incluir el sexo, la edad, el nivel educativo, el
del hogar en el levantamiento original, entre otras. En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta El propósito general del proceso de calibración es D. POSTESTRATIFICACIÓN BASADA EN MODELOS
área y la región geográfica de residencia, el estado de ocupación y el ingreso per cápita
para la encuesta telefónica (s ), es posible calibrarlos a
logit(ϕ k )=x k β
con la información que se utiliza usualmente para calibrar los factores de expansión en un
del hogar en el levantamiento original, entre otras.
logit(ϕ k )=x k β
Si se asume que la probabilidad de respuesta depende de alguna combinación lineal t encontrar un número de restricciones moderado, MULTINIVEL
nivel de la información auxiliar disponible en la muestra
levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
de las covariables disponibles en la muestra original, es posible ajustar un modelo en lineal que permita tener estimaciones aproximadamente
Si se asume que la probabilidad de respuesta depende de alguna combinación
donde β es el vector de coeficientes estimado de la regresión logística. Se debe prestar
donde β es el vector de coeficientes estimado de la regresión logística. Se debe prestar
original (s ), a nivel nacional (u), o por estratos de
donde es el vector de coeficientes estimado de la
que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
que la variable dependiente es D y el vector de covariables se representa como x. Kim m
de las covariables disponibles en la muestra original, es posible ajustar un modelo en
especial atención a la elección de predictores en el modelo de regresión logística, que
especial atención a la elección de predictores en el modelo de regresión logística, que
regresión logística. Se debe prestar especial atención
interés.
después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
k
y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la insesgadas con una varianza menor que la generada En caso de que una oficina de estadística no haya
que la variable dependiente es D y el vector de covariables se representa como x. Kim
debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
a la elección de predictores en el modelo de regresión
nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
k
probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión: con los factores de expansión originales. En general, los utilizado un panel definido por una muestra
y Riddles (2012) muestran que es posible utilizar un modelo basado en el ajuste de la
explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
o por estratos de interés.
logística, que debería funcionar bien si las variables
La primera etapa consiste, por tanto, en encontrar un
probabilidad de respuesta de la muestra telefónica mediante la siguiente expresión: procesos de calibración pueden clasificarse en alguna probabilística de un período anterior, no se podrá
beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
de información auxiliar disponibles son relevantes y
conjunto de pesos calibrados sujetos a la siguiente
errores estándares más grandes. La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos de las siguientes tres categorías: ejecutar ninguna de las opciones anteriores, puesto
logit(ϕ k )=x k β
errores estándares más grandes.
explicativas de la respuesta telefónica; de otra forma, restricción (Särndal, 2007): que no se contará con la información auxiliar necesaria
a la siguiente restricción (Särndal, 2007):
logit(ϕ k )=x k β
donde β es el vector de coeficientes estimado de la regresión logística. Se debe prestar
Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan
Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan
esta metodología no tendrá ningún beneficio para la
para respondientes y no respondientes de la muestra
especial atención a la elección de predictores en el modelo de regresión logística, que a) Calibración con variables continuas, que es el caso para descifrar el mecanismo de respuesta del operativo
k es el vector de coeficient
como d , y habiendo estimado ϕ kes estimado de la regresión logística. Se debe prestar
para respondientes y no respondientes de la muestra
reducción del sesgo (y posiblemente lo exacerbará) y
donde β
k
como d , y habiendo estimado ϕ k
debería funcionar bien si las variables de información auxiliar disponibles son relevantes y en que la calibración se realiza con los totales de telefónico. En estos casos, y como último recurso, es
telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:
especial atención a la elección de predictores en el modelo de regresión logística, que
telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma:
dará como resultado errores estándares más grandes.
explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún variables continuas como ingreso y gasto, entre posible realizar algunos ejercicios empíricos basados en
debería funcionar bien si las variables de información auxiliar disponibles son relevantes y
beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado otras. modelos predictivos para tener una idea de la magnitud
explicativas de la respuesta telefónica; de otra forma, esta metodología no tendrá ningún
w k =d k
w k =d k
errores estándares más grandes. ϕ k En una segunda etapa se deben usar los pesos del sesgo y corregirlo.
beneficio para la reducción del sesgo (y posiblemente lo exacerbará) y dará como resultado
Teniendo en cuenta que los pesos originales de la
ϕ k
errores estándares más grandes.
encuesta telefónica se representan como d , y habiendo
Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan b) Postestratificación con variables categóricas, que
intermedios w para calcular los pesos finales de
k
Utilizar el factor de expansión w k en el cálculo de los estimadores deseados minimizaría el
Utilizar el factor de expansión w k en el cálculo de los estimadores deseados minimizaría el
para respondientes y no respondientes de
estimado
para respondientes y no respondientes de la muestra
Teniendo en cuenta que los pesos originales de la encuesta telefónica se representan 1k es el caso en que la calibración se realiza con los La regresión multinivel con postestratificación (MRP) es
sesgo de selección que se generó por el cambio de modo de recolección de la información.
k
como d , y habiendo estimado ϕ k calibración w de la muestra telefónica, sujetos a la
sesgo de selección que se generó por el cambio de modo de recolección de la información.
telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma: k tamaños poblacionales (basados en proyecciones una técnica útil para predecir un parámetro de interés
4
la muestra telefónica, entonces el factor de expansión
para respondientes y no respondientes de la muestra
siguiente r
Los factores asociados con el sesgo de cobertura pueden no ser los mismos que los estricción:
k
como d , y habiendo estimado ϕ k En una segunda etapa se deben usar los pesos intermedios w 1k para calcular los pesos
Los factores asociados con el sesgo de cobertura pueden no ser los mismos que los
telefónica, entonces el factor de expansión ajustado tomaría la siguiente forma: demográficas o registros administrativos) de dentro de dominios pequeños mediante el modelado
ajustado tomaría la siguiente forma:
de la muestra telefónica, sujetos a la siguiente restricción:
factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
finales de calibración w k
sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes subgrupos de interés. de la media de la variable de interés condicional en
w k =d k
sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes
de propensión como factores de ajuste independientes. los recuentos de postestratificación. Este método fue
w k =d k
de propensión como factores de ajuste independientes.
ϕ k
ϕ k
Utilizar el factor de expansión w k en el cálculo de los estimadores deseados minimizaría el c) Calibración por marginales con variables propuesto inicialmente por Gelman y Little (1997)
sesgo de selección que se generó por el cambio de modo de recolección de la información. categóricas (conocido como raking), que se y ampliado por Park, Gelman y Bafumi (2004). Esta
Utilizar el factor de expansión wk en el cálculo de los
Utilizar el factor de expansión w k en el cálculo de los estimadores deseados minimizaría el
C.
Calibración en dos etapas pueden no ser los mismos que los
C. con el sesgo de cobertura
Los factores asociados Calibración en dos etapas define como una calibración sobre los tamaños técnica es ampliamente utilizada para corregir el sesgo
sesgo de selección que se generó por el cambio de modo de recolección de la información.
estimadores deseados minimizaría el sesgo de selección
Los factores asociados con el sesgo de cobertura pueden no ser los mismos que
factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente los marginales de tablas de contingencia de subgrupos de selección de las encuestas y su objetivo final es
Para asegurar la coherencia entre las cifras oficiales ya publicadas y las que la encuesta
Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados
que se generó por el cambio de modo de recolección de
Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados
sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes de interés. A diferencia de los casos anteriores, estimar un parámetro de interés (totales, medias o
Para asegurar la coherencia entre las cifras oficiales
factores asociados con el sesgo por ausencia de respuesta, por lo que probablemente
telefónica puede producir, es deseable el uso de los estimadores de calibración. Al aplicar
por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
la información. Los factores asociados con el sesgo de
de propensión como factores de ajuste independientes. este enfoque se asegura una estructura inferencial robusta en presencia de la información en esta calibración no se tienen en cuenta los proporciones, entre otros) para todos los estratos
sería beneficioso modelar estos problemas por separado y luego usar los dos puntajes
ya publicadas y las que la encuesta telefónica puede
la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
cobertura pueden no ser los mismos que los factores
de propensión como factores de ajuste independientes. disponible, puesto que se reduce tanto el error de muestreo (aumentando la precisión) tamaños de los cruces, sino solo los tamaños (dominios, categorías o subgrupos) en una población
producir, es deseable el uso de los estimadores de
característica de interés en un estudio multipropósito. Los estimadores de calibración
característica de interés en un estudio multipropósito. Los estimadores de calibración
como el err
asociados con el sesgo por ausencia de respuesta, por or debido a la ausencia de respuesta (eliminando el sesgo).
(Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para marginales; por ende, este método induce menos finita.
(Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para te enfoque se asegura una
calibración. Al aplicar es
lo que probablemente sería beneficioso modelar estos
Calibración en dos etapas
C. paliar el sesgo generado por el cambio de modo de recolección de la información. restricciones.
A manera de ejemplo, un procedimiento de calibración en dos etapas podría utilizar las
paliar el sesgo generado por el cambio de modo de recolección de la información.
estructura inferencial robusta en presencia de la
problemas por separado y luego usar los dos puntajes
C.
siguientes variables de referencia:
Calibración en dos etapas
información disponible, puesto que se reduce tanto
En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta
Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados De manera similar al modelo de calibración en dos
En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta
de propensión como factores de ajuste independientes.
i) En la primera etapa, la calibración de los pesos de la muestra original podría basarse
Särndal y Lundström (2006) afirman que cuando los estudios por muestreo están afectados muestreo (aumentando la precisión) como
el error de
con la información que se utiliza usualmente para calibrar los factores de expansión en un
por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca etapas, para aplicar esta metodología se requiere contar
con la información que se utiliza usualmente para calibrar los factores de expansión en un
en los totales de edad, región, área y sexo, disponibles en proyecciones demográficas
levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
la información auxiliar disponible y que sea eficiente al momento de estimar cualquier con información auxiliar sobre los totales de personas
por la ausencia de respuesta, es deseable tener un sistema de ponderación que reproduzca
el error debido a la ausencia de respuesta (eliminando
levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
robustas (o en los conteos censales, si el último censo es reciente).
C.
CALIBRACIÓN EN DOS ETAPAS
que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
característica de interés en un estudio multipropósito. Los estimadores de calibración según las características de interés; por ejemplo,
la información auxiliar disponible y que sea eficiente al momento de estimar cualquier
que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
el sesgo).
ii) En la segunda etapa, la calibración de los pesos de la muestra telefónica podría basarse
después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
(Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para información censal agregada a nivel de regiones sobre
característica de interés en un estudio multipropósito. Los estimadores de calibración
después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
en las variables indicadas anteriormente, y además en los totales de ingreso per cápita,
nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
Särndal y Lundström (2006) afirman que cuando
paliar el sesgo generado por el cambio de modo de recolección de la información. A manera de ejemplo, un procedimiento de calibración el número total de personas para todas las posibles
nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
(Deville y Särndal, 1992) satisfacen estas condiciones y bien pueden acomodarse para
condición de ocupación, rama de actividad y escolaridad, obtenidos de la publicación
o por estratos de interés.
paliar el sesgo generado por el cambio de modo de recolección de la información.
los estudios por muestreo están afectados por la
o por estratos de interés.
En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta combinaciones de las variables sexo, edad y nivel
en dos etapas podría utilizar las siguientes variables
con los resultados de la encuesta original.
ausencia de respuesta, es deseable tener un sistema
La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos
con la información que se utiliza usualmente para calibrar los factores de expansión en un educativo.
En principio, se dispone de dos fuentes de información auxiliar. Por un lado, se cuenta
La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos
de referencia:
El propósito general del proceso de calibración es encontrar un número de restricciones
de ponderación que reproduzca la información auxiliar
a la siguiente restricción (Särndal, 2007): ). Por otro lado, se dispone de las variables
a la siguiente restricción (Särndal, 2007):
con la información que se utiliza usualmente para calibrar los factores de expansión en un
levantamiento regular (representada como x 1k moderado, que permita tener estimaciones aproximadamente insesgadas con una varianza
que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
levantamiento regular (representada como x 1k ). Por otro lado, se dispone de las variables
menor que
disponible y que sea eficiente al momento de estimar la generada con los factores de expansión originales. En general, los procesos
i.
después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a En la primera etapa, la calibración de los pesos El modelo MRP está compuesto por dos partes: la
que fueron medidas en la muestra original (representadas como x 2k ). Ello implica que,
de calibración pueden clasificarse en alguna de las siguientes tres categorías:
cualquier característica de interés en un estudio
nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u), de la muestra original podría basarse en los primera consiste en el ajuste de un modelo de regresión
después de calcular los pesos para la encuesta telefónica (s t ), es posible calibrarlos a
multipropósito. Los estimadores de calibración (Deville
totales de edad, región, área y sexo, disponibles
o por estratos de interés. i) Calibración con variables continuas, que es el caso en que la calibración se realiza con multinivel sobre la base de la encuesta de hogares y la
nivel de la información auxiliar disponible en la muestra original (s m ), a nivel nacional (u),
y Särndal, 1992) satisfacen estas condiciones y bien
los totales de variables continuas como ingreso y gasto, entre otras.
o por estratos de interés.
La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos en proyecciones demográficas robustas (o en los segunda corresponde a la postestratificación, utilizando
ii) Postestr
pueden acomodarse para paliar el sesgo generado por atificación con variables categóricas, que es el caso en que la calibración se
conteos censales, si el último censo es reciente).
a la siguiente restricción (Särndal, 2007): realiza con los tamaños poblacionales (basados en proyecciones demográficas o los conteos censales. A continuación, se describen los
La primera etapa consiste, por tanto, en encontrar un conjunto de pesos calibrados sujetos
el cambio de modo de recolección de la información.
a la siguiente restricción (Särndal, 2007): registros administrativos) de subgrupos de interés. pasos de la metodología.
iii) Calibración por marginales con variables categóricas (conocido como raking), que se
4 4 En principio, se dispone de dos fuentes de información ii. En la segunda etapa, la calibración de los pesos i. Tanto la característica de interés como las
de la muestra telefónica podría basarse en las
define como una calibración sobre los tamaños marginales de tablas de contingencia
auxiliar. Por un lado, se cuenta con la información variables indicadas anteriormente, y además covariables (demográficas y geográficas) auxiliares
de subgrupos de interés. A diferencia de los casos anteriores, en esta calibración no
que se utiliza usualmente para calibrar los factores de
se tienen en cuenta los tamaños de los cruces, sino solo los tamaños marginales; por
ende, este método induce menos restricciones.
expansión en un levantamiento regular (representada en los totales de ingreso per cápita, condición x son observadas en la encuesta. Se puede asumir
como x ). Por otro lado, se dispone de las variables que de ocupación, rama de actividad y escolaridad, que las covariables definen un conjunto de J
obtenidos de la publicación con los resultados de
1k
D.
fueron medidas en la muestra original (representadas Postestratificación basada en modelos multinivel celdas o postestratos (j=1,...,J). Por ejemplo,
4 como x ). Ello implica que, después de calcular los pesos la encuesta original. se podría considerar que los postestratos están
4 2k En caso de que una oficina de estadística no haya utilizado un panel definido por una conformados por los cruces entre 5 categorías de
muestra probabilística de un período anterior, no se podrá ejecutar ninguna de las opciones
anteriores, puesto que no se contará con la información auxiliar necesaria para descifrar el
54 mecanismo de respuesta del operativo telefónico. En estos casos, y como último recurso, 55
es posible realizar algunos ejercicios empíricos basados en modelos predictivos para tener
una idea de la magnitud del sesgo y corregirlo.
La regresión multinivel con postestratificación (MRP) es una técnica útil para predecir un
parámetro de interés dentro de dominios pequeños mediante el modelado de la media de
la variable de interés condicional en los recuentos de postestratificación. Este método fue
propuesto inicialmente por Gelman y Little (1997) y ampliado por Park, Gelman y Bafumi (2004).
Esta técnica es ampliamente utilizada para corregir el sesgo de selección de las encuestas y
su objetivo final es estimar un parámetro de interés (totales, medias o proporciones, entre
otros) para todos los estratos (dominios, categorías o subgrupos) en una población finita.
De manera similar al modelo de calibración en dos etapas, para aplicar esta metodología
se requiere contar con información auxiliar sobre los totales de personas según las
características de interés; por ejemplo, información censal agregada a nivel de regiones
sobre el número total de personas para todas las posibles combinaciones de las variables
sexo, edad y nivel educativo.
5