![]() ![]() ![]() |
|
USO DE UN MODELO DE REGRESION MULTIPLE PARA DESCRIBIR LOS FACTORES DETERMINANTES DE LA FECUNDIDAD Los modelos de regresión Múltiple son utilizados cuando existe el supuesto b+sico de que una variable dependiente está relacionada con una o más variables independientes (explicativas), cuyas mediciones son realizadas sobre la misma unidad de respuesta. En base al modelo descrito en el anexo 1, se determinó las variables que mejor describen o explican a la variable dependiente (Fecundidad) El objetivo del análisis de regresión, es predecir, en base a la información conocida y valores fijos de las variables independientes, el comportamiento de la variable dependiente en relación a las primeras; y cuando el objetivo no es predecir el valor de las observaciones, sino estudiar el efecto de las variables explicativas, entonces se utiliza para indagar la importancia relativa de cada una de las variables explicativas en el modelo. En diferentes estudios y en la búsqueda de un modelo para "explicar" y proyectar el nivel de la fecundidad, se ha acudido a numerosas variables demogr+ficas, sociales y de política. Los correspondientes análisis, a nivel macro o micro, utilizan generalmente ecuaciones de regresión. Las mismas variables han arrojado diferentes valores explicativos aplicados a poblaciones relativamente semejantes, no pudiéndose decir si se trata de diferencias reales o atribuibles a las Técnicas de análisis, a la calidad o distinta desagregación de los datos, o a otros factores intervinientes. (Elizaga, Juan C. 1977). Un paso inicial en el análisis e regresión múltiple es verificar las respectivas correlaciones de las variables empleadas en el estudio, a fin de determinar, la relación entre ellas, en este caso la variable dependiente (Fecundidad) con las variables independientes (explicativas). Los coeficientes de correlación indican matem+ticamente el grado de asociación entre las variables. Pero, no siempre una alta correlación es determinante para sustentar una dependencia rígida entre las variables, esto fundamentada en la relación entre las variables independientes. El cuadro 17, nos permite visualizar la relación de la variable dependientes: tasa global de fecundidad (TGF), con las variables independientes o explicativas, donde las variables altamente correlacionadas con la fecundidad son: la Mortalidad infantil, educación de la madre, área de residencia Urbana y la disponibilidad de servicios en las viviendas (Agua, Desagüe y Electricidad). En el primer paso del estudio se realizó el análisis estadístico con todo el conjunto de variables empleadas en el estudio, posteriormente se aplicó un método estadístico que permita seleccionar sólo las variables de mayor correlación con la fecundidad. CUADRO N° 17 MATRIZ DE CORRELACIONES PARA MUJERES EN EDAD FERTIL +-----------+---------+---------+---------+---------+--------+------- -+---------+----------+----------+ | VARIABLES | ESTADO | AGUA | M_PISO | DESAGUE | ANALFA |EDUCACION| URBANO | ELECTRIC.|MORTALIDAD| | | CONY. | | TIERRA | | | | | | INFANTIL| +-----------+---------+---------+---------+---------+--------+------- -+---------+----------+----------+ EST. CONY. 1.0000 -0.3510 0.0901 -0.3431 -0.0320 -0.3632 -0.0673 -0.1248 0.2007 AGUA -0.3510 1.0000 0.7588 0.9455 -0.7935 0.9291 0.9183 0.9273 -0.8295 M_PISO- T. 0.0901 0.7588 1.0000 0.7632 -0.9282 0.8354 0.9198 0.9139 -0.7872 DESAGUE -0.3431 0.9455 0.7632 1.0000 -0.7705 0.9127 0.8937 0.9032 -0.8663 ANALFA -0.0320 -0.7935 -0.9282 -0.7705 1.0000 -0.8436 -0.9262 -0.9007 0.8022 EDUCACIO -0.3632 0.9291 0.8354 0.9127 -0.8436 1.0000 0.9150 0.9443 -0.8259 URBANO -0.0673 0.9183 0.9198 0.8937 -0.9262 0.9150 1.0000 0.9722 -0.8523 T_ELEC -0.1248 0.9273 0.9139 0.9032 -0.9007 0.9443 0.9722 1.0000 -0.8242 MORTALI 0.2007 -0.8295 -0.7872 -0.8663 0.8022 -0.8259 -0.8523 -0.8242 1.0000 TGF 0.2220 -0.9113 -0.7814 -0.9000 0.8597 -0.8925 -0.9121 -0.8921 0.8964 ---------------------------------------------------------------------------------------------------------- Es importante tener en cuenta, que, las variables independientes generalmente se sobreponen, porque están fuertemente interrelacionadas y muchas veces se duplican unas con otras, por lo que las tablas univariantes, asociadas con cada variable predictora, no son buenas para medir la importancia de una variable. Este hecho se produce, por que los análisis univariados ignoran la interrelación entre ellas, para medir la importancia relativa de las variables explicativas; confundiendo con variables que contribuyen redundantemente en el análisis, causando un problema de multicolinealidad. Esto es posible de ser observado en el nivel de significancía, (cuadro 18), donde con un nivel de 5% como máximo, indica que las variables no son relevantes en el modelo, es decir su presencia en él, no es de mucha utilidad, tal como sucede con agua y desage que superan el 7%, y electricidad el 5%. CUADRO N° 18 AJUSTE DEL CONJUNTO DE LAS VARIABLES EXPLICATIVAS +--------------------------+-------------------+----------------+ | V. EXPLICATIVA | COEFICIENTES | NIVEL SIG. | +--------------------------+-------------------+----------------+ AGUA 0.00643 0.74160 MATERIAL DE PISO-TIERRA- 0.03412 0.02940 DESAGUE -0.00512 0.73270 ANALFABETISMO 0.05405 0.05420 EDUCACION 0.01141 0.42130 URBANO -0.01768 0.43530 ELECTRICIDAD -0.01540 0.46040 MORTALIDAD 0.01629 0.02470 ESTADO CONYUGAL 0.01801 0.24910 ---------------------------------------------------------------- Para evitar las desviaciones antes mencionadas, se hizo un análisis de selección de las variables explicativas que mejor contribuyan a la explicación de la variación de la fecundidad, para ello, se procedió mediante Técnicas de selección de regresores 1/ a obtener las variables de mayor influencia en la fecundidad. Como se observa en el cuadro 19, dichas variables resultaron ser la mortalidad infantil y la mujeres unidas. Los pesos de beta para la mortalidad infantil fueron de 0.5523 y del estado conyugal de las mujeres (0.4543), determinando que la mortalidad infantil es la variable de mayor peso relativo para explicar los niveles de fecundidad. CUADRO N° 19 AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS +--------------------------+-------------------+------------+ | V. EXPLICATIVA | COEFICIENTES | BETA | +--------------------------+-------------------+------------+ MORTALIDAD 0.0261 0.5523 ESTADO CONYUGAL 0.0320 0.4543 ------------------------------------------------------------ Rý 0.9881 ------------------------------------------------------------ Después de algunos ensayos con el análisis de regresión, y en la búsqueda de la participación de otras variables, se precisó que el estado conyugal, debería ser retirado del análisis, ya que las mujeres casadas o unidas están directamente expuestas a los riesgos de embarazo, de ello su mayor peso o poder explicativo junto a la Mortalidad infantil en la variación de la fecundidad, observado en el cuadro 19; al limitar la intervención de otras variables independientes como en el caso de las características de los servicios de las viviendas, educación, etc. Luego de eliminar la influencia de la variable "estado conyugal" del conjunto de variables explicativas se procedió a un nuevo análisis del conjunto de variables restantes, donde la mala calidad del piso de una vivienda, en este caso piso de tierra y la mortalidad infantil pasan a primer y segundo lugar respectivamente (cuadro 20), seguidos en orden de importancia por electricidad, analfabetismo y en último lugar la educación. Además se observa que los coeficientes del conjunto de variables seleccionadas, tomadas como medida relativa, determina la influencia de cada una de ellas en el modelo, así mismo la proporción de variación explicada por el modelo es del 99.24%. Las dos primeras variables presentan los pesos más significativos de Beta y como ta explican en primer orden los niveles de fecundidad; no por estar directamente relacionados con la fecundidad como si fuera una variable intermedia, sino por ser uno de los indicadores de las condiciones de vida de determinados grupos socio-económicos; pues, la mala calidad de piso (tierra) de una vivienda y los altos niveles de mortalidad infantil, corresponden a familias de escasos recursos económicos y que en su gran mayoría viven en las áreas rurales, urbano marginales, y dentro de la estratificación social corresponden a los estratos sociales mas bajos, como los obreros del sector agrícola y no agrícola, generalmente con necesidades básicas insatisfechas, y donde precisamente se encuentran las tasas más altas de analfabetismo femenino. De lo anterior se deduce que las variables más influyentes en ausencia del estado conyugal son: Piso de Tierra, Mortalidad, Electricidad, Analfabetismo y Educación, esto, de acuerdo a los pesos de los Betas. Ambos modelos o ecuación son significativos. Es decir ambos modelos determinados en los cuadros 19 y 20, tienen su lógica de aceptación para explicar la fecundidad. En el cuadro 20, la variable educación tenía el menor peso entre el conjunto de las cinco variables, por lo que se optó por retirar del modelo; al efectuar un nuevo análisis, se pudo comprobar que la primera variable en explicar el nivel de la fecundidad, en ausencia de la educación, seguía siendo la calidad de material de piso tierra, seguido por mortalidad infantil, analfabetismo y electricidad (cuadro 21), aunque este último, disminuyó en cierto grado su peso relativo o importancia en el modelo, mientras las otras incrementaron su participación, pero mantienen el orden anterior. Como se observa, también los coeficientes indican que cada una de las variables incrementaron su peso, en cuanto a su aporte en explicar la fecundidad. CUADRO N° 20 AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS (SIN CONSIDERAR "ESTADO CONYUGAL") +-------------------------+----------------+-------------+------------+ | V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG | +-------------------------+----------------+-------------+------------+ MORTALIDAD 0.02134 0.4508 0.000 MATERIAL DE PISO-TIERRA- 0.03927 0.5087 0.000 ANALFABETISMO 0.06438 0.2657 0.005 ELECTRICIDAD -0.02636 -0.3655 0.063 EDUCACION (*) 0.00934 0.2027 0.395 ----------------------------------------------------------------------- Rý 0.99207 ----------------------------------------------------------------------- ERROR ESTANDAR 0.00272 ----------------------------------------------------------------------- (*) ESTA VARIABLE FUE TOMADA A CRITERIO, POR CUANTO EXPLICA EN FORMA MAS CLARA LA VARIACION DE LA FECUNDIDAD. Posteriormente, del conjunto de variables determinadas en el cuadro 20, se procedió a eliminar de uno en uno, las variables de menor correlación del modelo determinado, evaluando los cambios ante la eliminación de cada una de ellas, con la finalidad de observar la variación de las variables explicativas. Como se observa en el cuadro 21, el peso de la variable material de piso tierra, ocupa el primer lugar en orden de importancia de las variables explicativas, pero del conjunto de éstas es la de menor correlación con la fecundidad (ver matriz de correlaciones), por ello y con la finalidad de ver la participación de las demás variables se optó por retirar del modelo. El cuadro 22, nos muestra que la mortalidad infantil pasa al primer orden, en ausencia de material de piso tierra, seguido por educación, analfabetismo y en último orden electricidad. Donde la proporción de variación de la variable dependiente es explicada en un 98.5% en relación a las variables independientes, menor al anterior que fue de 99.2 % (cuadro 21). CUADRO N° 21 AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS (SIN CONSIDERAR "EDUCACION") +--------------------------+---------------+------------+--------------+ | V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG | +--------------------------+---------------+------------+--------------+ MORTALIDAD 0.02232 0.47143 0.000 MATERIAL DE PISO-TIERRA- 0.04126 0.53461 0.000 ANALFABETISMO 0.07502 0.30961 0.000 ELECTRICIDAD -0.01708 -0.23690 0.045 ----------------------------------------------------------------------- Rý 0.99217 ----------------------------------------------------------------------- ERROR ESTANDAR 0.002752 ----------------------------------------------------------------------- Este intercambio de posición de las variables independientes (educación), se debe a la correlación existente con el material de piso; que limitaba su poder de explicación, debido a que de alguna manera la condición socio-económica de las familias está reflejada en las características de las viviendas, de esta manera un determinado nivel de educación es la base para la calificación y nivel de ingreso económico de una persona, y a su vez el nivel de ingreso ser la determinante de las condiciones o características de las viviendas. CUADRO N° 22 AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS (SIN CONSIDERAR "MATERIAL DEL PISO") +-----------------------+-----------------+------------+--------------+ | V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG | +-----------------------+-----------------+------------+--------------+ MORTALIDAD 0.02614 0.55215 0.000 ELECTRICIDAD -0.00614 0.08522 0.720 ANALFABETISMO 0.02395 0.09885 0.351 EDUCACION 0.02085 0.45255 0.153 ----------------------------------------------------------------------- Rý 0.98556 ------------------------------------------------------------------------ ERROR ESTANDAR 0.0036 ------------------------------------------------------------------------ Seguidamente, el cuadro 22 muestra a la variable electricidad como el de menor peso o poder explicativo, pero como se observa en el cuadro N° 17 esta variable presentaba una mayor correlación que el analfabetismo, lo que determinó la eliminación de ésta última del modelo, quedando sólo tres variables donde la mortalidad y la educación pasan a participar con los mismos pesos de importancia en el modelo (cuadro 23), seguido por electricidad. El conjunto de estas tres variables mantienen la proporción de variación de explicación de la variable dependiente en un 98.6%, con la diferencia qe el error est+ndar es superior al modelo anterior. CUADRO N° 23 AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS (SIN CONSIDERAR "ANALFABETISMO") +--------------------+---------------+---------------+----------------+ | V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG | +--------------------+---------------+---------------+----------------+ MORTALIDAD 0.02906 0.61379 0.000 ELECTRICIDAD -0.01647 -0.22839 0.217 EDUCACION 0.02818 0.61176 0.025 ----------------------------------------------------------------------- Rý 0.98562 ----------------------------------------------------------------------- ERROR ESTANDAR 0.003665 ----------------------------------------------------------------------- Después de observar la articipación simultanea de la mortalidad y educación, se excluyó la variable electricidad (cuadro 24), donde según el coeficiente BETA, la mortalidad infantil es la variable con mayor importancia relativa entre las variables independientes para explicar la variación de la fecundidad, tal como se demostró en la matriz de correlaciones (cuadro 17), de manera similar la educación aparece en segundo orden, manteni‚ndose la proporción de variación explicada de la fecundidad por estas dos variables en un 98.5 %, pero con un alto error estándar, lo que justifica la necesaria participación de otro conjunto de variables socio-económicas y Demográficas para explicar el comportamiento de la fecundidad en un determinado contexto socio-espacial. CUADRO N° 24 AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS (SIN CONSIDERAR "ELECTRICIDAD") +---------------------+----------------+--------------+----------------+ | V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG | +---------------------+----------------+--------------+----------------+ MORTALIDAD 0.03405 0.71923 0.000 EDUCACION 0.01361 0.29551 0.000 ------------------------------------------------------------------------ Rý 0.98523 ------------------------------------------------------------------------ ERROR ESTANDAR 0.003714 ------------------------------------------------------------------------- Finalmente, se consideró sólo la variable "mortalidad infantil" (cuadro 25), la cual, si bien es cierto que explica la variación de la variable dependiente en un 96.8 %, su error est+ndar se incrementa. Estos hechos demuestran, que, en un proceso de análisis de variables explicativas, con una dependiente, es necesario la mayor participación de variables explicativas, a fin de determinar su variación de la forma más aproximada. Ya que, aun siendo la variable de mayor importancia en la determinación de la variación de la fecundidad, ello no implica su sola participación, pues, ésta también puede ser el resumen de la confluencia de otro conjunto de variables Socioeconómicas, Demográficos,Biológicas,etc. como es caso de la mortalidad infantil. CUADRO N° 25 AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS (SIN CONSIDERAR "EDUCACION") +-----------------------+-------------------+--------------+---------------+ | V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG | +-----------------------+-------------------+--------------+---------------+ MORTALIDAD 0.04661 0.98465 0.000 --------------------------------------------------------------------------- Rý 0.96827 --------------------------------------------------------------------------- ERROR ESTANDAR 0.00544 --------------------------------------------------------------------------- De lo anterior, en relación a la mortalidad infantil podemos plantear la siguiente afirmación: "de que una de las razones de mayor peso para una elevada fecundidad en determinadas áreas o zonas de muestro país, es que las parejas temen que varios de sus hijos mueran a muy temprana edad, por lo que tienen mayor número de hijos, para así asegurar suficientes hijos que sobrevivan y garanticen el bienestar en la vejez de los padres. Por lo tanto, sólo cuando la mortalidad infantil haya descendido a niveles bajos, los padres aceptaran que no es necesario tener un gran número de hijos, para garantizar la supervivencia de unos pocos". A estos mismos resultados llegaron, E. Alcantara y J. Ortiz, en el estudio: "Mortalidad temprana y Fecundidad en el Perú", 1994; con datos de la ENDES I, donde utilizando una metodología distinta, como es el "análisis de Clasificación Múltiple" que es otra forma de análisis multivariado, en la que se relaciona un conjunto de variables explicativas o independientes con una sola variable dependiente, en una tentativa de explicar la variación de ésta última. En el mencionado estudio se incluyó 13 conjuntos de variables, entre las que figuraban las variables contextuales socioeconómicas y biológicas, como dice textualmente.. "se incluyó la variable experiencia en la mortalidad infantil para establecer su relación con la fecundidad, encontrándose que ésta, tanto individualmente como en el conjunto, es la que mejor explica la varianza de la fecundidad...Los tres coeficientes eta más altos son: orden de nacimiento, experiencia de mortalidad infantil y educación de la madre. Calculando las eta, vemos que estas variables explican individualmente el comportamiento de la fecundidad de la siguiente manera: 35% el orden de nacimiento; 27% la experiencia en la mortalidad infantil y 23% la educación de la madre..." |
![]() ![]() ![]() |