|
USO DE UN MODELO DE REGRESION MULTIPLE PARA DESCRIBIR LOS FACTORES
DETERMINANTES DE LA FECUNDIDAD
Los modelos de regresión Múltiple son utilizados cuando existe el
supuesto b+sico de que una variable dependiente está relacionada con una o
más variables independientes (explicativas), cuyas mediciones son
realizadas sobre la misma unidad de respuesta. En base al modelo descrito
en el anexo 1, se determinó las variables que mejor describen o explican a
la variable dependiente (Fecundidad)
El objetivo del análisis de regresión, es predecir, en base a la
información conocida y valores fijos de las variables independientes, el
comportamiento de la variable dependiente en relación a las primeras; y
cuando el objetivo no es predecir el valor de las observaciones, sino
estudiar el efecto de las variables explicativas, entonces se utiliza para
indagar la importancia relativa de cada una de las variables explicativas
en el modelo.
En diferentes estudios y en la búsqueda de un modelo para "explicar"
y proyectar el nivel de la fecundidad, se ha acudido a numerosas variables
demogr+ficas, sociales y de política. Los correspondientes análisis, a
nivel macro o micro, utilizan generalmente ecuaciones de regresión. Las
mismas variables han arrojado diferentes valores explicativos aplicados a
poblaciones relativamente semejantes, no pudiéndose decir si se trata de
diferencias reales o atribuibles a las Técnicas de análisis, a la calidad
o distinta desagregación de los datos, o a otros factores intervinientes.
(Elizaga, Juan C. 1977).
Un paso inicial en el análisis e regresión múltiple es verificar las
respectivas correlaciones de las variables empleadas en el estudio, a fin
de determinar, la relación entre ellas, en este caso la variable
dependiente (Fecundidad) con las variables independientes (explicativas).
Los coeficientes de correlación indican matem+ticamente el grado de
asociación entre las variables. Pero, no siempre una alta correlación es
determinante para sustentar una dependencia rígida entre las variables,
esto fundamentada en la relación entre las variables independientes.
El cuadro 17, nos permite visualizar la relación de la variable
dependientes: tasa global de fecundidad (TGF), con las variables
independientes o explicativas, donde las variables altamente
correlacionadas con la fecundidad son: la Mortalidad infantil, educación
de la madre, área de residencia Urbana y la disponibilidad de servicios en
las viviendas (Agua, Desagüe y Electricidad). En el primer paso del
estudio se realizó el análisis estadístico con todo el conjunto de
variables empleadas en el estudio, posteriormente se aplicó un método
estadístico que permita seleccionar sólo las variables de mayor
correlación con la fecundidad.
CUADRO N° 17
MATRIZ DE CORRELACIONES PARA MUJERES EN EDAD FERTIL
+-----------+---------+---------+---------+---------+--------+------- -+---------+----------+----------+
| VARIABLES | ESTADO | AGUA | M_PISO | DESAGUE | ANALFA |EDUCACION| URBANO | ELECTRIC.|MORTALIDAD|
| | CONY. | | TIERRA | | | | | | INFANTIL|
+-----------+---------+---------+---------+---------+--------+------- -+---------+----------+----------+
EST. CONY. 1.0000 -0.3510 0.0901 -0.3431 -0.0320 -0.3632 -0.0673 -0.1248 0.2007
AGUA -0.3510 1.0000 0.7588 0.9455 -0.7935 0.9291 0.9183 0.9273 -0.8295
M_PISO- T. 0.0901 0.7588 1.0000 0.7632 -0.9282 0.8354 0.9198 0.9139 -0.7872
DESAGUE -0.3431 0.9455 0.7632 1.0000 -0.7705 0.9127 0.8937 0.9032 -0.8663
ANALFA -0.0320 -0.7935 -0.9282 -0.7705 1.0000 -0.8436 -0.9262 -0.9007 0.8022
EDUCACIO -0.3632 0.9291 0.8354 0.9127 -0.8436 1.0000 0.9150 0.9443 -0.8259
URBANO -0.0673 0.9183 0.9198 0.8937 -0.9262 0.9150 1.0000 0.9722 -0.8523
T_ELEC -0.1248 0.9273 0.9139 0.9032 -0.9007 0.9443 0.9722 1.0000 -0.8242
MORTALI 0.2007 -0.8295 -0.7872 -0.8663 0.8022 -0.8259 -0.8523 -0.8242 1.0000
TGF 0.2220 -0.9113 -0.7814 -0.9000 0.8597 -0.8925 -0.9121 -0.8921 0.8964
----------------------------------------------------------------------------------------------------------
Es importante tener en cuenta, que, las variables independientes
generalmente se sobreponen, porque están fuertemente interrelacionadas y
muchas veces se duplican unas con otras, por lo que las tablas
univariantes, asociadas con cada variable predictora, no son buenas para
medir la importancia de una variable. Este hecho se produce, por que los
análisis univariados ignoran la interrelación entre ellas, para medir la
importancia relativa de las variables explicativas; confundiendo con
variables que contribuyen redundantemente en el análisis, causando un
problema de multicolinealidad. Esto es posible de ser observado en el
nivel de significancía, (cuadro 18), donde con un nivel de 5% como máximo,
indica que las variables no son relevantes en el modelo, es decir su
presencia en él, no es de mucha utilidad, tal como sucede con agua y
desage que superan el 7%, y electricidad el 5%.
CUADRO N° 18
AJUSTE DEL CONJUNTO DE LAS VARIABLES EXPLICATIVAS
+--------------------------+-------------------+----------------+
| V. EXPLICATIVA | COEFICIENTES | NIVEL SIG. |
+--------------------------+-------------------+----------------+
AGUA 0.00643 0.74160
MATERIAL DE PISO-TIERRA- 0.03412 0.02940
DESAGUE -0.00512 0.73270
ANALFABETISMO 0.05405 0.05420
EDUCACION 0.01141 0.42130
URBANO -0.01768 0.43530
ELECTRICIDAD -0.01540 0.46040
MORTALIDAD 0.01629 0.02470
ESTADO CONYUGAL 0.01801 0.24910
----------------------------------------------------------------
Para evitar las desviaciones antes mencionadas, se hizo un análisis
de selección de las variables explicativas que mejor contribuyan a la
explicación de la variación de la fecundidad, para ello, se procedió
mediante Técnicas de selección de regresores 1/ a obtener las variables de
mayor influencia en la fecundidad. Como se observa en el cuadro 19, dichas
variables resultaron ser la mortalidad infantil y la mujeres unidas. Los
pesos de beta para la mortalidad infantil fueron de 0.5523 y del estado
conyugal de las mujeres (0.4543), determinando que la mortalidad infantil
es la variable de mayor peso relativo para explicar los niveles de
fecundidad.
CUADRO N° 19
AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS
+--------------------------+-------------------+------------+
| V. EXPLICATIVA | COEFICIENTES | BETA |
+--------------------------+-------------------+------------+
MORTALIDAD 0.0261 0.5523
ESTADO CONYUGAL 0.0320 0.4543
------------------------------------------------------------
Rý 0.9881
------------------------------------------------------------
Después de algunos ensayos con el análisis de regresión, y en la
búsqueda de la participación de otras variables, se precisó que el estado
conyugal, debería ser retirado del análisis, ya que las mujeres casadas o
unidas están directamente expuestas a los riesgos de embarazo, de ello su
mayor peso o poder explicativo junto a la Mortalidad infantil en la
variación de la fecundidad, observado en el cuadro 19; al limitar la
intervención de otras variables independientes como en el caso de las
características de los servicios de las viviendas, educación, etc.
Luego de eliminar la influencia de la variable "estado conyugal" del
conjunto de variables explicativas se procedió a un nuevo análisis del
conjunto de variables restantes, donde la mala calidad del piso de una
vivienda, en este caso piso de tierra y la mortalidad infantil pasan a
primer y segundo lugar respectivamente (cuadro 20), seguidos en orden de
importancia por electricidad, analfabetismo y en último lugar la educación.
Además se observa que los coeficientes del conjunto de variables
seleccionadas, tomadas como medida relativa, determina la influencia de
cada una de ellas en el modelo, así mismo la proporción de variación
explicada por el modelo es del 99.24%.
Las dos primeras variables presentan los pesos más significativos de
Beta y como ta explican en primer orden los niveles de fecundidad; no por
estar directamente relacionados con la fecundidad como si fuera una
variable intermedia, sino por ser uno de los indicadores de las
condiciones de vida de determinados grupos socio-económicos; pues, la mala
calidad de piso (tierra) de una vivienda y los altos niveles de mortalidad
infantil, corresponden a familias de escasos recursos económicos y que en
su gran mayoría viven en las áreas rurales, urbano marginales, y dentro de
la estratificación social corresponden a los estratos sociales mas bajos,
como los obreros del sector agrícola y no agrícola, generalmente con
necesidades básicas insatisfechas, y donde precisamente se encuentran las
tasas más altas de analfabetismo femenino.
De lo anterior se deduce que las variables más influyentes en
ausencia del estado conyugal son: Piso de Tierra, Mortalidad, Electricidad,
Analfabetismo y Educación, esto, de acuerdo a los pesos de los Betas.
Ambos modelos o ecuación son significativos. Es decir ambos modelos
determinados en los cuadros 19 y 20, tienen su lógica de aceptación para
explicar la fecundidad.
En el cuadro 20, la variable educación tenía el menor peso entre el
conjunto de las cinco variables, por lo que se optó por retirar del modelo;
al efectuar un nuevo análisis, se pudo comprobar que la primera variable
en explicar el nivel de la fecundidad, en ausencia de la educación, seguía
siendo la calidad de material de piso tierra, seguido por mortalidad
infantil, analfabetismo y electricidad (cuadro 21), aunque este último,
disminuyó en cierto grado su peso relativo o importancia en el modelo,
mientras las otras incrementaron su participación, pero mantienen el orden
anterior. Como se observa, también los coeficientes indican que cada una
de las variables incrementaron su peso, en cuanto a su aporte en explicar
la fecundidad.
CUADRO N° 20
AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS
(SIN CONSIDERAR "ESTADO CONYUGAL")
+-------------------------+----------------+-------------+------------+
| V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG |
+-------------------------+----------------+-------------+------------+
MORTALIDAD 0.02134 0.4508 0.000
MATERIAL DE PISO-TIERRA- 0.03927 0.5087 0.000
ANALFABETISMO 0.06438 0.2657 0.005
ELECTRICIDAD -0.02636 -0.3655 0.063
EDUCACION (*) 0.00934 0.2027 0.395
-----------------------------------------------------------------------
Rý 0.99207
-----------------------------------------------------------------------
ERROR ESTANDAR 0.00272
-----------------------------------------------------------------------
(*) ESTA VARIABLE FUE TOMADA A CRITERIO, POR CUANTO EXPLICA EN FORMA
MAS CLARA LA VARIACION DE LA FECUNDIDAD.
Posteriormente, del conjunto de variables determinadas en el cuadro
20, se procedió a eliminar de uno en uno, las variables de menor
correlación del modelo determinado, evaluando los cambios ante la
eliminación de cada una de ellas, con la finalidad de observar la
variación de las variables explicativas.
Como se observa en el cuadro 21, el peso de la variable material de
piso tierra, ocupa el primer lugar en orden de importancia de las
variables explicativas, pero del conjunto de éstas es la de menor
correlación con la fecundidad (ver matriz de correlaciones), por ello y
con la finalidad de ver la participación de las demás variables se optó
por retirar del modelo. El cuadro 22, nos muestra que la mortalidad
infantil pasa al primer orden, en ausencia de material de piso tierra,
seguido por educación, analfabetismo y en último orden electricidad.
Donde la proporción de variación de la variable dependiente es explicada
en un 98.5% en relación a las variables independientes, menor al anterior
que fue de 99.2 % (cuadro 21).
CUADRO N° 21
AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS
(SIN CONSIDERAR "EDUCACION")
+--------------------------+---------------+------------+--------------+
| V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG |
+--------------------------+---------------+------------+--------------+
MORTALIDAD 0.02232 0.47143 0.000
MATERIAL DE PISO-TIERRA- 0.04126 0.53461 0.000
ANALFABETISMO 0.07502 0.30961 0.000
ELECTRICIDAD -0.01708 -0.23690 0.045
-----------------------------------------------------------------------
Rý 0.99217
-----------------------------------------------------------------------
ERROR ESTANDAR 0.002752
-----------------------------------------------------------------------
Este intercambio de posición de las variables independientes
(educación), se debe a la correlación existente con el material de piso;
que limitaba su poder de explicación, debido a que de alguna manera la
condición socio-económica de las familias está reflejada en las
características de las viviendas, de esta manera un determinado nivel de
educación es la base para la calificación y nivel de ingreso económico de
una persona, y a su vez el nivel de ingreso ser la determinante de las
condiciones o características de las viviendas.
CUADRO N° 22
AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS
(SIN CONSIDERAR "MATERIAL DEL PISO")
+-----------------------+-----------------+------------+--------------+
| V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG |
+-----------------------+-----------------+------------+--------------+
MORTALIDAD 0.02614 0.55215 0.000
ELECTRICIDAD -0.00614 0.08522 0.720
ANALFABETISMO 0.02395 0.09885 0.351
EDUCACION 0.02085 0.45255 0.153
-----------------------------------------------------------------------
Rý 0.98556
------------------------------------------------------------------------
ERROR ESTANDAR 0.0036
------------------------------------------------------------------------
Seguidamente, el cuadro 22 muestra a la variable electricidad como el
de menor peso o poder explicativo, pero como se observa en el cuadro N°
17 esta variable presentaba una mayor correlación que el analfabetismo, lo
que determinó la eliminación de ésta última del modelo, quedando sólo tres
variables donde la mortalidad y la educación pasan a participar con los
mismos pesos de importancia en el modelo (cuadro 23), seguido por
electricidad. El conjunto de estas tres variables mantienen la proporción
de variación de explicación de la variable dependiente en un 98.6%, con la
diferencia qe el error est+ndar es superior al modelo anterior.
CUADRO N° 23
AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS
(SIN CONSIDERAR "ANALFABETISMO")
+--------------------+---------------+---------------+----------------+
| V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG |
+--------------------+---------------+---------------+----------------+
MORTALIDAD 0.02906 0.61379 0.000
ELECTRICIDAD -0.01647 -0.22839 0.217
EDUCACION 0.02818 0.61176 0.025
-----------------------------------------------------------------------
Rý 0.98562
-----------------------------------------------------------------------
ERROR ESTANDAR 0.003665
-----------------------------------------------------------------------
Después de observar la articipación simultanea de la mortalidad y
educación, se excluyó la variable electricidad (cuadro 24), donde según el
coeficiente BETA, la mortalidad infantil es la variable con mayor
importancia relativa entre las variables independientes para explicar la
variación de la fecundidad, tal como se demostró en la matriz de
correlaciones (cuadro 17), de manera similar la educación aparece en
segundo orden, manteni‚ndose la proporción de variación explicada de la
fecundidad por estas dos variables en un 98.5 %, pero con un alto error
estándar, lo que justifica la necesaria participación de otro conjunto de
variables socio-económicas y Demográficas para explicar el comportamiento
de la fecundidad en un determinado contexto socio-espacial.
CUADRO N° 24
AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS
(SIN CONSIDERAR "ELECTRICIDAD")
+---------------------+----------------+--------------+----------------+
| V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG |
+---------------------+----------------+--------------+----------------+
MORTALIDAD 0.03405 0.71923 0.000
EDUCACION 0.01361 0.29551 0.000
------------------------------------------------------------------------
Rý 0.98523
------------------------------------------------------------------------
ERROR ESTANDAR 0.003714
-------------------------------------------------------------------------
Finalmente, se consideró sólo la variable "mortalidad infantil"
(cuadro 25), la cual, si bien es cierto que explica la variación de la
variable dependiente en un 96.8 %, su error est+ndar se incrementa. Estos
hechos demuestran, que, en un proceso de análisis de variables
explicativas, con una dependiente, es necesario la mayor participación
de variables explicativas, a fin de determinar su variación de la forma
más aproximada. Ya que, aun siendo la variable de mayor importancia en la
determinación de la variación de la fecundidad, ello no implica su sola
participación, pues, ésta también puede ser el resumen de la confluencia
de otro conjunto de variables Socioeconómicas, Demográficos,Biológicas,etc.
como es caso de la mortalidad infantil.
CUADRO N° 25
AJUSTE DE LAS VARIABLES EXPLICATIVAS SELECCIONADAS
(SIN CONSIDERAR "EDUCACION")
+-----------------------+-------------------+--------------+---------------+
| V. EXPLICATIVA | COEFICIENTES | BETAS | NIVEL-SIG |
+-----------------------+-------------------+--------------+---------------+
MORTALIDAD 0.04661 0.98465 0.000
---------------------------------------------------------------------------
Rý 0.96827
---------------------------------------------------------------------------
ERROR ESTANDAR 0.00544
---------------------------------------------------------------------------
De lo anterior, en relación a la mortalidad infantil podemos plantear
la siguiente afirmación: "de que una de las razones de mayor peso para una
elevada fecundidad en determinadas áreas o zonas de muestro país, es que
las parejas temen que varios de sus hijos mueran a muy temprana edad, por
lo que tienen mayor número de hijos, para así asegurar suficientes hijos
que sobrevivan y garanticen el bienestar en la vejez de los padres. Por lo
tanto, sólo cuando la mortalidad infantil haya descendido a niveles bajos,
los padres aceptaran que no es necesario tener un gran número de hijos,
para garantizar la supervivencia de unos pocos".
A estos mismos resultados llegaron, E. Alcantara y J. Ortiz, en el
estudio: "Mortalidad temprana y Fecundidad en el Perú", 1994; con datos
de la ENDES I, donde utilizando una metodología distinta, como es el
"análisis de Clasificación Múltiple" que es otra forma de análisis
multivariado, en la que se relaciona un conjunto de variables explicativas
o independientes con una sola variable dependiente, en una tentativa de
explicar la variación de ésta última.
En el mencionado estudio se incluyó 13 conjuntos de variables, entre
las que figuraban las variables contextuales socioeconómicas y biológicas,
como dice textualmente.. "se incluyó la variable experiencia en la
mortalidad infantil para establecer su relación con la fecundidad,
encontrándose que ésta, tanto individualmente como en el conjunto, es la
que mejor explica la varianza de la fecundidad...Los tres coeficientes eta
más altos son: orden de nacimiento, experiencia de mortalidad infantil y
educación de la madre. Calculando las eta, vemos que estas variables
explican individualmente el comportamiento de la fecundidad de la
siguiente manera: 35% el orden de nacimiento; 27% la experiencia en la
mortalidad infantil y 23% la educación de la madre..."
|