Base de datos a utilizar
Obteniendo los niveles de pobreza de Guatemala
Sobre la medición de pobreza en Guatemala
La medición oficial de la pobreza en Guatemala está a cargo del Instituto Nacional de Estadísticas (en adelante INE). Dicha estimación se realiza bajo el enfoque de pobreza absoluta, utilizando el método indirecto de líneas de pobreza y el consumo como medida de bienestar. Este método consiste en la construcción del agregado de consumo, o consumo total anual de un hogar que luego se transforma a nivel per cápita, que luego se compara con un parámetro mínimo de consumo definido como línea de pobreza. En otras palabras, el agregado de consumo es la sumatoria del costo (en Quetzales) del consumo de un hogar, ya sea consumo de alimentos o consumo de bienes no alimentarios (ropa, educación, salud, etc).
Las personas que tienen un consumo menor al umbral definido se registran como pobres. Existen dos umbrales o líneas de pobreza: la línea de pobreza extrema (también conocida como línea de pobreza alimentaria) y la línea de pobreza total (denominada también pobreza general).
La línea de pobreza extrema según el INE (2015) se define como el costo de adquirir la cantidad mínima de calorías recomendadas por el INCAP (Instituto de Nutrición de Centroamérica y Panamá) para Guatemala (ASIES, 2005). Dicho costo se estima en función del consumo y precios reportados por los hogares encuestados. La línea de pobreza extrema para el año 2014 es de Q 5,750 por persona al año, para 2006 fue de Q 3,206 y para el año 2000 fue de Q 1,911 (INE, 2015).
La línea de pobreza total incluye además del costo de satisfacer los requerimientos calóricos mínimos, el costo de satisfacer otras necesidades básicas, dicho costo adicional corresponde “al porcentaje de consumo no alimenticio de las personas, cuyo consumo alimenticio se encuentra alrededor de la línea de pobreza extrema” (INE, 2015). El valor de la línea de pobreza total en 2014 se estimó en Q 10,218, para 2006 este fue de Q 6,574 y para 2000 era de Q 4,318.
Cabe mencionar, que los montos del valor monetario de las líneas de pobreza extrema y total están expresados en Quetzales corrientes de cada año, o sea a precios de cada año.
Disponibilidad de bases de datos
Guatemala cuenta con mediciones oficiales de pobreza y condiciones de vida para 4 años: 2000, 2006, 2011 y 2014. Dichas mediciones provienen de la Encuesta Nacional de Condiciones de Vida (ENCOVI) que es realizada por el INE de manera periódica. Esta encuesta recoge información integral sobre las condiciones de vida de las personas, incluyen información que permite construir indicadores demográficos y socioeconómicos, permite el estudio de la pobreza desde su conceptualización monetaria así como multidimensional (INE, 2016). El nivel de representatividad de las ENCOVI es nacional, por área de residencia y por departamentos; asimismo se pueden realizar desagregaciones por sexo y por etnicidad (pertenencia o no a un pueblo indígena). Las bases de datos se encuentran disponibles en la página web del INE. En esta entrada vamos a realizar algunos ejercicios de estimación de la pobreza con la base de datos del 20141.
Obteniendo indicadores de pobreza
Los datos del agregado de consumo y pobreza son recopilados a nivel de hogares, por lo que no están en la misma base de datos de características de la población (variables/información por persona), por lo cual se debe combinar (merge) la base ENCOVI 2014 (AGREGA DE CONSUMO) con la base ENCOVI 2014 (PERSONAS)2 para poder realizar las siguientes estimaciones.
Una vez unida la base de datos, se declara el diseño muestral de la encuesta: en este caso se conoce que el nivel de desagregación o estrato es el departamento (DEPTO en la base de datos); la ponderación corresponde al peso por personas (FACTOR) y la unidad de muestreo es la Unidad primaria de muestreo (UPM)3.
¡Ahora estamos listos para comenzar a explorar las estimaciones de pobreza!
Incidencia de la pobreza
La incidencia de la pobreza es igual a la proporción (o cantidad) de personas que han sido identificadas como pobres, dividida entre el total de población, multiplicado por 100. Tenga en cuenta que se identifica a una persona como pobre extremo si su consumo per cápita anual está por debajo de la línea de pobreza extrema; o como pobres no extremo si su consumo per cápita anual es superior a la línea de pobreza extrema pero no a la línea de pobreza total. La suma de estas dos poblaciones corresponde al total de personas pobres.
Para obtener esta proporción se procede en Stata de la siguiente forma:
Programación 1: Incidencia de la pobreza a nivel nacional.
svy linearized: proportion POBREZA
Tabla 1: Resultado de la ejecución de la programación 1.
Al ejecutar la Programación 1 se genera la Tabla 1, en ella se muestran los datos estadísticos de la variable POBREZA. En la primera columna aparece la proporción de población Pobre extrema (_prop_1), Pobre no extrema (_prop_2) y No pobre (_prop_3), para conocer la incidencia de la pobreza, la proporción (Proportion) reportada en la Tabla 1 se multiplica por 100. La segunda columna de la Tabla 1 muestra el error estándar de la estimación, si este número es menor o igual a 0.05 (que corresponde a un nivel de confianza del 95%) se considera que es una estimación estadísticamente significativa y por ende válida o representativa. La tercera y cuarta columna de la Tabla 1 muestran el valor mínimo y máximo del intervalo de confianza (95% por defecto) de la estimación respectivamente, esto refleja la variabilidad que la estimación podría tener en la población real.
A partir de la Tabla 1 puede inferirse que en el año 2014 el 23.4% de la población guatemalteca vivía en pobreza extrema, mientras que un 35.9% de la población era pobre no extremo, indicando que el 59.3% de la población en 2014 vivía por debajo de la línea de pobreza total4. Estas estimaciones tienen un error estándar menor a 0.05 de modo que son estadísticamente significativas, esto es de esperarse, ya que son estimaciones a nivel nacional y la encuesta tiene representatividad a nivel de departamentos.
Incidencia de la pobreza por pertenencia a un pueblo indígena
Debido a que Guatemala es un país multicultural y multilingüe con una presencia alta de población indígena, es interesante y necesario conocer la condición de pobreza de la población en función de su pertenencia a un pueblo indígena. En la ENCOVI 2014 se le pregunta a la persona si se considera perteneciente a alguna comunidad étnica (ver P04A11A en la base de datos) sin embargo hay más de 30 opciones de respuesta. Por lo cual se debe crear una variable dicotómica (o sea de dos posibles respuestas) que agrupe las categorías en dos grupos: Indígena y No indígena.
Según el formulario de ENCOVI 20145 en P04A11A los códigos de pertenencia étnica que incluyen ser indígena son los códigos del 1 al 24, los códigos 29 y 30 corresponden a “ladino” y “extranjero” (son no indígenas), respectivamente; mientras que los códigos 97 y 99 corresponden a “no indica” e “ignorado” respectivamente. No obstante, siempre es bueno verificar que los códigos de categoría de la boleta coincidan con lo registrado en la base de datos para evitar errores.
Programación 2A: Verificación de códigos de pertenencia étnica.
sum P04A11A
Tabla 2A: Resultados de verificaciones de códigos de pertenencia étnica.
Programación 2B: Verificación de códigos de pertenencia étnica.
tab P04A11A if P04A11A>=1&P04A11A<29
Tabla 2B: Resultados de verificaciones de códigos de pertenencia étnica.
Programación 2C: Verificación de códigos de pertenencia étnica.
tab P04A11A if P04A11A==29|P04A11A==30
Tabla 2C: Resultados de verificaciones de códigos de pertenencia étnica.
Programación 2D: Verificación de códigos de pertenencia étnica.
tab P04A11A if P04A11A>=97
Tabla 2D: Resultados de verificaciones de códigos de pertenencia étnica.
Una vez que hemos verificado los códigos procedemos a la creación de la variable de identificación.
Programación 3: Creación de variable Dicotómica (Dummy) – Indígena.
capture drop indigena
gen indigena=.
replace indigena=1 if P04A11A>=1&P04A11A<29
replace indigena=0 if P04A11A==29|P04A11A==30
label var indigena "Perteneciente a pueblo indigena"
label define indigena 1 "Indigena" 0 "No Indigena", replace
label values indigena indigena
tab indigena
Nota que al crear la variable “indígena” usamos el comando capture drop, esto indica que cada vez que vas a estimar esta variable se borrará cualquiera que tenga el mismo nombre. De igual manera, al final de la sexta línea de código escribimos replace esto indica que cada vez que se cree esta variable se reemplazarán las etiquetas de datos, si no se pone esto se repite el grupo de códigos y te aparecerá un mensaje diciendo que ya existe esa etiqueta para las categorías. Por eso estos comandos son muy importantes al procesar datos, porque usualmente se repite una operación.
Generamos la variable igual a missing (.), o valores perdidos, para evitar errores en la asignación de valores (0 o 1), aunque esto es flexible, se puede generar igual a 0. También nota, que no hemos incluido los códigos correspondientes a “No indica” e “Ignorado” y por ende se tratan como missing en la variable nueva, esto porque no podemos atribuirles ningún valor (si lo hacemos estaríamos asumiendo o inventando).
Las líneas de código de la quinta a la séptima no son indispensables para la creación de la variable dicotómica, estos comandos se refieren a las etiquetas de variables y de los valores de la misma, es decir de sus categorías. Aunque podrían ser omitidos, aporta claridad el ir nombrando las variables y sus valores en el caso de variables categóricas, así se evitan confusiones.
Por último, recomendamos que al crear una variable nueva en función de otra se verifique la cantidad de observaciones para las cuales hay información en ambas variables, este se hace con el comando tab en la última línea de código. En la Tabla 3 se observa que la diferencia de la variable “indígena” con P04A11A corresponde a los códigos que no incluimos por las razones ya mencionadas.
Tabla 3: Creación de variable Dicotómica (Dummy) – Indígena.
Para estimar la proporción de población pobre por pertenencia a un grupo indígena se procede de la siguiente forma:
Programación 4: Incidencia de la pobreza por pertenencia a un grupo indígena
svy linearized: proportion POBREZA, over (indigena)
El comando para estimar la proporción de la pobreza por pertenencia a un grupo indígena es muy parecido a la Programación 1, para obtener las proporciones desagregadas solamente se agrega over (indígena) en paréntesis y se escribe la variable para la cual se desea estimar la proporción de la otra variable, en este caso POBREZA.
En la Tabla 4, hay 2 valores por cada proporción, estas proporciones corresponden a _prop_1 que es la proporción de pobres extremos, _prop_2 proporción de pobres no extremos y _prop_3 proporción de no pobres. Los valores _subpop_1 e Indigena corresponden a las categorías.
De este modo, podemos concluir que en 2014 el 12.8% de la población “No indígena” vivía en pobreza extrema, mientras que esta condición se encontraba en el 39.8% de la población “Indígena”. Asimismo, la incidencia de la pobreza no extrema es mayor para la población indígena (39.5%) que para los No indígenas (33.7%). Para obtener la proporción de personas que viven en pobreza total (general) en cada grupo, se suman las proporciones correspondientes de pobreza extrema y no extrema (_prop_1 y _prop_2 respectivamente), obteniendo que el 79.2% de las personas Indígenas son pobres generales en comparación con el 46.6% de la población no indígena6.
Tabla 4: Incidencia de la pobreza por pertenencia a un grupo indígena
Incidencia de la pobreza por grupo etario
Además de conocer la incidencia de la pobreza en la población en general es importante conocer cómo esta situación afecta a las personas en función de la etapa del ciclo de vida que atraviesan, esto es posible a través de un análisis etario de la pobreza, ya que permite conocer el grupo poblacional más afectado, las vulnerabilidades específicas que la pobreza puede desencadenar para ellos, y por ende es imprescindible para informar la recomendación de políticas de reducción sostenible de la pobreza.
Para estimar la incidencia de la pobreza por grupo etario, es necesario:
- Crear esa variable, agrupando los datos de la variable continua que contiene la edad de las personas en años cumplidos (PPA03)
- Conocer la cantidad de observaciones y rango de datos de la variable, para eso se usa el comando sum el cual reporta estadísticas descriptivas básicas
- Si se desea obtener estadísticas descriptivas detalladas, la segunda línea de código de la Programación 5A permite hacerlo.
Programación 5A: Explorar datos de edad (PPA03)
sum PPA03
sum PPA03, d
Tabla 5A: Estadísticas descriptivas de edad (PPA03)
Los intervalos de edades de las categorías de grupos etarios se determinaron teniendo en cuenta la definición internacional de niños, en la que se incluye a las personas entre 0 y 17 años de edad, mientras que los otros grupos se determinaron en función de los criterios establecidos en el Tomo 1 de Informe de resultados de ENCOVI 2014 (INE, 2016). Observe que en la sexta línea de la Programación 5B se incluye la condición de que PPA03 sea diferente de “missing (.)”, ya que si no se incluye esta condición, Stata incluirá los valores missing de PPA03 en la categoría “Adultos mayores”, pues Stata “codifica y trata los valores missing como infinito positivo” (Gould & StataCorp)7.
Programación 5B: Creación de variable categórica grupoedad8
capture drop grupoedad
gen grupoedad=.
replace grupoedad=1 if PPA03>=0&PPA03<=17
replace grupoedad=2 if PPA03>=18&PPA03<=39
replace grupoedad=3 if PPA03>=40&PPA03<=64
replace grupoedad=4 if PPA03>=65&PPA03!=.
label define grupoedad ///
1 "Niños y adolescentes" ///
2 "Jóvenes y Adultos jóvenes" ///
3 "Adultos" ///
4 "Adultos mayores", replace
label values grupoedad grupoedad
tab grupoedad
Tabla 5B: Resultado de creación de variable categórica grupoedad
Se ha verificado que la variable grupoedad tiene igual cantidad de observaciones que PPA03. Se procede ahora a estimar la incidencia de la pobreza por grupos de edad:
Programación 7: Incidencia de la pobreza por grupos etarios
svy linearized: proportion (POBREZA), over (grupoedad)
En la Tabla 7 se observa que el grupo de población con una mayor incidencia de la pobreza total son los niños y adolescentes (_subpop_1) ya que presentan la mayor proporción de Pobres totales (_prop_1 más _prop_2) con un 68.3% de los niños y adolescentes en esta situación en contraposición al resto de grupos etarios para los cuales la incidencia de la pobreza total es mucho menor. Cabe mencionar que los errores estándar de estas estimaciones son menores a 0.05, indicando que las proporciones son representativas.
Tabla 7: Incidencia de la pobreza por grupos etarios
Incidencia de la pobreza en los niños y adolescentes
Esta información puede extraerse de la Tabla 7, los datos corresponden a la proporción (_prop_1, _prop_2, _prop_3) para la _subpop_1, es decir al grupo de niños y adolescentes. No obstante, puede estimarse la proporción de pobreza directamente para un grupo de población específico, para esto se usa el comando de la Programación 8. Nótese que la estructura del comando es similar al de la Programación 1, pero se agrega la restricción de estimar la proporción solamente si grupoedad es igual a 1, es decir solo para las personas con edades entre 0 y 17 años, esta restricción se expresa como subpob (if grupoedad==1). En la Tabla 8 se observa que los resultados para este grupo son exactamente a los presentados en la Tabla 7.
Programación 8: Incidencia de la pobreza en el grupo de niños y adolescentes
svy linearized, subpop (if grupoedad==1): proportion (POBREZA)
Tabla 8: Incidencia de la pobreza en el grupo de niños y adolescentes
Distribución etaria de la población según condición de pobreza
¿Significa esto lo mismo que la incidencia de la pobreza por grupo etario? No. Si deseamos conocer la incidencia de la pobreza por grupo etario, como ya vimos, la proporción estimada es la de la variable POBREZA, dentro de cada categoría de la variable grupoedad. Mientras que si buscamos conocer la participación de cada grupo etario dentro de los grupos de población según condición de pobreza, requerimos la operación contraria, es decir, la proporción estimada de la variable grupoedad, dentro de cada categoría de la variable POBREZA, para lo cual se usa la Programación 9.
Es importante hacer esta distinción pues los resultados obtenidos son completamente diferentes. En base a la Tabla 9 se infiere que la mayor proporción de pobres extremos (_subpop_1) son niños y adolescentes (_prop_1) pues representan el 53.7% del total de pobres extremos en Guatemala en 2014, seguidos de los jóvenes y adultos jóvenes con el 29.3%, los adultos con 13.2% y la menor participación corresponden a los adultos mayores, pues solamente el 3.7% de los pobres extremos están en ese grupo etario.
Programación 9: Distribución etaria de la población según condición de pobreza
svy linearized: proportion (grupoedad), over (POBREZA)
Tabla 9: Distribución etaria de la población según condición de pobreza
Práctica
Hemos aprendido un poco sobre la estimación de proporciones de una variable en poblaciones totales y en sub poblaciones, asimismo hemos practicado la creación de variables. Ahora es tu turno de realizar tus propias estimaciones. Te sugerimos estimar la incidencia de la pobreza para personas analfabetas. A continuación se presentan los resultados para que puedas verificar tus resultados.
Ayuda: En Guatemala se considera analfabeta una persona de 15 años y más que no sabe leer ni escribir.
Te invitamos a continuar la serie de tutoriales. Puedes ver la ruta de aprendizaje recomendada en: https://escueladedatos.online/serie-de-tutoriales-conociendo-los-indicadores-de-pobreza-de-centroamerica/
Notas
1 La base de datos de 2014 y el resto de bases pueden descargarse en: https://www.ine.gob.gt/ine/pobreza-menu/
2 Ver “Unión de bases de datos” en Recursos complementarios. Link: https://escueladedatos.online/una-mirada-a-los-indicadores-de-pobreza-en-centroamerica-utilizando-stata-nicaragua/
3 Para mayores detalles al respecto ver “Declarando el diseño muestral” en Recursos complementarios. Link: https://escueladedatos.online/una-mirada-a-los-indicadores-de-pobreza-en-centroamerica-utilizando-stata-nicaragua/
4 Estas estimaciones coinciden con las reportadas en el Informe de Principales resultados Encuesta Nacional de Condiciones de Vida 2014 (INE, 2015) en las páginas 3 y 8. Puedes descargar el documento en: https://www.ine.gob.gt/sistema/uploads/2019/10/03/201910031815416T6Xktk9aNmHatAx8RIVAzElQXyxs7St.pdf
5 Ver ENCOVI 2014 BOLETA (https://www.ine.gob.gt/ine/pobreza-menu/), CAPÍTULO IV. CARACTERÍSTICAS DE LOS MIEMBROS DEL HOGAR – PARA TODAS LAS PERSONAS DEL HOGAR.
6 Estas estimaciones coinciden con las reportadas en el Informe de Principales resultados Encuesta Nacional de Condiciones de Vida 2014 (INE, 2015) en las páginas 4 y 9. Puedes descargar el documento en: https://www.ine.gob.gt/sistema/uploads/2019/10/03/201910031815416T6Xktk9aNmHatAx8RIVAzElQXyxs7St.pdf
7 Ver: https://www.stata.com/support/faqs/data-management/logical-expressions-and-missing-values/
8 Las 3 plecas seguidas se usan para ordenar mejor una serie de código, Stata no reconoce lo que está después de las 3 plecas, sino la siguiente línea de código.
Bibliografía
ASIES. (2005). Mapas de pobreza y desigualdad de Guatemala. Insumo preliminar elaborado por ASIES, Guatemala. http://www.ciesin.columbia.edu/repository/povmap/methods/Mapas_de_la_Pobreza_2002.pdf
Gould, W., & StataCorp. (s.f.). stata.com. Recuperado el 9 de Octubre de 2019, de Logical expressions and missing values: https://www.stata.com/support/faqs/data-management/logical-expressions-and-missing-values/
INE. (2016). Encuesta Nacional de Condiciones de Vida 2014. Guatemala: INE. https://www.ine.gob.gt/sistema/uploads/2016/02/03/bWC7f6t7aSbEI4wmuExoNR0oScpSHKyB.pdf
INE. (2014). Encuesta Nacional de Condiciones de Vida. ENCOVI 2014. Boleta . Guatemala: INE. https://www.ine.gob.gt/sistema/uploads/2015/12/11/DDrIEuLOPuEcXTcLXab1yOkiOV2HQreq.pdf
INE. (2015). República de Guatemala: Encuesta Nacional de Condiciones de Vida 2014. Principales resultados. Guatemala: INE. https://www.ine.gob.gt/sistema/uploads/2019/10/03/201910031815416T6Xktk9aNmHatAx8RIVAzElQXyxs7St.pdf
Trackbacks/Pingbacks