Base de datos a utilizar

Sobre la medición de pobreza en Honduras

Desde 1990 hasta 2011 la pobreza en Honduras se había entendido como un fenómeno unidimensional y básicamente monetario, sin embargo a partir de 2012 se reconoce como una problemática multidimensional en la que es pertinente incluir otros elementos fundamentales de la condición de vida de las personas y los hogares que no son captadas necesariamente por el nivel de ingreso o consumo de los mismos. De este modo, a partir de 2012 se desarrolló una medición de pobreza multidimensional que consiste en la  identificación de privaciones en 4 dimensiones de la condición de vida: salud, educación, trabajo y vivienda, las cuales se agregan en un índice de pobreza multidimensional1.

Según se indica en el Informe de Evolución del Índice de pobreza multidimensional de Honduras 2012-20162, se considera a una persona en pobreza multidimensional si está privada en 4 o más de los 15 indicadores evaluados, es decir si su índice es igual o mayor al 25% de privación, por su parte se considera “en pobreza multidimensional severa si está privada en dos o más dimensiones o presenta privaciones en más del 50 por ciento de la suma ponderada de indicadores; y se considera si una persona es vulnerable a ser pobre si se encuentra entre el 15 y el 24 por ciento de la suma ponderada de privaciones” (SCGG, 2017 página 16).Cabe mencionar que la estimación de la pobreza multidimensional, no implicó la descontinuación de la estimación de la pobreza monetaria (por ingresos), sino que se mantienen ambas mediciones como complementarias (SCGG-INE, 2016).

Para la medición de la pobreza monetaria se hace uso del método de línea de pobreza, según el cual se considera pobre extremo a una persona cuyo ingreso per cápita es menor a la línea de pobreza extrema o alimentaria, la cual equivale al costo de satisfacer requerimientos calóricos mínimos equiparados a 2,200 calorías diarias. Los productos con los cuales se puede satisfacer este requerimiento calórico o canasta básica alimentaria fueron determinados por el Instituto de Nutrición de Centroamérica y Panamá (INCAP) y su costo se estima en función de los precios registrados mensualmente por el Banco Central de Honduras para el cálculo del índice de precios al consumidor.

Por su parte, se consideran pobres generales aquellas personas cuyo ingreso per cápita es menor a la línea de pobreza general, la cual teóricamente incluye el costo de la canasta básica alimentaria más un grupo de bienes y servicios considerados básicos. La estimación de esta canasta básica en Honduras se realiza aplicando el inverso del ratio de Engels3 que para el área urbana es de 2 y para el área rural de 1.33 (SCGG-INE, 2016). Por su parte el ingreso se estima a partir de 20084 considerando todas las fuentes de ingreso del hogar, tanto ingreso por trabajo como transferencias, incluyendo ingresos monetarios y en especie (INE, 2009).

Disponibilidad de bases de datos

Las mediciones de pobreza de Honduras se estiman en base a los datos recopilados con la Encuesta Permanente de Hogares de Propósitos Múltiples (EPHPM) realizada por el Instituto Nacional de Estadística de Honduras (INE). Las bases de datos de estas encuestas están disponibles en línea en la página web de la institución5; sin embargo, los datos no están disponibles para ser descargados, sino solamente para realizar tabulaciones en línea en la plataforma. Por lo cual se procedió a solicitar la base de datos más reciente al INE a través de correo electrónico, pero no se obtuvo respuesta.

Considerando lo anterior se solicitó al Programa de Encuesta de Salud y Demografía de los Estados Unidad (dhsprogram.com) acceso a los últimos (2011/2012) datos disponibles de la Encuesta de Demografía y Salud (DHS por sus siglas en inglés) de Honduras, pues es la única fuente de datos disponibles que permite realizar estimaciones sobre algunos elementos de las condiciones de vida de la población hondureña. De este modo, en esta publicación se realizan estimaciones sobre la privación en vivienda adecuada, es decir en materiales de la vivienda y hacinamiento, tomando como referencia los parámetros de privación para estos indicadores en el Índice de Pobreza Multidimensional de Honduras.

Obteniendo indicadores de nivel de vida vinculados a la condición de pobreza

En las bases de datos de la DHS 2011/2012 la información sobre condiciones de la vivienda y bienes se encuentra en la base de datos de hogares (llamada HNHR62FL_hogar) pero los datos sobre características demográficas de los miembros del hogar se encuentran en la base de datos (denominada HNPR62FL_miembros), de modo que se deben unir ambas bases para realizar las estimaciones sobre esos aspectos.

Para la unir la base de hogares (HNHR62FL_hogar) con la base de miembros del hogar (HNPR62FL_miembros) que está a nivel de personas, abrimos primero la base de miembros del hogar (HNPR62FL_miembros) la cual será nuestra base de origen o “master”, la base a unir o “using” será la de hogares, de modo que la unión se obtenga un conjunto de datos a nivel de personas. Es decir que la unión se realizará de “muchas” observaciones, correspondientes a varias personas por hogar, a “una” observación que corresponde al hogar del cual son miembro las personas, esta especificación se observa en la Programación 1.

Las variables de identificación o “llaves” para la unión son hv001, que corresponde al número de cluster o grupo de muestreo, y hv002 que corresponde al número de hogar encuestado, estas variables de identificación se encuentran en ambas bases de datos y las usaremos para unir la información en una misma base a nivel de personas, ya que la combinación de estos números crea un código único por hogar, el cual se repetirá para cada miembro de un mismo hogar (Programación 1).

Programación 1: Unión de base de datos de hogar y miembros de hogar

merge m:1 hv001 hv002 using "e:\Users\Desktop\Honduras\DHS 2011-12\HNHR62FL_hogar.DTA" save "e:\Users\Desktop\Honduras\DHS 2011-12\HNHR62FL_hogar_miembros.DTA", replace

Como se observa en la Programación 1 el comando para unir información de dos bases de datos de manera horizontal, es decir agregar variables, es merge luego se indica el tipo de unión deseado, como ya mencionamos es una unión de muchos a uno, lo cual se indica con m:1 posteriormente se escriben las variables que permitirán realizar la unión: hv001 y hv002, posteriormente se escribe using y se indica entre comillas la ubicación de la base de datos que se va a unir.

Una vez se han unido las bases de datos se debe guardar la nueva base de datos de trabajo, para los cual se usa el comando save, se escribe entre comillas la ubicación y nombre del nuevo archivo y se escribe, replace indicando que se reemplace cualquier base de datos existente que tenga el mismo nombre al indicado entre comillas (ver Programación 1). En la nueva base unida se debe declarar el diseño muestral de la encuesta.

El diseño de la muestra de la DHS o ENDESA es un diseño estratificado por departamentos y por área de residencia dentro de estos departamentos, cabe mencionar que dentro de los departamentos se hizo una selección separada para el Distrito Central y San Pedro Sula, de este modo se usa como estrato en la declaración del diseño muestral la variable hv023 (Stratification used in sample design).

Además el diseño incluye varias etapas de muestreo, en el que primero se seleccionan hogares, luego mujeres y niños dentro de los hogares, asimismo hombres dentro de los hogares, cada uno de estos sub grupos tienen su propio peso o factor de expansión6 en la muestra. Debido a que estamos trabajando con la base de datos de hogares y de miembros de hogar, el peso a utilizar es el de hogares que corresponde a la variable hv005 (Houshold sample weight [6 decimals]). No obstante, según la Guía estadística de las DHS, dicho valor debe dividirse por 1,000,000 para poder aplicarse a las estimaciones, para esto se genera una variable de peso que se incluirá en la declaración del diseño muestral (ver Programación 2).

Programación 2: Crear variable de peso

capture drop peso

gen peso=hv005/1000000

label var peso "Peso para ponderacion"

En la Programación 2 se observa que antes de generar la variable peso se elimina cualquier otra variable que tenga el mismo nombre haciendo uso del comando capture drop seguido del nombre de la variable. El uso de este comando es opcional, pero es muy útil al procesar datos, ya que generalmente los procesos se repiten y se realizan iteraciones de prueba y error para generar una variable. Si no se incluye este comando y por alguna razón se desea generar la misma variable nuevamente, Stata notificará un error debido a que la variable ya existe.

El comando para generar una variable es generate o gen seguido del nombre de la variable a generar, el signo igual y el valor (o expresión que generará un valor) que contendrá la nueva variable. La tercera línea de comando en la Programación 2 es opcional y corresponden a la creación de una etiqueta para la variable generada, para esto se usa el comando label var seguido del nombre de la variable y la etiqueta o descripción de la misma entre comillas.

La unidad primaria de muestreo corresponde a la variable hv021 (primary sampling unit) que es igual al conglomerado o área de enumeración (hv0001 cluster number). Con estas 3 variables identificadas se procede a declarar el diseño muestral de la encuesta a como se muestra en la Programación 37.

Programación 3: Declaración del diseño muestral de la encuesta

svyset hv021 [pweight=peso], strata(hv023) vce(linearized) singleunit(missing)

El comando que se utiliza para declarar el diseño muestral es svyset seguido de la variable que corresponde a la unidad primaria de muestreo. Le sigue el comando [pweight=] y la variable de peso o ponderación para la población correspondiente (en este caso peso que corresponde a hogares) por lo que se escribe [pweight=peso]. Luego se escribe una coma y se especifican las opciones del diseño muestral: la variable de estratificación strata(), en este caso hv023 por lo que se escribe strata(hv023). Posteriormente se especifica el tipo de estimación de varianza de los errores que por lo general corresponde a estimación lineal de Taylor vce(linearized) (esta opción se aplica por defecto si no se especifica otra cosa). Por último se escribe singleunit(missing) para indicar que se generen valores perdidos para los errores estándar, esta es la opción predeterminada8.

Material del piso adecuado

En esta publicación queremos aproximarnos a la estimación de privación en una de las dimensiones de la pobreza multidimensional diseñada por Honduras. Las variables de identificación de privaciones se generan como variables dummy o dicotómicas, que toman el valor de “0” si no hay privación y toman el valor de “1” si hay privación. Para generar la variable de identificación en privación en material del piso adecuado primero debemos conocer los tipos de materiales del piso que se recopilan en la encuesta y agrupar estas categorías conforme a los criterios de privación definidos por Honduras para su IPM, que corresponde a: la vivienda tiene pisos de tierra u otro material (SCGG-INE, 2017).

La variable que contiene información sobre material del piso es hv2139, y corresponde a la pregunta 136 del cuestionario de hogares10, según la cual las categorías de privación corresponden a los códigos 11 Piso de tierra y 96 Otro, por exclusión las categorías de no privación corresponden a las agrupadas como piso rudimentario (códigos 21 al 24) y piso acabado (códigos 31 al 34). No obstante, es importante siempre verificar que las opciones de respuestas tienen los mismos códigos en la base de datos y en el cuestionario para evitar errores en la creación de otras variables que usan como base estos registros. Para realizar estas verificaciones se aplica la Programación 4A.

Programación 4A: Verificación de códigos de variable hv213 con pregunta 136 del cuestionario de hogar ENDESA 2011/12

tab hv213

tab hv213 if hv213==11

tab hv213 if hv213==96

tab hv213 if hv213>=21&hv213<31

tab hv213 if hv213>=31&hv213<96

La Programación 4A consiste de una serie de tabulaciones de la variable cuyos valores queremos verificar (hv213). El comando para tabular es tab seguido del nombre de la variable, en este caso hv213. El resto de líneas de la Programación 4A son tabulaciones de la variable condicionadas a ciertos criterios. Para condicionar la tabulación se agrega el comando if después de la variable que se desea explorar, luego de if se escribe la condición o criterio para el cual se ejecutará la tabulación especificada.

De este modo, en la segunda y tercera línea de la Programación 4A se realiza tabulación de hv213 si hv213 es igual a 11 y si hv213 es igual a 96, respectivamente. Note que en Stata se debe escribir dos veces el signo igual (==) si se hace referencia a una condición, no así al momento de generar una variable (ver Programación 2). Por su parte la cuarta y quinta línea de la Programación 4A incluyen dos criterios en la expresión que condiciona la tabulación, se realiza tabulación de hv213 si hv213 es igual o mayor a 21 y es menor a 31, es decir si cumplen con los dos criterios, por eso se utiliza la conjunción “y” la cual se representa con ampersand (&) en Stata, dicha conjunción divide los criterios incluidos en la condición. Note que siempre que se especifican intervalos de valores se usa la conjunción y (&) debido a que se deben cumplir ambas partes del criterio a la vez.

Observe que si se desea especificar que un valor es mayor/menor o igual a otro, se escribe ambos símbolos una sola vez, primero el signo mayor/menor seguido del igual (>= o <=). Una especificación de esta forma incluye el número al que se hace referencia. Por or ejemplo en la cuarta línea de la Programación 4A se especifica: tab hv213 if hv213 >= 21 & hv213 < 31, es decir que la condición para tabular hv213 es que dicha variable sea igual o mayor a 21, o sea que se incluye el código 21, por eso se usan los signos: >=; pero menor a 31,  es decir que no se incluye el código 31, por eso solamente se escribe el signo <.

Al ejecutar la Programación 4A se obtienen los resultados mostrados en la Tabla 4A. La primera tabla muestra que hay 10,555 observaciones, es decir que hay valores de la variable hv213 para cada persona en la base de datos, pero que 12 de estas personas no tienen información ya que se les ha asignado el código 99, que generalmente corresponde a un dato omitido. Además se observa que las categorías registradas en las base de datos corresponden a las opciones de respuesta del cuestionario. Por ejemplo, se constata que el código 11 corresponde a piso de tierra (Dirt en la base de datos).

Tabla 4A: Resultado de verificación de códigos de variable hv213 con pregunta 136 del cuestionario de hogar ENDESA 2011/12

Una vez que hemos verificado los códigos y categorías de la variable hv213 procedemos a crear la variable de identificación de privación en material del piso de la vivienda (ver Programación 4B). Denominaremos a esta variable ppiso, y la generaremos igual a missing (.) para evitar errores en la asignación de valores (0 o 1), aunque esto es flexible, se puede generar igual a 0. Luego reemplazamos los valores de la variable con el valor de 1 si existe privación y el valor de 0 si no existe privación, para esto usamos el comando replace seguido del nombre de la variable, el signo igual, el valor por el cual se reemplazará y la condición que debe cumplirse para realizar el reemplazo (la expresión después de if).

Programación 4B: Crear variable de privación en material del piso

capture drop ppiso

gen ppiso=.

replace ppiso=1 if hv213==11|hv213==96

replace ppiso=0 if hv213>=21&hv213<96

label var ppiso "Privacion en material del piso"

label define ppiso 1 "Con privación" 0 "Sin privación", replace

label values ppiso ppiso

tab ppiso

Debido a que existe privación si un hogar posee un piso de tierra (hv213==11) o de otro material11 (hv213==96), se reemplaza la variable por 1 cuando se cumple cualquiera de las dos condiciones, por eso se usa la conjunción “o” que en Stata se registra como una barra vertical (|). Reemplazamos por 0 cuando no hay privación, es decir cuando el piso es de cualquier otro material rústico o acabado, ya verificamos que estas categorías corresponden a los códigos mayores o iguales a 21 y menores a 96. No se incluyen en la creación de la variable los valores omitidos en hv213 (código 99) debido a que no se conoce la respuesta del hogar y por tanto no se puede asumir.

Las líneas de comando quinta a la séptima no son indispensables para la creación de la variable dicotómica, estos comandos se refieren a las etiquetas de variables y de los valores de la misma, es decir de sus categorías. Aunque podrían ser omitidos, aporta claridad el ir nombrando las variables y sus valores en el caso de variables categóricas, así se evitan confusiones.

Por último, recomendamos que al crear una variable nueva en función de otra se verifique la cantidad de observaciones para las cuales hay información en ambas variables, este se hace con el comando tab en la última línea de programación. En la Tabla 4B se observa que la variable generada tiene 100,543 observaciones (ver Tabla 4B), 12 menos que el total de personas en la base (ver prima tabla en Tabla 4A), la diferencia corresponde a los códigos 99 en hv213.

Tabla 4B: Resultado de creación de variable de privación en material del piso

Para estimar la proporción de la población que reside en hogares que tienen privación en el material del piso de la vivienda se ejecuta la Programación 4C. El comando utilizado es svy linearized: proporption (o prop abreviado) este sirve para calcular la proporción en la que se distribuye una variable en la población. Este comando puede utilizarse para estimar proporciones, promedios (svy linearized: mean), razones (svy linearized: ratio) y totales (svy linearized: total) de una variable. 

Programación 4C: Proporción de la población que tiene privación en material del piso de la vivienda

svy linearized: prop ppiso

La Tabla 4C contiene las estimaciones de proporción de la variable ppiso y los datos estadísticos de las mismas. Los datos que aparecen en la parte superior de la tabla hacen referencia a los criterios del diseño muestral en los que se basa la estimación. Posteriormente se presenta la leyenda de las categorías para las cuales se estimó la proporción de una variable. De esta forma para ppiso se estimaron 2 proporciones (pues solo tiene 2 categorías de respuesta), la proporción de personas Sin privación en material del piso de la vivienda (_prop_1) y la proporción de personas Con privación (_prop_2), estos valores aparecen en la segunda columna de la tabla y se deben multiplicar por 100 para obtener un porcentaje.

En la tercera columna se muestra el error estándar de la estimación, este sirve para verificar la significancia estadística de la estimación y por ende su representatividad, si el valor reportado es menor o igual a 0.05 (que corresponde a un 95% de confiabilidad estadística), se considera una estimación aceptable y/o representativa. De manera similar las columnas cuarta y quinta presentan los valores mínimos y máximos del intervalo de confianza de la estimación, es decir los valores entre los cuales la estimación puede variar en la población real, por ejemplo la proporción de población con privación en material del piso puede variar entre 17.64% y 20.18% y seguiría siendo una proporción representativa de la realidad del país. Los datos reportados en las últimas 3 columnas de la Tabla 4C son especialmente útiles para el análisis de variaciones o de diferenciación por grupos poblacionales.

Tabla 4C: Proporción de la población que tiene privación en material del piso de la vivienda

A partir de la Tabla 4C se puede inferir que en el año 2011/2012 el 18.8% de la población hondureña se encontraba privada en cuanto al material del piso de su vivienda, esta proporción es estadísticamente significativa y representativa para la población a nivel nacional, ya que el error estándar es menor a 0.05.

Si quisiéramos saber el porcentaje de hogares que se encuentran privados en material del piso de la vivienda, debemos acotar la estimación a un sub grupo de población, esto es a los jefes de hogar, ya que se puede equiparar la cantidad de hogares con la cantidad de personas identificadas como jefe/a de hogar. Debido a que la información de condiciones de la vivienda es recopilada a nivel de hogar, esta información se repite para cada miembro del hogar, por lo cual no es un problema excluir al resto de miembros de la estimación.

La variable en la que se puede identificar al jefe/a del hogar es sh04 (relación de parentesco con el jefe/a del hogar), para conocer el código que corresponde al jefe de hogar se usa el comando codebook seguido de la variable (sh04) (ver Programación 4D) el cual sirve para explorar el tipo de variable y muestra ejemplos de las categorías incluidas y sus respectivos códigos, o bien de los valores de la variable. En la Tabla 4D se observa que el jefe/a de hogar se identifica con el código 1.

Programación 4D: Explorar variable sh04

codebook sh04

Tabla 4D: Resultado de explorar variable sh04

La estimación de la proporción de privación en material de piso que haga referencia al total de hogares y no de personas puede hacerse de 2 formas. La primera se muestra en la Programación 4E y consiste en agregar una condición para la estimación de la proporción de ppiso, agregando al final de la Programación 3C el comando if seguido del criterio para el cual se aplicará la estimación, es decir para los jefes de hogar (sh04==1).

Programación 4E: Proporción de hogares con privación en material del piso de la vivienda

svy linearized: prop ppiso if sh04==1

La segunda forma en que se puede realizar la misma estimación en Stata es ejecutando la Programación 4F, en la que se agrega la expresión ,subpob (if sh04==1) después de la primera parte del comando svy linearized, indicando que la estimación de la proporción debe hacerse para un grupo de la población o subpoblación que corresponde a las personas jefas de hogar (sh04==1).

Programación 4F: Proporción de hogares con privación en material del piso de la vivienda

svy linearized, subpop(if sh04==1) : proportion ppiso

Como se observa en las Tablas 4E y 4F los resultados de ambas programaciones son los mismos, la única diferencia es que al especificar la estimación explícitamente para una sub población (Programación 4F) los resultados incluyen la cantidad total de observaciones (Number of obs) y la población total estimada (Population size), así como la cantidad de observaciones correspondiente a la sub población (Subpop. no. Obs) y la cantidad de personas estimada para ese grupo (Subpop. Size) (ver Tabla 4F).

Si se realiza la estimación con la Programación 4E, los resultados (proporción, errores estándar e intervalos de confianza) no cambian, pero la referencia de la estimación considera como población total (Population size) al grupo o cantidad de observaciones que cumple la condición especificada (o la sub población), en este caso que la persona sea el jefe de hogar (sh04=1).

Tabla 4E: Proporción de hogares con privación en material del piso de la vivienda

Tabla 4F: Proporción de hogares con privación en material del piso de la vivienda

En base a la Tabla 4F se puede concluir que para 2011/2012 el 17.5% de los hogares hondureños a nivel nacional se encontraban privados en cuanto al material del piso de su vivienda, esta proporción coincide con los hallazgos de la ENDESA (2013) para ese mismo año, según la cual el 17.4% de los hogares residía en una vivienda con piso de tierra y 0.1% residía en viviendas con piso de “otro” material12.

Material de pared adecuado

Para generar la variable de identificación en privación de materiales de las paredes adecuado primero debemos conocer los tipos de materiales de las paredes que se recopilan en la encuesta y agrupar estas categorías conforme a los criterios de privación definidos por Honduras para su IPM: “la vivienda tiene paredes de bahareque, vara o caña o material de desecho” (SCGG-INE, 2017 página 32). La variable que contiene esta información es hv214 (material principal de las paredes) que corresponde a la pregunta 137 del Cuestionario de Hogares de la ENDESA 2011/1213.

Según el cuestionario las opciones de respuesta que corresponden a privaciones en este indicador son: caña/ palmar/ troncos (código 12) que se clasifica como paredes naturales, bahareque/vara (código 25) y material de desecho (26) que se clasifican como paredes rudimentarias. Además en la pregunta 137 se incluyen dos opciones similares a las anteriores: “sin paredes” (código 11) clasificada como pared natural, y “palma/bambú” (código 21) como pared rudimentaria; las cuales aunque no se incluyen expresamente en la definición de privaciones en este indicador según la metodología del IPM, se considerarán como privación ya que son muy similares a los materiales que se consideran inadecuados, en cuanto tampoco brindan seguridad, privacidad y confort que son los criterios generales por los cuales se considera una vivienda adecuada (SCGG-INE, 2017).

Una vez que hemos identificado las opciones de respuesta y los códigos que implican privación en material de las paredes de la vivienda procedemos a verificar que estos códigos coinciden con los registrados en la base de datos. Dichas verificaciones se realizan al ejecutar la Programación 5A, la cual consiste en tabular la variable hv214 (material de las paredes) para diferentes rangos de códigos que están agrupados según el tipo de material. De este modo en la primera línea de la Programación 5A se indica tabular el material de las paredes si el código es 11 o 12; en la segunda línea se pide tabular esta misma variable si su código es 21, 25 o 26; en la tercera línea si el valor de hv214 es mayor a 26. En la Tabla 5A se observa que los códigos y las opciones indicadas en el Cuestionario coinciden con la base de datos, además se verifica que existen datos omitidos para 14 personas, los cuales no se incluirán al crear la variable dicotómica de identificación de la privación.

Programación 5A: Verificación de códigos de variable hv214 con pregunta 137 del cuestionario de hogar ENDESA 2011/12

tab hv214

tab hv214 if hv214==11|hv214==12

tab hv214 if hv214==21|hv214==25|hv214==26

tab hv214 if hv214>26

Tabla 5A: Resultado de la verificación de códigos de variable hv214 con pregunta 137 del cuestionario de hogar ENDESA 2011/12

Para crear la variable de identificación de la privación en material de las paredes de la vivienda, empleamos la Programación 5B. Nuevamente generamos la variable igual a missing (.) y reemplazamos por 1 si hv214 toma valores de códigos de materiales que implican privación: valores menores o iguales a 21, o iguales a 25 o 26; note que se usa la conjunción “o” (|) debido a que se considera privación cualquiera de las 3 condiciones. Por su parte se asigna el valor de 0 a los materiales de pared rudimentarios considerados adecuados (códigos 22 al 24) y a los materiales acabados (códigos mayores de 26 pero menores de 99). Observe en la tercera línea de comandos, que la especificación de estos grupos de materiales se hace definiendo dos intervalos de valores, cada intervalo o condición se agrupa dentro de paréntesis () para que Stata considere los criterios por separado, debido a que cualquiera de los dos conjuntos de criterios implica no privación se usa la conjunción o (|).

Programación 5B: Creación de variable de privación en material de las paredes

capture drop ppared

gen ppared=.

replace ppared=1 if hv214<=21|hv214==25|hv214==26

replace ppared=0 if (hv214>26&hv214<99)|(hv214>=22&hv214<=24)

label var ppared "Privacion en material de las paredes"

label define ppared 1 "Con privación" 0 "Sin privación", replace

label values ppared

tab ppared

En la Tabla 5B se observa que la variable de privación fue creada adecuadamente, generando valores para 100,541 observaciones (personas), omitiendo las observaciones para las cuales no hay información (hv214==99).

Tabla 5B: Resultado de la creación de variable de privación en material de las paredes

A fin de estimar la proporción de hogares que tiene privación en el material de las paredes se utiliza el comando svy linearized: proportion  el cual estima la proporción de una variable (en este caso ppared) para la población estimada en base al diseño muestral antes declarado. Debido a que deseamos estimar la proporción de privación para los hogares y la base de datos está a nivel de personas, se debe acotar la estimación a los jefes de hogares (pues la cantidad de hogares es igual a la cantidad de jefes de hogar) para esto se usa la variable sh04 que contiene el parentesco de los miembros del hogar con el jefe/a del mismo, siendo el código 1  el jefe/a (ver Programación 5C). Como se mencionó anteriormente hay dos formas de incluir una condición en el comando svy linearized usando if (ver Programación 4E) o indicando una sub población (ver Programación 4F), en este caso incluiremos la condición usando if (ver Programación 5C).

Programación 5C: Proporción de hogares con privación en material de las paredes

svy linearized: prop ppared if sh04==1

Tabla 5C: Proporción de hogares con privación en material de las paredes

En base a los resultados presentados en la Tabla 5C se concluye que para 2011/2012 el 6.1% de los hogares hondureños tenía privación en material de las paredes de su vivienda, dicha estimación es significativa pues el error estándar es de 0.0035.

Material de techo adecuado

El mismo procedimiento realizado para identificar la privación en el material del piso y de las paredes de la vivienda se emplea para identificar la privación en el material del techo de la misma. Según el documento Medición Multidimensional de la Pobreza en Honduras (SCGG-INE, 2016) se considera privación si la vivienda tiene techo de Paja, palma o similar o material de desecho u otro. De manera general se considera inadecuado “tener techos en mal estado o de materiales frágiles” (SCGG-INE, 2016 página 68).

En función de estas definiciones, se pueden consideran en privación las opciones de respuesta: sin techo (código 11), paja/palma (código 12), material de desecho (código 22) y otra (código 96) de la pregunta 138 del Cuestionario de Hogares de ENDESA 2001/12 que indaga sobre el principal material de construcción del techo. La variable que contiene esta información en la base de datos es hv215, por lo que se ejecuta la Programación 6A para verificar que las categorías y códigos de respuesta contenidos en la base de datos coinciden con los usados en el Cuestionario de Hogar.

Programación 6A: Verificación de códigos de variable hv215 con pregunta 138 del cuestionario de hogar ENDESA 2011/12

tab hv215

tab hv215 if hv215==11

tab hv215 if hv215==12

tab hv215 if hv215==22

tab hv215 if hv215==21

tab hv215 if hv215>=31

En la Tabla 6A se observa que los códigos y las opciones indicadas en el Cuestionario coinciden con la base de datos, además se verifica que existen datos omitidos para 28 personas, los cuales no se incluirán al crear la variable dicotómica de identificación de la privación.

Tabla 6A: Resultado de la verificación de códigos de variable hv215 con pregunta 138 del cuestionario de hogar ENDESA 2011/12

Para generar la variable de identificación de privación en el material del techo de la vivienda se ejecuta la Programación 6B. La tercera y cuarta línea de comando de la Programación 6B incluyen las condiciones que se deben cumplir para que la variable tome el valor de 1, esto es cuando la variable hv215 toma cualquiera de los valores escritos en la línea de comando, por eso se usa el símbolo |. Por su parte se reemplaza el valor de la variable ptecho por 0 si no hay privación, esto se cumple cuando hv215 es igual a 21 o cuando el techo es de material acabado (opciones 31 a la 35), debido a que el segundo criterio incluye un conjunto de números que se especifica en forma de intervalo, los criterios se escriben entre paréntesis. Por último se crea la etiqueta de la variable y de las categorías de la misma, para luego tabular los resultados.

Programación 6B: Creación de variable de identificación en privación en material del techo de la vivienda

capture drop ptecho

gen ptecho=.

replace ptecho=1 if hv215==11|hv215==12|hv215==22|hv215==96

replace ptecho=0 if hv215==21|(hv215>=31&hv215<96)

label var ptecho "Privacion en material del techo"

label define ptecho 1 "Con privación" 0 "Sin privación", replace

label values ptecho ptecho

tab ptecho

En la Tabla 6B se verifica que los criterios para generar la variable ptecho han sido correctamente especificados pues la cantidad de observaciones es consistente con la distribución de observaciones de la variable hv215 (ver primera parte de la Tabla 6A) y hay un valor para la variable generada para cada observación en la base de datos, a excepción de las observaciones que tenían datos omitidos en la variable original (hv215).

Tabla 6B: Resultado de creación de la variable de identificación en privación en material del techo de la vivienda

Para conocer la proporción de privación de los hogares hondureños en material del techo de su vivienda se ejecuta la Programación 6C. En esta Programación se usa nuevamente el comando svy linearized  y se estima una proporción de la variable ptecho para el total de hogares a nivel de país. Sin embargo, se utiliza la segunda alternativa que se presentó al inicio de este documento para especificar un subgrupo al cual aplique la estimación (ver Programación 4F). Esa alternativa consiste en indicar una sub población, la cual consiste en un grupo de observaciones que cumplen con una condición específica; dicha condición es que la persona sea el jefe/a del hogar (sh04=1) debido a que deseamos estimar la proporción de hogares y no de personas.

Programación 6C: Proporción de hogares con privación en material del techo de su vivienda

svy linearized, subpop(if sh04==1) : proportion ptecho

En la Tabla 6C se observa que al especificar una sub población para la estimación de una proporción aparecen dos parámetros adicionales al inicio de la tabla de resultados, estos son la cantidad de observaciones de la sub población (Subpop. no. obs) y el tamaño de la sub población (Subpo. size). En base a estos resultados se concluye que para 2011/2012 el 1.06% de los hogares tenía privación en el material del techo de su vivienda.

Tabla 6C: Proporción de hogares con privación en material del techo de su vivienda

Privación en condición (materiales) de la vivienda

Ahora que ya se tiene un indicador o variable de identificación de privación para el techo, el piso y las paredes de la vivienda, debe generarse una variable dicotómica en la que se identifique la privación en general en material de construcción de la vivienda, para este caso se considerará que una persona u hogar se encuentra en privación si tiene privación en material de construcción de al menos una parte de la estructura de la vivienda (piso, paredes, techo).

Debido a que en las variables que contienen la información sobre el tipo de material de construcción del piso (hv213), paredes (hv214) y techo (hv215) contienen valores omitidos (valores 99) las variables creadas para identificar privación  excluyeron dichos valores, por lo cual la cantidad de observaciones de estas variables de privación: ppiso, ppared, pptecho no es igual al total de observaciones de las variables originales hv213, hv214 y hv215. Además la cantidad de observaciones para cada  una de las variables de privación no es la misma. Para tener información precisa sobre la cantidad de observaciones de cada variable usamos el comando sumarize o sum de forma abreviada, este comando sirve para conocer información de estadísticas descriptivas básicas de una o más variables, como la cantidad de observaciones, promedio, desviación estándar, valor máximo y mínimo. La aplicación de este comando se muestra en la Programación 7A.

Programación 7A: Exploración de datos de variables de privación en material de la vivienda

sum ppiso ppared ptecho

Tabla 7A: Resultado de exploración de datos de variables de privación en material de la vivienda

Como se observa en la Tabla 7A la cantidad de observaciones de la variables de privación varía entre 100,527 y 100,541 no obstante es probable que haya información sobre un aspecto de la vivienda, pero que esté omitido otro, la Tabla 7A no proporciona información al respecto. Debido a que para estar privado en material de la vivienda baste con estar privado en al menos un tipo de material, no deben incluirse las observaciones que no tienen información completa, es decir que tienen valor perdido (missing) en una o más de estas variables.

Para conocer la cantidad de observaciones que tienen información completa y a la vez realizar un conteo de las privaciones experimentadas por cada unidad de observación (en este caso personas) y así tener una idea sobre la intensidad de la privación general se genera la variable q_pviv (cantidad de privaciones en vivienda), dicha variable se genera como la sumatoria de las variables dicotómicas para privación en piso, paredes y techo, como estas variables solo toman los valores de 1 y 0 la sumatoria indicará la cantidad de privaciones.   Las observaciones que no tienen información (son missing “.”) en cualquiera de las variables ppiso, ppared o ptecho son excluidas de la estimación de la variable q_pviv, dicha exclusión se hace al especificar la suma, pues no se puede sumar un valor omitido con otro, dicha operación genera otro valor pérdido “.”. Realizar las estimaciones de esta manera evita sesgos al no asumir que estos datos omitidos en ppiso, ppared o ptecho son privación o no privación (ver Programación 7B).

Programación 7B: Creación de variable de conteo de privaciones en material de la vivienda

capture drop q_pviv

gen q_pviv=ppiso+ppared+ptecho

label var q_pviv "Cantidad de privaciones en vivienda"

tab q_pviv

El resultado de la Programación 7B (ver Tabla 7B) indica que hay información completa sobre la privación en material del piso, paredes y techo de la vivienda para 100,506 personas (u observaciones).

Tabla 7B: Resultado de la creación de variable de conteo de privaciones en material de la vivienda

A continuación se procede a crear la variable dicotómica o dummy de identificación de privación en los materiales de construcción de la vivienda. Note en la Programación 7C que esta vez la variable se genera igual a 0, dicho valor se reemplazarán por 1 si al menos un indicador de materiales indica privación es igual a 1, por eso en la tercera línea de comando se usa el símbolo | que representa un o porque el cumplimiento de cualquiera de los criterios es suficiente para asignar el valor de 1 a la nueva variable. Por el contrario se reemplazará por missing, si cualquiera de las variables de privación en material de piso, techo o paredes tiene valores omitidos (es missing).

Programación 7C: Creación de variable de privación en materiales de construcción de la vivienda

capture drop pmviv

gen pmviv=0

replace pmviv=1 if ppiso==1|ppared==1|ptecho==1

replace pmviv=. if ppiso==.|ppared==.|ptecho==.

label var pmviv "Privacion en material de la vivienda"

label define pmviv 1 "Con privación" 0 "Sin privación", replace

label values pmviv pmviv

tab pmviv

tab pmviv q_pviv

De esta forma se obtiene una variable con información para 100,506 observaciones, lo cual coincide con la cantidad de observaciones de la variable cantidad de privaciones en material de la vivienda (q_pviv). Al tabular ambas variables (pmviv y q_pviv) se observa en la Tabla 7C que la mayoría de las personas con privación en materiales de la vivienda están privadas solo en uno de los materiales, una cantidad menor está privada en los 3 tipos de materiales.

Tabla 7C: Resultado de la creación de variable de privación en materiales de construcción de la vivienda

Para conocer la proporción de la privación en la población se aplica la Programación 7D, cuyos resultados (ver Tabla 7D) indican que el 21.4% de la población se encuentra privado en los materiales de construcción de su vivienda, teniendo al menos un tipo de material de construcción inadecuado.

Programación 7D: Proporción de personas con privación en materiales de construcción de la vivienda

svy linearized: proportion pmviv

Tabla 7D: Proporción de personas con privación en materiales de construcción de la vivienda

Tarea

Estimar la proporción de hogares con privación en material de la vivienda. Si se realizó el procedimiento adecuado el resultado obtenido debe coincidir con el siguiente:

Pista: Solo tomar el subgrupo de jefes del hogar.

Tabla 8: Resultado esperado de la tarea

Te invitamos a continuar la serie de tutoriales. Puedes ver la ruta de aprendizaje recomendada en: https://escueladedatos.online/serie-de-tutoriales-conociendo-los-indicadores-de-pobreza-de-centroamerica/

¡Gracias por darte el tiempo de conocer un poco más sobre los indicadores de pobreza en Centroamérica! Emperamos que haya sido de mucho provecho.

Notas

1 La agregación consiste en estimar indicadores que reflejen la condición de pobreza de la población o los hogares, uniendo en una sola medida la identificación de la situación de pobreza de cada persona u hogar. En el caso de la pobreza multidimensional esto se hace usando el método Alkire-Foster desarrollado por la Oxford Poverty & Human Development Initiative de la Universidad de Oxford.

2 Se puede acceder a este documento en el siguiente link: http://ipm.scgg.gob.hn/wp-content/uploads/2019/08/IPM_SINTESIS_SERIE_12_16_Final.pdf

3 El ratio de Engels se deriva de la Ley de Engels la cual postula que la proporción del ingreso destinada al consumo de alimentos disminuye a medida que aumenta el ingreso del hogar/persona. El ratio de Engels se obtiene al observar el comportamiento de consumo de un grupo de hogares de referencia, generalmente los que satisfacen sus requerimientos alimentarios básicos.

4 Antes de 2008 el ingreso de los hogares se estimaba considerando solamente el ingreso por trabajo de la ocupación principal, a este ingreso se aplicaba un factor de corrección por sub declaración de ingresos que fue estimado en 1993.

5 Los datos más recientes corresponden a los de la EPHPM de 2017, y se pueden consultar en el siguiente link: http://170.238.108.227/binhnd/RpWebEngine.exe/Portal?BASE=EPH2017&lang=ESP

6 El peso factor de expansión técnicamente es el inverso de la probabilidad de una unidad de ser seleccionada para la muestra, de manera práctica es la cantidad de unidades de población que esa muestra representa. Por ejemplo, si el peso de un hogar es 23 quiere decir que ese hogar representa a 23 hogares en las estimaciones poblacionales.

7 Para mayores detalles al respecto ver “Declarando el diseño muestral” en Recursos complementarios. Link: https://escueladedatos.online/una-mirada-a-los-indicadores-de-pobreza-en-centroamerica-utilizando-stata-nicaragua/

8 Mayores detalles sobre los comandos que pueden ser utilizados en combinación con el comando svy vea “Declarando el diseño muestral” en Recursos complementarios. Link: https://escueladedatos.online/una-mirada-a-los-indicadores-de-pobreza-en-centroamerica-utilizando-stata-nicaragua/

9 Para buscar una variable se escribe una palabra clave en la barra de búsqueda del panel variables en Stata.

10 Ver página 541 del Informe de resultados de ENDESA 2011-2012 disponible en: https://dhsprogram.com/pubs/pdf/FR274/FR274.pdf

11 No queda explícito en los documentos de la SCGG e INE pero se asume que ese otro material no incluye materiales rústicos ni acabados.

12 Ver página 60 del informe ENDESA 2011/2012. Se puede acceder al documento en: https://dhsprogram.com/pubs/pdf/FR274/FR274.pdf

13 Ver página 541 del Informe de resultados de ENDESA 2011-2012 disponible en: https://dhsprogram.com/pubs/pdf/FR274/FR274.pdf

Bibliografía

INE. (2009). Resumen ejecutivo XXXVIII Encuesta Permanente de Hogares de Propósitos Múltiples – EPHPM –. Tegucigalpa.

INE-Secretaría de Salud. (2013). Encuesta Nacional de Demografía y Salud ENDESA 2011-2012. Tegucigalpa.

SCGG-INE. (2017). Evolución Índice de la Pobreza Multidimensional-Honduras. Tegucigalpa.

Croft, Trevor N., Aileen M. J. Marshall, Courtney K. Allen, et al. 2018. Guide to DHS Statistics. Rockville, Maryland, USA: ICF. https://dhsprogram.com/Data/Guide-to-DHS-Statistics/index.cfm