Las encuestas son una de las principales y más antiguas herramientas de recolección de datos. Son especialmente utilizadas para analizar las preferencias y hábitos de las personas. Las encuestas son el principal insumo para la elaboración de indicadores como el nivel de pobreza, empleo, escolaridad, mortalidad materna, preferencia política, entre otros.

Esta entrada:

  • Te introduce al mundo de las encuestas
  • Comparte elementos a considerar durante la planificación de una encuesta
  • Explica conceptos básicos de muestreo

 ¿Qué es una encuesta?

La definición de encuesta varía según el autor y el área de la ciencia donde es utilizada. Sin embargo, todas estas definiciones tienen puntos de encuentro. Una definición que resume estos puntos es la de Fowler (2014), que considera la encuesta como una herramienta para producir estadísticas cuantitativas, numéricas o descriptivas sobre aspectos de una población a través del análisis de una muestra.

Tipos de encuestas

Las hay de distintas formas, tamaños y colores, pero se pueden agrupar en tres grandes grupos: 

  • Encuestas por entrevistas cara a cara
  • Telefónicas
  • Online/offline. 

Estos tres tipos de encuesta indagan por aspectos tanto cuantitativos como cualitativos.

Las encuestas que indagan principalmente por aspectos cuantitativos son las más utilizadas y generalmente tienen las siguientes 3 características:

  1. El propósito de la encuesta es producir estadísticas que serán utilizadas para describir características de una población.
  2. La encuesta es contestada directamente por personas pertenecientes a la población en estudio, luego estas respuestas constituyen la base de datos a analizar.
  3. La información es recolectada de una fracción de la población, en lugar de toda la población, en otras palabras, la información es obtenida de una muestra.

En este tipo de encuesta se centrarán las siguientes explicaciones y ejemplos.

Proceso de elaboración de una encuesta

Pregunta de investigación

Las encuestas son herramientas de investigación, por ende, buscan indagar sobre un problema y se plantean preguntas a investigar. Por ejemplo, asuma el lector que está realizando una investigación que busca conocer la situación de las mujeres en el mercado de trabajo. Una posible pregunta sería: ¿por qué las mujeres reciben salarios menores en relación a los hombres cuando ambos tienen el mismo nivel educativo? Para que el lector pueda responder esta pregunta, debe pensar en los indicadores o valores que le ayudarán a describir el problema planteado, por ejemplo, tendría que conocer el nivel de ingresos de mujeres y hombres, los años de estudio aprobados, el cargo en el lugar de trabajo, etc. Si esta información no se encuentra disponible, el lector tendrá que diseñar una encuesta que le permita calcular los indicadores de interés.

Diseño de encuesta

En esta etapa se identifican las preguntas y protocolos de la encuesta. Las preguntas deben estar en línea con los objetivos de investigación y deben estar estandarizadas, de tal forma que se evite inducir una respuesta a las personas entrevistadas, malas interpretaciones u omisiones. Los protocolos son los manuales que definen claramente la correcta aplicación de la encuesta.

Muestreo

La muestra es un pequeño subgrupo de una población que representa a toda la población. La muestra son aquellas personas, empresas, instituciones o cosas de las que se obtiene información que luego será utilizada para hacer conclusiones representativas para toda la población. El muestreo se realiza utilizando procedimientos estadísticos y probabilísticos que aseguren la confiabilidad de la muestra.

Capacitación de encuestadores

La calidad de los datos depende en gran medida de la preparación de las personas que realizarán la encuesta. Es de vital importancia que todas las personas involucradas en el proceso de levantamiento de información comprendan a detalle la encuesta y la apliquen de forma imparcial, evitando interpretaciones individuales o sesgos que pongan en riesgo la calidad de los datos. Las encuestas con adecuados procesos de capacitación cuentan con manuales que orientan a los encuestadores en la correcta aplicación de la encuesta.

Pilotaje y aplicación

Se dice que una encuesta es como un avión, porque más vale que detectemos una falla en el motor antes de despegar que en pleno vuelo.

El pilotaje es el proceso donde se pone a prueba la encuesta. Se recrea el mismo o el más próximo escenario que se tendrá al realizar la encuesta. El proceso de pilotaje permite identificar errores que afectan la calidad de los datos.

Por ejemplo, en una investigación que tiene como objetivo conocer el estado de salud de las mujeres embarazadas de un país, se debe hacer un pilotaje de la encuesta con el fin de identificar preguntas que son mal entendidas por la encuestada, identificar si es mejor que un hombre o una mujer aplique la encuesta a mujeres embarazadas o identificar si es mejor encuestar por la mañana o por la tarde.

El proceso de aplicación de la encuesta es cuando el avión ya ha despegado. En esta etapa se debe dar seguimiento al personal que está aplicando la encuesta, asegurar que se cumpla con la totalidad de la muestra y con los protocolos de aplicación.

Procesamiento y análisis

La etapa de procesamiento de las encuestas es cada vez más rápida y fiable. El uso de entrevistas asistidas por computadoras (CAPI por sus siglas en ingles) ha acortado al máximo los procesos de recolección y procesamiento de datos, así como los costos de aplicación de las encuestas. En la actualidad son muy pocas las instituciones que siguen utilizando encuestas de papel para recolectar información, la mayoría están utilizando tablets o smartphones conectados directamente con servidores en la nube, permitiendo conocer en tiempo real el progreso de la encuesta y los errores. Aquellas instituciones que aún usan papel, deben contratar a muchas personas para digitar manualmente la información de cada encuesta, incrementando de esta forma el error humano y el tiempo de procesamiento de la información. Existen otros métodos computarizados de recolección y procesamiento de datos como las auto entrevista por audio asistidas por computadora (ACASI por sus siglas en ingles), entrevistas telefónicas asistidas por computadora (CATI), sistemas de respuesta vocal interactivo (IVR) y encuestas web.

Programas populares utilizados para la recolección y procesamiento de datos:

En una primera etapa del procesamiento de las encuestas se obtiene una base de datos bruta. Sobre esta base de datos se realizan pruebas de inconsistencias para identificar valores atípicos que afectan la calidad de los datos. Una vez realizadas estas pruebas de inconsistencias se obtiene una base de datos limpia o neta que se usará en la etapa de análisis.

La etapa de análisis es probablemente la mas emocionante de todo el proceso, aquí es donde se contrasta la información recolectada con los objetivos de la investigación.

Muestreo

Al elaborar una investigación que requiera el uso de encuestas, usualmente la población es tan grande que no es posible encuestar a todas las personas. Por este motivo se debe seleccionar cuidadosamente a una fracción de la población que refleje las características de la población. A esta fracción de la población se le conoce como muestra.

Los métodos de muestreo están clasificados en probabilísticos y no probabilísticos.

Muestreos probabilísticos

Los muestreos probabilísticos utilizan métodos de selección de muestra aleatoria. La consideración más importante en este proceso es que todos los miembros de la población tengan la misma probabilidad de ser elegidos. El muestreo probabilístico es la mejor forma de obtener muestras representativas de una población.

Algunos de los tipos de muestreo probabilísticos más comunes son:

  • Muestreo aleatorio simple: Es la forma más básica de selección de muestra, donde se asume que los miembros de una población son únicos y cuentan con la misma probabilidad de ser elegidos. Operacionalmente, hacer una selección aleatoria simple requiere de un listado de la población. Por ejemplo, si en una población hay 5,000 personas y el objetivo es seleccionar una muestra de 100 personas, se tendrá que crear un listado con las 5,000 personas enumeradas del 1 a 5,000. Luego utilizando una tabla de numero aleatorios o un generados de números aleatorios (por ejemplo, en Excel) se selecciona la muestra de 100 personas dentro del rango de 1 a 5,000. Estos 100 individuos seleccionados constituyen una muestra aleatoria simple.
  • Muestreo sistemático: Este proceso también involucra crear un listado de la población. Se selecciona a los individuos que cumplen un intervalo definido por el tamaño de la población y el tamaño de la muestra. Por ejemplo, si se tiene un listado de 5,000 personas (imagine el listado ordenado de forma horizontal de menor a mayor) que representan la población y se espera seleccionar a 100 personas, el intervalo que definirá la muestra será el resultado de dividir 5,000/100 = 50. El número de arranque para iniciar la selección será escogido aleatoriamente dentro del intervalo de 1 a 50. Asumiendo que el número de arranque seleccionado fue 10, esto significa que la primera persona seleccionada será la ubicada en el registro 10, la segunda persona seccionada corresponderá a la ubicada 50 posiciones más adelante, en otras palabras, la ubicada en el registro 60. Y así sucesivamente hasta completar la muestra de 100 personas.
  • Muestreo estratificado: Este proceso se lleva a cabo cuando interesa obtener muestras representativas a nivel de estratos o grupos que son diferentes entre sí. Es un método popularmente utilizado en encuestas nacionales. Por ejemplo, en una encuesta que busque conocer las preferencias políticas de las personas a nivel urbano y rural, se tendrá que seleccionar aleatoriamente la muestra dentro de cada estrato urbano y rural (una “tómbola” para la zona urbana y otra para la rural), asegurando que cada persona dentro de cada estrato tenga la misma probabilidad de ser elegida. Si no se hace esto, se corre el riesgo de tener sesgos de selección, lo que quiere decir que, si se tiene a todas las personas que viven en la zona rural y urbana en la misma “tómbola”, sin considerar los estratos, podríamos seleccionar más personas de la zona urbana y menos de la rural. Esto ocasionará sobrestimación de los resultados de la zona urbana y una subestimación de los resultados de la zona rural.
  • Muestreo por conglomerados: Este muestreo divide la población en grupos como lo hace el muestreo estratificado, sin embargo, funciona de forma inversa. El muestreo por conglomerado asume que los grupos son iguales entre sí. Un criterio habitual para definir los conglomerados es el geográfico. Por ejemplo, si se quiere estudiar a las personas con diabetes en todo el país, se puede dividir el país por departamentos y seleccionar algunas de estos para estudiarlos, esto siempre y cuando no haya indicios para pensar que la cantidad de las personas con diabetes varíe por departamento. Si no hay variaciones, es posible escoger algunos de los departamentos aleatoriamente para estudiarlos.

Herramienta para calcular el tamaño de la muestra probabilística: https://www.surveymonkey.com/mp/sample-size-calculator/ 

Muestreos no probabilísticos

Estos muestreos no seleccionan aleatoriamente la muestra, en lugar de eso la muestra se define subjetivamente, por consiguiente, no es posible saber la probabilidad de selección de un elemento de la muestra. ¿Por qué alguien consideraría usar muestreo no probabilístico? En muchas ocasiones la población no está bien definida o no hay interés en inferir sobre la población usando la muestra. Probablemente la razón más común es que los muestreos no probabilísticos son menos costosos que los muestreos probabilísticos y porque suelen ser implementados de forma mas rápida.

Aquí algunos de los tipos de muestreo no probabilísticos más populares: 

  • Muestro por cuota: La idea principal de este muestreo es completar una cantidad especifica de encuestas o entrevistas por grupos de la población. Idealmente el tamaño de la muestra es basado en características previamente conocidas de la población (como información de censos). Por ejemplo, en una investigación que busca conocer la opinión de los jóvenes en relación a la legalización de la marihuana se espera encuestar a 200 personas de 18 a 30 años (100 hombres y 100 mujeres). La información será analizada únicamente cuando se alcancen las cuotas para cada sexo.
  • Muestreo intencional: El principal objetivo es producir una muestra que pueda ser considerada “representativa” de la población. Idealmente la selección es llevada a cabo por expertos o expertas en el área de estudio que puedan identificar características de la muestra que contribuyan a la representatividad. Por ejemplo, en un estudio que busque conocer la situación de las pequeñas empresas en un país, inicialmente se deben definir las características que “representan” a la oblación de las pequeñas empresas, por ejemplo, la cantidad de trabajadores, afiliaciones al seguro social, horas extras a la semana, escolaridad de los empleados, actividad económica, etc. Una vez definidas las características se procede a seleccionar a las empresas que cumplan los parámetros de selección para luego ser analizadas.
  • Muestreo de bola de nieve: Este muestreo localiza a individuos que conducen a otros. En popularmente utilizado en estudios sobre delincuencia, tribus urbanas, enfermedades u otros.  

Al hacer una encuesta siempre toma en cuenta las ventajas y limitantes de los tipos de muestreo. Un proceso de muestreo adecuado será el determinante principal de la calidad de los datos que obtengas.

Lectura recomendada: 

Survey Research Methods. 5th Edition. Floyd Fowler, jr. 2014.