¿Cómo se cocina la Encuesta de Población Activa (EPA)?

¿Cómo se elige el muestreo de la EPA?

Cada tres meses, como un mantra, todos los medios de comunicación, políticos, empresas de recursos humanos e investigadores (entre otros) centran su atención en la publicación de la EPA. Todos los actores implicados hablan con supuesta soltura y manejo de las subidas, bajadas o estancamientos del paro, de la población activa o de la población ocupada…ahora bien, ¿Conocemos realmente la EPA? ¿Sabemos cómo, cuándo y quién la realiza? ¿Qué ventajas presenta respecto a otros datos de empleo?

La Encuesta de Población Activa

EPA es el acrónimo de Encuesta de Población Activa. Como su propio nombre indica se trata de una fuente de datos realizada mediante encuestas y publicada por el Instituto Nacional de Estadística –INE a partir de ahora– desde el año 1964. Su principal objetivo es el de informar y contabilizar la situación laboral de las personas clasificándolas en ocupadas, paradas, activas e inactivas.

Desde sus inicios, exceptuando el periodo que va de 1969 a 1974, se ha publicado de manera periódica cada 3 meses, y a lo largo de su vida ha experimentado algunos cambios en su estructura. El primero de ellos se realizó en 1987 con el objetivo de adaptarlas al conjunto de registros europeos de fuerza de trabajo y para armonizarla conforme a los preceptos establecidos por la Conferencia Internacional de Estadísticos del Trabajo (Ginebra, 1982).

Más tarde, en 1999, se realizaron diversas adaptaciones al cuestionario –preguntas que se realizan a los entrevistados– y, como explicaremos más adelante, éste se convirtió en “continuo”. En el año 2002 se estableció una nueva definición operativa del concepto paro. Finalmente, desde el año 2005, la EPA cuenta con una sólida estructura que nos permite establecer comparaciones del mercado laboral con otros países y con otros años.

¿Qué es la EPA?

Según el INE (2008):

“La EPA es una investigación por muestreo de periodicidad trimestral, (…) dirigida a la población que reside en viviendas familiares del territorio nacional y cuya finalidad es averiguar las características de dicha población en relación con el mercado de trabajo” (INE, 2008: 3-4).

Para las personas que no contamos con un bagaje estadístico amplio lo de investigación por muestreo puede sonarnos a chino y puede llevarnos a malinterpretaciones: el muestreo según Healey (2005) es un proceso de selección de un conjunto de individuos o personas que se realiza para poder:

  1. estudiar a dicho grupo en profundidad y mediante sus características poder
  2. hacer inferencias (establecer conclusiones) y
  3. realizar extrapolaciones al conjunto de la sociedad (Healey, 2005: 155).

Es decir, es una técnica que permite estudiar a un grupo reducido de personas y a partir de las conclusiones obtenidas, realizar generalizaciones para un país.

¿Cómo se realiza el muestreo de la EPA?

En el caso de la EPA el ejemplo del muestreo es sencillo: queremos saber qué porcentaje de la población se encuentra desempleada o qué porcentaje de la población trabaja en una ocupación concreta del sector servicios.

Métodos para realizar una encuesta: el muestreo

Para ello podríamos o realizar una encuesta a los 46.116.884 ciudadanos (Pyramid, 2018) y preguntarles por su situación laboral actual, o bien seleccionar aleatoriamente a un grupo reducido de la población –240.000 personas en el caso de la EPA– y mediante las respuestas que nos den, realizar extrapolaciones y generalizaciones al resto de la población.

Ambos métodos presentan complicaciones, ya que mientras que para poder realizar una encuesta a toda la población necesitaríamos muchos encuestadores y demasiado tiempo y dinero –factores que la hacen cuasi-inviable–, al seleccionar a sólo una pequeña muestra de la población podemos caer en falsas generalizaciones.

Mientras que para las primeras limitaciones no podemos hacer más que poner más recursos económicos y no económicos, las restricciones impuestas por el muestreo pueden tener dos soluciones estadísticas sencillas: el margen de error muestral y el nivel de confianza.

Margen de error muestral

Por una parte, el margen de error es una fórmula estadística que nos permite calcular forma muy sencilla la máxima disimilitud/diferencia entre los datos observados en la muestra –personas que hemos entrevistados– y los datos reales de la población de estudio –en este caso los ciudadanos de España–.

Nivel de confianza de la EPA

Por otra parte, el nivel de confianza nos permite saber con seguridad y exactitud que los datos que estemos manejando se encuentren dentro del margen de error. Ambos índices se publican siempre con la EPA y se expresan normalmente de la siguiente manera: Los resultados obtenidos en la muestra seleccionada tienen un margen de error del +-2% y un nivel de confianza del 99%.

El muestreo es una técnica que permite estudiar a un grupo reducido de personas y a partir de las conclusiones obtenidas, realizar generalizaciones para un país.

 

¿Quién es encuestado por la EPA?

Para poder realizar un muestreo que sea aleatorio –de otra forma los datos no tendrían validez–, el INE decide hacer uso de otras fuentes de datos como el censo o el padrón continuo. Como antes hemos comentado, la muestra de la EPA está compuesta por las personas que residen en viviendas familiares del territorio nacional y alojamientos fijos (chabolas, cuevas etc.) (INE, 2008:4). Es decir, está constituida por las personas que viven en un hogar sean o no familia.

Este factor la convierte en una encuesta especialmente interesante para los investigadores ya que además de poder observar las relaciones de los individuos con el mercado de trabajo, permite analizar las dinámicas familiares –quién realiza el trabajo remunerado y no remunerado, qué patrones laborales tienen las familias con hijos pequeños a su cargo, qué formación familiar es la más típica entre los jóvenes, etc.–.

¿Por qué se encuesta a determinados hogares y no a otros?

No obstante, para poder llegar a unos pocos hogares y con ellos hacer extrapolaciones al resto de viviendas de la geografía española el INE debe hacer un “encaje de bolillos” y seleccionar a un conjunto muy reducido de hogares que sean representativos. Para ello, en cada una de las 50 provincias –se incluyen los enclaves en África– se seleccionan un número determinado de distritos municipales.

En cada uno de los distritos municipales se establecen las secciones censales, que al igual que las secciones electorales, deben tener entre 500 y 2.000 electores. Estas secciones son revisadas y modificadas periódicamente para evitar desfases demográficos, ya que algunas unidades censales con el paso del tiempo se quedan sin población y otras superan con creces la limitación de 2.000 electores.

Una vez establecidas las unidades censales se seleccionan un conjunto de ellas de manera aleatoria atendiendo a dos criterios principales: el criterio geográfico-territorial o de estratificación, y el criterio socioeconómico o de subestratificación (INE, 2016: 7). Es decir, primero se organizan las unidades teniendo en cuenta la proporcionalidad entre provincias y una vez establecida dicha proporcionalidad, se establece en cada una de las provincias una subestratificación basada en criterios socioeconómicos.

Una vez establecidas las secciones censales se procede a hacer un estudio de las viviendas que se encuentran en cada una de las unidades censales para evitar entrevistar a las personas que ya hubiesen sido entrevistadas previamente.

Finalmente, se seleccionan un total de 60.000 viviendas aproximadamente, cuyos habitantes serán los que respondan a los entrevistadores. Tras la preselección de las viviendas susceptibles de ser entrevistadas, los trabajadores del INE comienzan con una fase de exploración en la que además de contactar con las personas residentes en dichos hogares, les informan sobre las metodologías con las que trabajarán y les ofrecen la posibilidad de participar en el estudio.

Llegado el momento, una gran parte de los residentes de los hogares dan su aprobación –en parte por la obligación impuesta por la Ley de la Función Estadística Pública– y deciden participar en el proceso de elaboración de la encuesta. A partir de ese momento, podríamos decir, pasan a formar parte de la muestra durante al menos 6 trimestres; o lo que es lo mismo, durante al menos un año y medio.

¿Se entrevista siempre a los mismos hogares y personas en la EPA?

Si bien lo ideal en fuentes de datos de este tipo sería entrevistar a los mismos hogares y personas durante toda la vida –es lo que se conoce como una fuente de datos longitudinal o de datos panel–, la experiencia demuestra que su aplicación además de costosa en términos económicos puede dar lugar a problemas de atrición –muestra que pierde interés y deja de participar en el estudio–.

Para solucionar esta posible pérdida de interés por parte de los entrevistados, en la EPA se utiliza una técnica conocida como panel rotatorio o pseudopanel. Es decir, se entrevistan a los mismos hogares de manera periódica hasta un máximo de 6 veces.

Esta característica permite tener una ventana de observación de cada hogar/individuo durante un año y medio, pero no permite ni aplicar técnicas longitudinales ni analizar de manera correcta las lentas transiciones que se dan en el mercado laboral.

Finalmente, una vez que los entrevistadores han pasado los cuestionarios en un determinado hogar durante 6 trimestres, realizan un reemplazo de dicha vivienda por otra que se encuentre en la misma unidad censal. Estos reemplazos se hacen de manera proporcional, de forma que cada trimestre se renueva una sexta parte de la muestra –unos 20.000 hogares aproximadamente–.

¿A quién se entrevista realmente en la EPA?

Para poder tener información de todas las personas de un hogar –incluyendo a jubilados, estudiantes y niños– sin entrevistarlas a todas, el INE designa lo que se conoce como “persona responsable del hogar”. Dicha persona –que varía en cada caso particular– es la encargada de responder por todos los miembros que habiten en el hogar y de hablar con los investigadores del INE.

El formato de entrevista con la persona responsable del hogar en una primera instancia puede realizarse de manera presencial –no es un requisito fundamental– para así explicarle los contenidos del cuestionario, el orden y los procedimientos a seguir.

A partir de la primera entrevista, las cinco siguientes se realizan de manera telefónica asistida por ordenador. Las entrevistas se realizan durante una semana concreta y todas las preguntas que se realizan durante la misma se refieren a “la semana de referencia”: la semana anterior a la entrevista. Para poder entrevistar a los 60.000 los hogares cada tres meses las encuestas se pasan durante todas las semanas del trimestre, consiguiendo de esta manera que la EPA sea un cuestionario continuo.

¿Por qué la EPA es la mejor fuente de datos laborales?

La Encuesta de Población Activa no es la única fuente que permite analizar las dinámicas laborales de la población en España. Además de ella, la siguiente fuente más fiable es la proporcionada por el registro laboral del Servicio Público de Empleo Estatal (Ministerio de Empleo y Seguridad Social, 2018), que aporta unos datos parecidos. No obstante, gracias a la naturaleza de encuesta/entrevista de la EPA, los datos de paro registrados por el INE tienen mucha más fiabilidad que los registrados por el SEPE por diversos motivos.

En primer lugar, cabe destacar que los datos proporcionados por el SEPE tienen únicamente en cuenta a aquellos desempleados que se encuentran activamente buscando empleo y que además acuden periódicamente a actualizar su situación a las oficinas de empleo.

Este hecho, en un mundo en el que las oficinas de empleo sólo sirven para dar prestaciones por desempleo, hace que la estadística esté sesgada ya que nunca contemplará al número real de parados –aquellos que nunca han pasado por los servicios de empleo pero que están desempleados, aquellos que han dejado de ir a los servicios de empleo porque ya no reciben prestación y conocen bien la capacidad de éstos de conseguir un empleo, etc.–, ni al número real de trabajadores –aquellos que trabajan “en negro” o aquellos que cobran en especie– .

Los datos de la EPA, sin embargo, no tienen en cuenta el registro oficial, sino que preguntan directamente a las personas por su situación percibida.

En segundo lugar, cabe reseñar que la cantidad de información obtenida por la EPA en cada uno de los hogares es superior a cualquier otra fuente de datos, lo que permite realizar análisis estadísticos que no sólo midan el paro.

Asimismo, otras de las características que la hace muy idónea es su comparabilidad con otras fuentes de datos internacionales. Finalmente destacar que otra de las grandes cualidades de la EPA es su publicación ininterrumpida, hecho que la ha llevado a ser la base de datos de empleo con más observaciones y ediciones.

Bibliografía:

  • Healey, J. (2005) “Statistics: a tool for social research”. Thomson Wadsworth
  • Instituto Nacional de Estadística (2008): Metodología EPA 2005 Descripción de la encuesta
  • Instituto Nacional de Estadística (2008): Informe técnico de diseño de la Encuesta y Evaluación de los Datos de la Encuesta de Población Activa
  • Ministerio de Empleo y Seguridad Social (2018). “Sistema de Información de los Servicios Públicos de Empleo: registro”
  • Population Pyramid (2018): “la pirámide de población en España”.

por Juan Ramón Jiménez-García.

Docente e investigador en la U. Pompeu Fabra, especializado en desigualdades de género, mercado laboral, sistema educativo e inmigración. Compagina su labor académica con su trabajo como prospector empresarial en el Área de Protección Internacional de la ONG CEPAIM.