El sesgo de supervivencia y el análisis económico

Abraham Wald fue un matemático húngaro experto en análisis estadístico y econométrico, geometría y teoría de la decisión. En 1931 se doctoró en Matemáticas por la Universidad de Viena bajo los auspicios de Karl Menger (el hijo del famoso economista), pero pese a su brillantez nunca le dejaron acceder a un puesto universitario: era judío, y el gobierno austríaco pro-nazi de entonces no lo permitía. En 1938, temiendo por su vida, emigró a Estados Unidos, aprovechando una invitación de la Comisión Cowles para la Investigación Económica (cuna de numerosos premios Nobel de Economía). Un día, en plena Segunda Guerra Mundial, recibió una visita inesperada de unos representantes del servicio de análisis del ministerio de Defensa para pedirle consejo. En la reunión le enseñaron un gráfico parecido al que encabeza esta entrada.

Según le contaron, el Centro de Análisis Naval había hecho un estudio de los daños sufridos por las aeronaves que habían regresado de misiones bélicas: los puntos rojos reflejaban los impactos recibidos, y el objetivo era blindar las zonas de mayor probabilidad de daño para reforzar la seguridad de los pilotos minimizando los efectos sobre la estabilidad y la rapidez de los aviones (derivadas del mayor peso). Los militares, que le propusieron distintas alternativas de refuerzo, se quedaron estupefactos cuando Wald les dijo que el gráfico había que interpretarlo justo al revés. En efecto, el estudio de Defensa sólo había tomado en consideración la muestra de aviones que habían sobrevivido a sus misiones, obviando todos aquellos que habían sido derribados y no habían regresado. Los agujeros del fuselaje eran por tanto zonas en las que los aviones podían permitirse recibir impactos y aun así regresar a salvo a la base, mientras que las zonas que aparecían intactas en los aviones de la muestra eran precisamente aquellas más críticas y cuyo impacto resultaba letal, por lo que eran las más susceptibles de refuerzo.

Desde entonces este problema se conoce como “sesgo de supervivencia” o “sesgo del superviviente”, un sesgo de selección derivado de considerar en un proceso sólo a las personas o elementos supervivientes, obviando la consideración de los desaparecidos por no ser observables en una muestra (que deja de ser representativa de la población).

Este sesgo está relacionado en el ámbito de la estadística con lo que se conoce como «efecto composición», o efecto derivado de la variación de los componentes de una muestra, y que altera las medidas centrales y de dispersión, lo que puede desvirtuar el análisis. Sala-i-Martí lo describe muy bien con un sencillo ejemplo: supongamos que en una economía hay tres trabajadores que cobran 1.000, 2.000 y 3.000 euros, respectivamente, de modo que la media salarial es de 2.000 euros. Si la economía va bien y todos experimentasen una subida salarial del 10%, el salario medio subiría también un 10%. Ahora imaginemos, sin embargo, que hay una crisis y que despiden al que cobraba 1.000 y congelan el salario de los demás. El resultado es que el salario medio ha subido y es ahora de 2.500, cuando nadie ha visto un euro más. A eso se le llama efecto composición. Como en las recesiones suele ser más frecuente el despido de trabajadores menos cualificados (y por ello con menores salarios), normalmente el salario medio sube en época de recesión, y ello no quiere decir necesariamente que los trabajadores de mayores salarios o los directivos se hayan beneficiado de subidas salariales durante la crisis (puede ocurrir, pero el salario medio no es una buena medida de ello).

El sesgo de supervivencia (y el efecto composición) se da también a menudo en la selección de la muestra de empresas que ocupan a dichos trabajadores. Así, en un análisis de cómo han evolucionado los salarios de las empresas durante una crisis económica muchas veces se consideran tan sólo las empresas de cada año, es decir, las supervivientes, obviando los efectos de las empresas que han cerrado y cuyos salarios dejan de computarse (o cuyos trabajadores, una vez reempleados, podrían estar dispuestos a aceptar salarios menores). Así, por ejemplo, el gráfico de más abajo, sacado de un informe del Consejo Económico y Social, refleja que más de un tercio de la destrucción de empleo producida en España entre 2007 y 2012 se produjo por cierres empresariales, no por despidos. No es fácil por desgracia estimar el impacto de los cierres patronales y recolocaciones de trabajadores sobre los salarios, distinguiéndolos adecuadamente de la flexibilidad salarial en empresas que sobreviven. Para colmo, el Ministerio de Empleo y Seguridad Social no ayuda demasiado y ha dejado de ofrecer este desglose a partir de 2012.

CREACIÓN Y DESTRUCCIÓN DE EMPLEO EN ESPAÑA 2007-2012

Fuente: Consejo Económico y Social (2016)

Asimismo, en los debates sobre la subida del salario mínimo se ha mencionado alguna evidencia empírica de sus posibles efectos sobre el empleo teniendo en cuenta los trabajadores despedidos y contratados con un nuevo salario mínimo, pero no es fácil computar los trabajadores excluidos, es decir, aquéllos que quizás hubieran podido ser contratados al salario mínimo anterior (y que los costes de ajuste impidieron que fueran efectivamente contratados en ese período) pero que nunca lo serán al nuevo salario mínimo (máxime cuando puede que la empleabilidad de los jóvenes sea proporcionalmente más sensible a variaciones en dicho salario).

Un tercer ámbito en el que opera el efecto composición es en el de la productividad del trabajo, medida como cociente entre el valor añadido bruto y el número de horas trabajadas. No siempre es fácil distinguir entre variaciones de productividad debidas a mejoras tecnológicas (de la productividad total de los factores), a aumentos del capital productivo o a aumentos de la cantidad y calidad –o composición– del trabajo (la productividad suele aumentar en épocas de recesión por la misma razón apuntada anteriormente). Esto no es porque no existan métodos de separación (ver este informe de la OCDE, pág. 20) sino porque los datos no siempre son lo detallados que querríamos, y la casuística de empresas y tecnologías es demasiado variada.

El sesgo de supervivencia también se manifiesta en otros escenarios: en el del consumidor, cuando decimos que la música de los 80 era mejor que la actual estamos quizás siendo víctimas del sesgo de supervivencia, ya que la muestra de la música de nos llega de esa época ha sido previamente filtrada de toda la música mediocre que también existía entonces, pero que no sobrevivió; en el de las finanzas, cuando analizamos rentabilidades históricas de agregados (por ejemplo, el IBEX-35) sin tener en cuenta las variaciones en la composición del mismo, o de rentabilidades de capital-riesgo (sin tener en cuenta las empresas desaparecidas en el proceso); o en el del márketing, cuando las empresas preguntan a sus clientes sobre las características más útiles o más valoradas de su producto pero no preguntan a los no clientes por aquellas características que les harían convertirse en clientes.

Así pues, cada vez que lea un artículo sobre los efectos de la crisis sobre salarios medios, productividad u otros factores fíjese si menciona el sesgo de supervivencia o el efecto composición. Algunos lo hacen, otros no. Y ya no le digo si le preguntan sobre temas de seguridad, rentabilidad o riesgo.

Por cierto, Abraham Wald no sobrevivió mucho tiempo para acrecentar su justa fama: falleció en 1950 –ironías de la vida– en un accidente de aviación al sur de la India, donde estaba impartiendo conferencias por invitación del gobierno de ese país. Pero muchos pilotos que conocen su historia siguen recordándole cada vez que aterrizan sanos y salvos tras un difícil vuelo.