Sin Big Data nunca habrá grandes políticas

En 1987 Robert Solow se quejaba de que la era de las computadoras se reflejaba en todas partes, salvo en las estadísticas de productividad. Hoy, parafraseándole, podríamos decir que la era del Big Data se refleja en todas partes, salvo en las políticas públicas.

El término “Big data”, popularizado por John Mashey en los años 90, se refiere a la extracción y análisis de conjuntos de datos demasiado voluminosos o complejos como para ser almacenados o procesados de forma tradicional. Teóricamente esto lo puede hacer tanto el sector público como el sector privado, pero, en la práctica, la recopilación y gestión masiva de datos se suele concentrar en empresas privadas –en particular grandes plataformas tecnológicas como Google, Facebook o Amazon– mientras que el sector público se suele limitar a regular la privacidad y el uso correcto de los datos recogidos.

Y hace bien regulándolos, porque los información es poder. Desde hace años hemos tenido ocasión de comprobar el uso de datos masivos no sólo en publicidad para la adquisición de bienes y servicios, sino también en marketing electoral. Así, la campaña presidencial de Obama en 2012 fue una de las primeras en emplear procesado masivo en paralelo y tecnologías avanzadas de predicción a partir de Big Data. Claro que luego vino el referéndum del Brexit, la victoria de Trump y muchas otras cosas.

En la Unión Europea no hay grandes empresas tecnológicas equivalentes a Google, Facebook o Amazon, pero sí una gran preocupación por un correcto uso de la información de estas plataformas. Podemos decir que, si Estados Unidos lidera las tecnologías, la UE, por el momento, se conforma con liderar mundialmente la regulación de los derechos de los ciudadanos respecto a estas tecnologías (de las consecuencias de esta especialización hablaremos otro día).

Lo curioso es que es que estamos acostumbrados a que los datos masivos se utilicen para decirnos a quién votar y no nos llama tanto la atención que estos mismos datos se desaprovechen para otras políticas públicas donde la información precisa y detallada sería la única forma de garantizar su éxito.

España, por desgracia, no brilla como gestor de datos. En el último año hemos dado una mala impresión internacional en varias ocasiones: no hemos sido capaces de ofrecer actualizaciones decentes de infectados por COVID. Ni siquiera de fallecidos. Cierto es que otros países también han cometido errores: la Public Health England, por ejemplo, perdió datos de confirmación de PCR positivos de más 16.000 ciudadanos porque importaba alegremente datos de texto en formato xls (el antiguo formato de Excel, con una limitación de número de filas). Pero también es verdad que se nos acumulan los problemas: desde el reciente ataque de ransomware al sistema informático del Servicio Público de Empleo Estatal (SEPE) –que ha puesto de manifiesto la obsolescencia y falta de seguridad de muchos sistemas públicos esenciales– hasta la confusión por el hecho de aparecer durante meses con uno de los mayores índices de mortalidad infantil por COVID hasta que se descubrió que los supuestos niños de 3 y 4 años eran en realidad ancianos de 103 y 104. “No creo que haya visto un error así en mi vida”, dijo Max Roser, analista de datos y creador de la imprescindible web Our World in Data.

A la hora de ofrecer datos de vacunación parece que las cosas están mejorando, aunque más de una vez hemos sentido tristeza al ver mapas con la triste nota de “datos no disponibles” reflejada únicamente para España.

Lo peor, en todo caso, no es sólo la imagen internacional, sino las consecuencias sobre la eficacia de las políticas: ¿cómo podemos pretender controlar una pandemia o adoptar medidas de confinamiento precisas sin datos homogéneos, detallados y constantemente actualizados?

Y no todo es COVID. Ahora que se habla de regular el precio de los alquileres, por ejemplo, se pone de manifiesto la escasez de bases de datos públicas de precios de alquiler de vivienda (qué significativo que tantas veces se recurra a la web de Idealista.com); o, al hablar de ayudas directas a empresas, se constata que los datos disponibles de empresas españolas son muy pobres, con un grandísimo desconocimiento, por ejemplo, de las empresas de tamaño medio, cruciales en el tejido industrial. Por no hablar de las dificultades para hacer llegar el ingreso mínimo vital a los ciudadanos.

Hay pues mucho que mejorar. Los fondos europeos del Plan de Recuperación y Resiliencia son una magnífica oportunidad para modernizar y priorizar la recopilación de datos desde el sector público y un mejor conocimiento de la situación económica y social de ciudadanos y empresas. En algunos casos se podrán aprovechar las estructuras institucionales existentes (por ejemplo, quizás convendría incentivar sistemas sencillos y baratos de legalización de alquiler de vivienda ante notario para aprovechar sus bases de datos y, de paso, mejorar la seguridad jurídica frente al riesgo de ocupación ilegal). En otros casos, se tratará de organizar mejor la recogida de datos por las Administraciones públicas y garantizar su uso seguro y legítimo, considerando como delito muy grave la consulta o uso no autorizado de datos personales por parte de funcionarios. Hay formas de hacerlo con garantías de respeto a la privacidad.

Es comprensible que haya quien prefiera que la Administración no tenga apenas datos de los ciudadanos, porque temen su mal uso. Yo comparto ese temor al mal uso, pero no las ventajas de la inexistencia de esos datos. Primero, porque esos datos ya están ahí, sólo que los únicos que los recopilan y monetizan –y a menudo de forma poco transparente– son las empresas privadas. ¿Por qué se creen que algunas grandes tecnológicas quieren licencia bancaria, si no es porque se ven perfectamente capaces de evaluar la capacidad de pago de sus clientes mejor aún que la banca tradicional? Y, segundo, porque su inexistencia tiene costes, al impedir un uso eficiente de los recursos públicos: los datos no sólo permiten hacer mejores políticas, sino también una mejor auditoría del gasto. Cuanto mejor organizados estén los datos, más fácil será exigir transparencia en ámbitos como el de la contratación pública.

Lo que nos lleva, una vez más, al debate sobre la calidad institucional: en un país con auténtica separación de poderes, un adecuado sistema de equilibrios y contrapesos y una administración moderna, eficiente y despolitizada, el Big Data –debidamente controlado– permitiría hacer maravillas de política económica para mejorar la sanidad pública, reducir la pobreza infantil o dar ayudas o rebajas de precios exclusivamente a los ciudadanos o empresas que realmente las necesitan (en vez de plantear reducciones de IVA de las que a menudo los que benefician más son los más ricos). Necesitamos datos seguros, pero datos al fin y al cabo. Porque, sin Big Data, muchas políticas públicas seguirán intentando resolver problemas no a base de bisturí, sino a martillazo limpio.

 


Este artículo fue publicado originalmente en vozpopuli.com (ver artículo original)