¿Podemos prever una epidemia con ‘big data’?

big data coronavirus¿Es posible utilizar big data para descubrir con antelación si se está desarrollando una epidemia? Durante mucho tiempo se pensó que simplemente usando los datos de los motores de búsqueda se podían obtener modelos predictivos.

La idea es que una cantidad inusual de búsquedas relacionadas con los síntomas de la gripe podría indicar que la enfermedad estacional está a punto de alcanzar su punto máximo. Pero las cosas no son tan simples.

En estos días es inevitable pensar en el coronavirus. La alarma sobre la nueva epidemia fue dada por primera vez el 31 de diciembre de 2019 por una empresa privada canadiense, BlueDot. La compañía se adelantó a la Organización Mundial de la Salud (OMS), que oficializó el problema el 9 de enero. BlueDot utiliza un algoritmo de inteligencia artificial basado en el procesamiento del lenguaje natural (PLN) que cruza datos procedentes de miles de fuentes.

Una cantidad de búsquedas geográficamente detalladas, mucho más numerosas de lo normal y llevadas a cabo utilizando palabras clave como ‘neumonía’ o ‘crisis respiratoria’ podría indicar una anomalía a investigar. La Facultad de Medicina de Harvard también está utilizando el PLN para comprender la evolución de la epidemia. El sistema ayuda a distinguir entre las personas que se quejan de sus síntomas y las que se limitan a hablar de la enfermedad (la absoluta mayoría).

El Centro de Control de Enfermedades de los Estados Unidos (CDS) y la OMS también usan big data para mapear brotes de epidemias y elaborar las recomendaciones para los gobiernos. Sobre todo, estos datos son útiles para predecir las dinámicas de propagación de una infección.

big data coronavirus

Predecir la propagación de una epidemia

Un grupo de investigadores de la Universidad de Zaragoza y de la Universitat Rovira i Virgili ha desarrollado un modelo matemático para prever el riesgo de nuevos casos en España, incluyendo también los contagios que pueden venir de las personas asintomáticas. Los científicos utilizan los datos de movilidad entre municipios españoles para estimar el riesgo epidémico en el territorio.

Si los modelos matemáticos para la propagación de un contagio parecen funcionar bastante bien, todavía quedan muchas dudas sobre las posibilidades reales de predecir una epidemia antes de que aparezca. Todos podemos usar Google Trends y escribir ‘epidemia’ o algo más específico como ‘síntomas de gripe’. Si observamos el comportamiento de los usuarios en los últimos años, resulta que, por ejemplo, en diciembre de 2019, estas búsquedas fueron muchas más que en el mismo período del año anterior. En febrero de 2020 alcanzaron su punto máximo desde hace cinco años.

En la segunda semana de diciembre de 2019, la búsqueda por ‘síntomas de la gripe’ había alcanzado un valor de 21, mientras que en los mismos días de 2018 era solo de 16. Una cifra que refleja cuál era realmente la tendencia de la gripe hacia el final de 2019, una época en la que golpeó con más fuerza que en el año anterior.

Entre enero y febrero generalmente se registra un valor de alrededor de 40/50, mientras que este año ha llegado a 75. Después de tocar los 100 puntos hacia finales de enero, cuando generalmente se produce el pico de la gripe. Esta explosión de búsquedas se debe claramente a la epidemia de coronavirus y, en parte, a la psicosis. Un número mucho mayor de personas sintió la necesidad de buscar información sobre la gripe, pero esto no significa que estuvieran enfermos.

virus

¿Podemos confiar en los datos?

Este mecanismo explica lo complicado que es confiar en este tipo de análisis. BlueDot elimina las interacciones de las redes sociales de sus fuentes, precisamente porque el ‘ruido’ es excesivo y engañoso. Sus análisis se basan en alrededor de 100.000 informes al día en 65 idiomas diferentes.

El modelo de predicción desarrollado por los Centros para el Control y la Prevención de Enfermedades? (CDC) de Estados Unidos, llamado Dante, utiliza un enfoque mixto. Aprovecha los datos oficiales recopilados por médicos, clínicas y hospitales, a los que también integra el big data disponible en línea. Al combinar estos dos modelos, confían en que se puedan solventar las debilidades de cada uno. De hecho, si los datos obtenidos en línea son inexactos, los que recibe directamente el CDC llegan demasiado tarde.

Los resultados de los experimentos realizados hasta ahora con big data no siempre han estado a la altura de las expectativas. Google Flu Trend se anunció como un gran avance en la identificación y estimación de la propagación de la gripe hasta que subestimó la epidemia de 2013 en un 140%. El servicio cerró en 2014 después de seis años de actividad.

big data

Todavía se necesita intervención humana

El análisis predictivo ciertamente está cambiando el enfoque de gestión de epidemias. Sin embargo, la mala calidad de los datos es una de las principales razones por las que los experimentos como Google Flu han fracasado. Por otro lado, éxitos como los de BlueDot también muestran que los algoritmos por sí solos no son suficientes. Por ello, la compañía emplea expertos humanos para validar los resultados de la inteligencia artificial y establecer correlaciones que tengan sentido científico.

La epidemiología estudia la expansión de una enfermedad y lleva décadas usando datos para sus predicciones. Predecir el pico de la gripe es importante para motivar a las personas que lo necesitan a vacunarse a tiempo. Hoy los algoritmos pueden ofrecernos modelos bastante precisos de lo que sucederá. Se están logrando avances significativos, aunque no lo suficientemente rápido.

Por ejemplo, en el caso italiano, el país europeo más afectado por el Covid-19, la epidemia tiene una tendencia exponencial. Hay una duplicación de casos cada dos días y medio. Los algoritmos nos ofrecen una idea bastante precisa de la respuesta extraordinaria que el sistema de salud del país tendrá que dar. Lamentablemente, todavía no nos proporcionan una vacuna.

En Nobbot | Sonia Zúñiga, CNB-CSIC: «La posibilidad de que el coronavirus se convierta en un virus estacional es realista»

Imágenes | Dimitri Karastelev/unsplash, CDC/unsplash, NASA/unsplash, Franki Chamaki/unsplash

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *