Inicio > El pizarrón de Fran opinión > José Antonio Gil Yepes: Números y estadísticas del coronavirus

José Antonio Gil Yepes: Números y estadísticas del coronavirus

 

Una cosa son los números y otra las estadísticas. Veamos. Si uno escucha por los medios que Estados Unidos es el país con mayor número de infectados por la pandemia, eso es verdad, digo, en números absolutos. Sin embargo, estadísticamente esa información no ayuda a ver la realidad y, por lo tanto, puede desorientar en la búsqueda de las soluciones a la enfermedad o estrategias personales para evadirla.

Si bien son ciertos los números que dicen que Estados Unidos tenía, al 21-04-2020, unos 823M enfermos y el país que más se le acerca es España, con 204M enfermos, eso no quiere decir que los norteamericanos sean más enfermizos o menos disciplinados en guardar las medidas para no contaminarse. El análisis estadístico de estos dos datos dice otra cosa. La probabilidad de enfermarse depende, primero, de la cantidad de personas que se puedan enfermar, es decir, del tamaño de las respectivas poblaciones. Estados Unidos tiene 328 MM de habitantes y España tiene solamente 42 MM; es decir, que la probabilidad de enfermarse en Estados Unidos es del 0,0025, mientras que dicha probabilidad en España es del 0,0049, casi exactamente el doble. De lo que se desprende que, viendo los números de enfermos que se escuchan por los medios y si Ud. pudiese elegir donde ubicarse para evitar enfermarse, Ud. hubiese, erróneamente, elegido irse a España; sin embargo, el simple análisis de probabilidades revela que debía haber escogido a  Estados Unidos. Para que ambos países estuviesen a la par en sus probabilidades de enfermarse, España debería tener la mitad de los enfermos: 105M en vez de los 204M que tiene.

La próxima tarea estadística, que no numérica solamente, es tratar de explicar por qué pueden variar las probabilidades de enfermarse en los diferentes países. Aquí entra en juego la segunda variable clave: Si la enfermedad se transmite por cercanía o contacto, entonces la segunda variable clave es el número de interacciones que se producen entre los habitantes de esos países o con los de otras naciones. Este número de interacciones depende del nivel de desarrollo económico del país, lo cual está asociado al nivel de intercambio de personas y bienes, internamente y con otros países. Esto explica por qué la enfermedad se propagó inicialmente entre países del Norte, más desarrollados-urbanizados-abiertos a la globalización (mayores interacciones), mientras que la enfermedad tiene una menor penetración en los países del Sur, pobres, menos urbanizados y de menor apertura internacional. Esto último explica las diferencias en los números y proporciones de enfermos entre Venezuela y Panamá o República Dominicana. Venezuela tiene 26MM de habitantes (han emigrado cerca de 5MM), Panamá 4,5MM y Dominicana 10MM, y las cifras respectivas de enfermos por Covid-19 son 288, 5.000 y 4.800, la explicación de por qué las probabilidades de enfermarse en Panamá son mayores (0,001), siendo el país más pequeño, se debe a que ese país tiene un alto nivel de apertura al comercio y tráfico aéreo internacional. Este criterio para explicar los contagios también es válido para explicar el caso de Dominicana, con una probabilidad de enfermarse de 0,0005; menor que la de Panamá porque, a pesar del turismo, no es un país tan abierto como el caso panameño. Mientras que Venezuela muestra una probabilidad de enfermarse del 0,000011. Esto llama la atención por ser extremadamente baja dicha probabilidad, lo cual puede explicarse por dos razones: el extremo empobrecimiento y aislamiento internacional en que ha caído Venezuela (pierde población, recesión, hiperinflación, desinversión), a lo que se le suma un tercer factor, el nivel de cuarentena -total- aplicada por el gobierno (lo que no ocurrió en Panamá ni Dominicana sino más tarde) y también se suma un cuarto factor: la credibilidad de los números.

Sobre la credibilidad de los números es necesario partir de las cifras globales y comparar a los países en cuanto a tamaño de población, porcentaje de sus respectivas poblaciones viviendo en ciudades, PIB per cápita, grado de apertura económica, momento de aplicación de la cuarentena y grado en que se aplicó.

Aunque este no es el espacio para profundizar en estos detalles, vale la pena destacar que este análisis partiría de que la probabilidad de enfermarse a nivel global es de 0,00033 (7.700MM habitantes/2.554M de enfermos). Partiendo de esta referencia, los países se pueden ubicar por encima y por debajo de este eje central.

Las hipótesis para explicar los que estén por encima o por debajo ya las hemos enunciado arriba y conforman una matriz de cuatro cuadrantes: 1. Países de alta población, desarrollo, alta concentración urbana, abiertos a la globalización y menor cuarentena se ubicarían muy por encima de la probabilidad mundial; ej. Estados Unidos, Unión Europea, Japón. 2. En el otro extremo: Países de baja población, pobres, poca apertura y de aplicación estricta de la cuarentena, se ubicarían por debajo de la probabilidad mundial, como Venezuela, países pobres del Caribe y la mayoría del África. 3. Países con baja población, subdesarrollados, poca apertura, pero ubicados por encima de la probabilidad mundial, muy poco probables. La categoría que me preocupa es la del cuadrante 4. Países con alta población, desarrollados, alta concentración urbana, abiertos internacionalmente, tardíos en la cuarentena y con probabilidad de enfermarse muy por debajo de la mundial, como China y la India. China, con 1.499MM de habitantes y 83M contagiados, tiene una supuesta probabilidad de contagio de 0,000055; y la India, con 1.380 MM de habitantes tiene solamente 18M enfermos (0,00001). Estos números necesitan revisarse por cuanto no coinciden con las hipótesis planteadas en función de las estadísticas.

@joseagilyepes

 

Traducción »