Diego Otero Prada y Francisco Castellanos

Introducción

En un documento anterior con Eduardo Lecaros escribimos sobre proyecciones del Covid 19 basado en los modelos logístico, de Gomperz y Bertanffy. Presentamos las proyecciones de la línea de ajuste, sin mostrar que todas las proyecciones presentan una banda alrededor de la línea principal. Las predicciones mostraban que todavía estábamos en la etapa de crecimiento del virus, pero sin ser algo pronunciado.

En el presente documento presentamos las proyecciones utilizando tres modelos: uno de tipo vectores autorregresivos- VAR y dos de suavizamiento exponencial

La utilidad de los modelos

Muchas son las predicciones que se están haciendo sobre el Covid 19 y la mayoría han tenido dificultades con las proyecciones.  El problema no es de los modelos, sino de cómo se utilizan, y de los supuestos que se introducen.

     En un mundo tan cambiante, los modelos de tipo SIR y similares, de los epidemiólogos, de solución de ecuaciones diferenciales, dependen no solo de datos cuantitativos sino de los supuestos. En un mundo tan incierto y variable, los modelos son determinísticos, y están sujetos a muchas variables no incluidas en los mismos. Por ejemplo, se parte de la homogeneidad de las poblaciones, lo cual no es cierto; en el ámbito geográfico, muy diferentes son las condiciones en las costas que en el interior y muy diferente si se trata de un país, región, departamento o ciudad.

   Sobre el confinamiento, qué tan estricto es, cuando comenzó, las condiciones sanitarias.  Hay que tener en cuenta condiciones especiales, como las cárceles y los sanatorios, donde es fácil el contagio, lo que sucedió en Italia, Francia y España. Y, por supuesto, sobre los datos, que tan exactos son, si hay subestimación o sobreestimación.

    En los modelos tipos SIR, una variable fundamenta es el Ro, es decir cuanta gente contagia un poseedor del virus, si uno, dos, tres o cuatro. El período de incubación y de desarrollo del virus. En fin, hay tantos aspectos para considerar, que es imposible tenerlos en cuenta en un modelo, hay, cono se dice en econometría, información imperfecta, variables omitidas, que dan lugar a sesgos en la estimación de los parámetros y en las proyecciones.

     La discusión internacional es muy ambigua sobre la utilidad de estos modelos, por lo cual hay que tener cuidado con ellos. En Estados Unidos predecían más de 200 000 muertos, información de la que se basó Trump para sus locas afirmaciones. Ahora se dice que se reajustaron hacia la baja, y que serán menos de 100 000 muertos.

    En Colombia, el gobierno nacional aceptó las conclusiones del modelo SIR corrido por el Instituto Nacional de Salud-INS, para sus afirmaciones de cuatro millones de infectados y 3000 muertos. En el Distrito Capital también se utiliza un modelo parecido al del Imperial College.

    Hay, primero, una falta de información que permite todo tipo de supuestos y equivocaciones. Nadie sabe cuántos infectados hay realmente, en especial los asintomáticos. Todos son supuestos. No es necesario hacer pruebas a toda la población para saberlo, basta con una muestra relevante, hecha con criterios estadísticos, no a la loca.

     De los modelos que he seguido, me parecen útiles y menos complejos, las metodologías que utilizan el modelo logístico, el modelo exponencial, el modelo de Bertanffy o los modelos econométricos, como los de suavizamiento exponencial. Son modelos de tipo estadístico que no tienen bases epidemiológicas, no requieren de casi supuestos, sino parten de las cifras para simular las curvas hasta el presente y hacer predicciones con el comportamiento de las mismas y de unas teorías de causalidad.  Pero, también, hay que ser cuidadoso con sus predicciones. Estos modelos, como los de base epidemiológica, requieren correrse constantemente porque la información es muy variable y siempre aparecen aspectos nuevos que hay que tener en cuenta.

Tipos de modelos

   Hay dos tipos de modelos: los estructurales y los de forma reducida, o los fenomenológicos y los mecanicistas para los que discuten en el mundo de los epidemiológicos. Los estructurales, como los mecanicistas, corresponden a los que llamaríamos modelos macroeconómicos, donde se establecen una serie de ecuaciones de comportamiento, a veces de cientos de ecuaciones, para describir un sistema. Los de forma reducida o fenomenológicos van directamente a ecuaciones simples sin mucha base teórica por detrás. Así, en los que tratan de predecir el desarrollo de pandemias, los modelos SIR y SEIR y otros similares serían de tipo estructural o mecanicista, y los de modelos logísticos, exponenciales, VAR, ARIMA y de suavizamiento exponencial, son de tipo fenomenológico o de forma reducida.

    En documento escrito con Eduardo Lecaros presentamos la aplicación de modelos fenomenológicos para proyectar el Covid 19 en Colombia, utilizando modelos logísticos y exponenciales. En esta oportunidad vamos a presentar modelos de tipo VAR y de suavizamiento exponencial, trabajo que hemos realizado con el estudiante de economía Francisco Castellanos Villarreal.

Modelos de suavizamiento exponencial

Con el estudiante de economía Francisco Castellanos Villarreal, utilizamos la técnica VAR y los métodos de suavizamiento multiplicativo y aditivo de Holt Winters.

    La base teórica es la siguiente. La variable dependiente, contagios, por ejemplo, se supone una función del tiempo, de los casos nuevos, de las muertes y de los recuperados. A medida que las muertes decrecen, como los nuevos casos, la tasa de crecimiento de los casos acumulados debe descender y llegar a la parte de aplanamiento. Así mismo, si los recuperados disminuyen, debe significar que ya hay menos casos. 

   Como con los métodos logísticos, el ajuste de las curvas a los datos reales es perfecta. La correlación dado por el R2 es cerca de uno, y las propiedades econométricas son correctas. No hay multicolinealidad en las variables, por ejemplo.

Se corrieron modelos para casos acumulados, nuevos casos, muertes y recuperados, utilizando   modelos VAR y de suavizamiento exponencial por el método de Holt Winters para predicciones, utilizando el software R.

Datos

Se trabajó a nivel nacional de Colombia, con datos del 6 de marzo al 26 de abril para acumulados por el virus, muertos, casos nuevos y recuperados, para una serie total de 50 datos. La información se tomó del Ministerio de Salud y del Instituto Nacional de la Salud-INS

En el anezo1 se presentan las curvas de las diferentes variables, y su descomposición en los componentes cíclico y tendencial

Resultados

Modelos VAR y de suavizamiento exponencial por la técnica de Holt Winters.

Se corrieron modelos en forma logarítmica, con datos para el período del 6 de marzo al 26 de abril. Se tienen tres modelos: VAR y Holt Winters multiplicativo y aditivo. Se utilizaron las funciones HoltWinters y predict. HoltWinters del sofware R.

Modelo de vectores autorregresivo- VAR

Después de hacer pruebas de significancia para las variables y de estacionariedad se llegó a la conclusión de utilizar los datos en forma logarítmica con rezagos, con dos ecuaciones en que se relacionan contagios y recuperados, así:

Ct= β10+ β11Nt+ ϒ11Ct-1 +ϒ12Ft+ β13Rt+ε

Rt= β21 Nt+β22 Rt-1+ ϒ22Ft + β23Ct +ε

Donde

C= infectados

N= casos nuevos

F= muertos

R= recuperados

Se obtuvo un R2 de 0,9945, signos esperados para las variables y propiedades econométricas correctas, como no multicolinealidad, ni autorregresivos, ni estacionariedad.

   En las gráficas del anexo 2 se muestran las curvas con los datos reales y los ajustados, así como la proyección hasta el 11 de mayo, con la línea ajustada y una banda a un nivel de probabilidad de 95,0%.

   En cuanto a los contagios, da un crecimiento a 9248 casos para el 11 de mayo, para un aumento promedio de 323 casos por día. Por la dinámica de los últimos días, los casos nuevos diarios tienden a estar por encima de 300.

    Los signos de las variables dependientes son los esperados y se cumplen todas pruebas econométricas. En los cuadros 1 a 4 se presentan los resultados de las predicciones a 11 de mayo

Modelos Holt Winters

Se estimaron dos modelos, el multiplicativo y el aditivo. En ambos casos, el período de estacionalidad es de 4. A diferencia del modelo VAR, las bandas alrededor de la línea de ajuste son más amplias.

    En el anexo 3 se presentan las respectivas curvas con la curva actual, la ajustada y las proyecciones para el mes de mayo y en los cuadros 1 a 4 se muestran los resultados de los tres modelos, VAR, HW multiplicativo y HW aditivo, para su comparación.

     Hay que tener en cuenta que los resultados que se presentan son los de la línea principal del ajuste, que se encuentran dentro de una banda con límites inferior y superior. Así, en contagios, si se toma el modelo multiplicativo, que parece ser el que da cifras más racionales y probables, para el 15 de mayo se tiene una banda para contagiados que va de 5959 a 11 712 casos. Para muertos, la banda va de 311 a 575.

   Dada la dinámica que viene desde el 21 de abril, las proyecciones de nuevos casos pasan a más de 300 por día.

     De los tres modelos, el de Holt Winters aditivo no parece el más apropiado dada la dinámica que se viene produciendo desde el 21 de abril, ya que da un número de contagiados para un promedio de 122 casos nuevos por día.

     Infortunadamente, los pronósticos son un poco pesimistas, aunque no escandalosos, con respecto a lo que se venía presentando, ya que las proyecciones muestran que la curva de contagiados sigue creciendo. Sin embargo, el número de muertos está alrededor del 4,0% de total de infectados.

    El efecto del Meta y Amazonas cambió todo. Para el 28 de abril hay 354 contagiados en el Meta, el tercer departamento después de Bogotá y el Valle del Cauca, con Villavicencio, la tercera capital más contagiada.

    En Amazonas se llegó el 28 de abril a 77 contagiados, el doceavo departamento, expansión del virus que se ha dado en los últimos días. La situación es grave en este departamento porque no existe un servicio de salud y el gobierno nacional no ha hecho nada.

     De los 352 nuevos contagiados el 28 de abril, 149 ocurrieron en estos dos departamentos. Excluyéndolos, se tendría una cifra de 219 casos nuevos en todo el país. Y lo mismo sucedió el 27 de abril y días anteriores. En los últimos cinco días, por los contagios en estos departamentos, el número de casos nuevos creció en alrededor de 60, razón por la cual pasamos la barrera de los 200 casos diarios. Es una catástrofe lo que está ocurriendo en estos dos departamentos, que, de mantenerse, como muestran nuestras proyecciones, seguirá creciendo el total de infectados en el país.

   Cuadro 1 Infectados acumulados

Fecha VAR Va hasta el 11 de mayo Multiplicativo Holt Winters  Holt Winters aditivo
26 de abril 5379 5379 5551
30 de abril 6370 6252 5609
15 de mayo 9246 9013 7876
Incremento 3867 3634 2325

Cuadro 2 Muertos

  VAR Va hasta el 11 de mayo HW multiplicativo HW aditivo
26 de abril 230 244 269
30 de abril 260 279 269
15 de mayo 429 439 380
  199 195 111

Cuadro 3 Recuperados

Fecha VAR HW multiplicativo HW aditivo
26 de abril 1060 1133 1274
30 de abril 1130 1321 1308
15 de mayo 1867 2328 1654
Incremento 807 1195 380

Cuadro 4 Nuevos casos

Fecha VAR Va hasta e 11 de mayo HW multiplicativo HW aditivo
26 de abril 230 237 264
30 de abril 260 380 272
15 de mayo 448 350 366
Incremento 218 113 102

Análisis

No hay modelo perfecto, todos tienen sus cualidades y defectos. El hecho de que ajusten perfectamente para el período de los datos no significa que vayan a ser buenos para hacer predicciones. De los tres modelos que estimamos, hay bastante diferencias, pero ninguna pronostica catástrofe ni una evolución del Covid 19 en Colombia imposible de manejar de aquí al 15 de mayo.

     No proyectamos más allá del 15 de mayo porque estos modelos actúan muy de acuerdo a la evolución de los datos, especialmente de los más recientes, y si se va más lejos comienzan a mostrar crecimientos porque la evolución a partir del 21 de abril cambió hacia una tendencia creciente, no muy pronunciada, pero de todos modos creciente.

    Predecir es una ciencia muy difícil y proclive a errores en un mundo tan incierto como el actual, en que los datos de cada día cambian el panorama.

     Así, en lo que respecta al Covid, hay demasiada variabilidad en los nuevos casos y en las muertes a nivel nacional y regional. Casi que todos los días tenemos que cambiar nuestros análisis y conclusiones. El peligro para equivocarse es altísimo, de ahí que hay que actuar con mucha prudencia para tomar decisiones basados en los modelos. Son una guía que no deben tomarse al pie de la letra.

   Por ejemplo, del 11 al 18 de abril, los datos mostraban un quiebre, y así las curvas de casos acumulados parecían converger a un límite y las curvas de casos nuevos tomaban la forma de una curva normal. Estas mostraban un pico el 11 de abril, con cifras que caían en los siguientes días.

     Con las cifras del 21 al 28 de abril, los nuevos casos estuvieron por encima de 200, pero hay un factor que hay que tener en cuenta, que es el acumulado de contagiados en las cárceles que se aceleraron en los últimos días, alcanzando casi 300 infectados, lo que cambió la tendencia que venía Específicamente, en los departamentos del Meta y Amazonas saltaron los infectados en los últimos días, llegando a 432 el 28 de septiembre.  Si, en una simulación, eliminamos estos casos, lo que vamos a realizar, es posible que tengamos una situación un poco distinta. El peligro es que sigan creciendo los infectados en las cárceles y en los sanatorios.

    Esto deja al modelista perdido, pero como ha venido ocurriendo, no solo en Colombia sino en el resto del mundo, esto sucede. Hay una tendencia positiva, y de pronto vuelven a aumentarse los nuevos casos y las muertes, e igualmente, después reaparece la tendencia hacia la baja.

     Esto se dio en Italia, Francia y España. Desde que se inició el brote hasta comienzos de abril la tendencia era exponencial, pero vinieron unos días en que los caos nuevos bajaron como los muertos, y de pronto se revertió esta tendencia, y ahora, en los últimos días ya es más firme la tendencia decreciente. En estos países se dio una circunstancia especial que incrementó el número de contagiados y muertos, que se concentraron en casi 50,0% en población de ancianatos por las malas condiciones de los mismos y descuido de las autoridades, como está pasando en Colombia con las cárceles.

Conclusiones

    En muertes, no se pasa de 429 el 15 de mayo para todo el país según el modelo Holt Winters multiplicativo, que, de acuerdo con los datos hasta el 26 de abril, el 42,0% se concentraban en Bogotá, lo que daría un total de 180 para la capital, cifra muy manejable, y que no es para hacer escándalo.  Más muertos hay por otras enfermedades de las que nadie habla, como si solamente existiera el coronavirus.

    Lo mismo, llegar a una cifra de 9013 contagiados por la línea de ajuste proyectada, según el modelo de Holt Winters multiplicativo, el 15 de mayo es una cifra relativamente baja. Si esta cifra no la puede manejar el sistema de salud de Colombia, entonces realmente estamos muy mal, ya que todos no requieren de hospitalización, la mayoría se curan en sus hogares. Ya van casi dos meses de acuartelamiento, más que suficiente para prepararse, pero parece que esto no es así totalmente. No hay tapabocas para la población, no hay pruebas suficientes, no hay equipo apropiado para los trabajadores de la salud, no hay suficientes equipos de respiración, no ha alcohol, no hay gel.

    Hemos hecho uso de seis modelos, tres en este documento, y tres en el documento sobre modelos logísticos y exponenciales. Una técnica común en econometría es buscar algún tipo de promedio de los mismos. Si esto se hace tenemos los siguientes resultados para el 15 de mayo:

Acumulados: 8422 a 8826 (al excluir una cifra baja irrealista de 6408 casos) dentro de una banda

Muertos: 383

Recuperados: 1942

   En conclusión, cifras normales, nada escandalosas, esperando que comiencen a disminuir los nuevos casos y se estabilicen los contagiados.

   Desde mi punto de vista, estos modelos estadísticos y econométricos son muy útiles, rápidos de manejar, no tienen muchos supuestos, y se pueden modificar diariamente con la nueva información que llegue.

  Una última advertencia, hay que tener mucho cuidado con las cifras escandalosas que da el Instituto Nacional de la Salud, de su modelo epidemiológico tipo SIR, como los del Imperial College, que en el documento que escribí con Eduardo Lecaro tuve la oportunidad de criticar algunos aspectos. Estos modelos son muy peligrosos y normalmente dan cifras apocalípticas. Muy peligroso que las autoridades tomen decisiones de inversión y  de confinamiento tipo campo de concentración, que llevan a exageraciones en gastos, y mal dirigidos, y a tomar medidas de control de los ciudadanos tipo Gran Hermano.

   Nuestra próxima etapa va a ser la de diseñar un modelo econométrico con ecuaciones de comportamiento, en la cual se tendrán variables independientes y dependientes explicativas de la pandemia, para tener mejores predicciones y explicaciones.

DiegoOteroP

   diegooteropotmail.com

ANEXO 1

Gráficas en logaritmos y descomposición de las series en tendencia t ciclicidad

Comportamiento de contagios con logaritmos

Comportamiento de muertos en logaritmos

Comportamiento de nuevos casos en logaritmos

Comportamiento de recuperados en logaritmos

Descomponiendo las series temporales en sus componentes estacionales.

A continuación, se mostrará el comportamiento tendencial mes a mes, donde 3 denota a Marzo y 4 a Abril.

.

ANEXO  2

 CURVAS DEL  MODELO VAR

Contagios multiplicativo

ANEXO 3

CURVAS DEL MODELO HOLT WINTERS MULTIPlCATIVO Y ADITIVO

Contagios multiplicativo

Contagios additive

Nuevos Casos

Nuevos casos– additive

Fallecidos multiplicativo

Fallecidos -additive

Recuperados

Recuperados