top of page
Photo du rédacteurMathieu Marchand

COVID 19 - Estimer le meilleur modèle pour le Québec

Dernière mise à jour : 7 avr. 2020

Don’t understand le français? Try deepL : www.deepl.com/translator. It’s like a Star Trek universal translator, except it doesn’t do Klingon yet.

Cet article est le troisième d’une série pour tenter d’élaborer un modèle complet de l’évolution du coronavirus au Québec, en plus d’estimer les cas fantôme. Dans le premier article, j’utilisais le nombre de morts, donnée la plus fiable et la moins susceptible d’erreur de mesures, en reculant dans le temps pour revenir au moment de l’infection. Dans le second, j’utilisais les données de dépistage massif effectué en Corée du Sud pour comparer aux données du Québec.


Je vais tout mettre ensemble ici. C'est costaud comme texte, même si je tente de vulgariser au maximum. Si vous voulez la version allégée de ce texte, sans détails techniques, juste des résultats: allez ici.


Le problème : le temps


Le gros problème de ce virus, c’est qu’il est lent! Pendant en moyenne 5 jours, vous pouvez vous promener comme un zombie sans savoir que vous êtes malades et contaminer les autres. Ajoutez 4 jours en moyenne pour avoir un résultat de test. Une fois confirmé, vous devez retourner 9 jours en arrière pour essayer de savoir qui est le salopard qui vous a transmis cette bibite!

Les cas officiels rapportés dans les médias ne sont donc pas un bon portrait de la réalité. Ils sont 9 jours en retard, et on ne sait pas quel % de porteurs du virus on détecte réellement (vous verrez qu’au Québec, j’estime qu’on détecte très bien).


De plus, vous risquez d’en mourir 24 jours plus tard. Quand on calcule le taux de mortalité, on divise les morts aujourd’hui par les cas infectés aujourd’hui, mais on oublie que le virus s’est propagé depuis 24 jours! Il faudrait diviser par le nombre de cas 24 jours plus tôt! Mais quel est ce nombre de cas? Ce n’est pas le nombre officiel, je viens de le dire!


Il faut donc modéliser le nombre de cas qu’on pense qu’on a eus.


Calibrer le modèle à partir du nombre de décès


Comme je l’ai écrit dans mon premier article, la variable la plus fiable est le nombre de morts. S’ils sont morts, ils ont contacté la maladie il y en en moyenne 24 jours. Plus il y a de morts, plus la moyenne de 24 jours est fiable. Il y a 94 malheureux en ce 5 avril, moment d’écrire ce texte. La seule consolation, c'est qu'ils nous auront légué une information importante.


En prenant le nombre de décès du 24 mars 2020 au 5 avril, nous pouvons inférer le nombre de cas qu’il y avait du 1er au 13 mars. On comprendra, si le taux de mortalité est de 2%, il faut 50 malades pour faire un mort. Si le taux de mortalité est de 4%, il faut 25 malades pour faire un mort. Voici le graphique qui montre cela.


Postuler un taux de mortalité de 1%, 2% ou 4% ne change pas le taux de croissance de la propagation du virus. Nous avons au moins cette information de fiable. La mesure ne bouge plus beaucoup quand j’y ajoute les nouvelles données du jour, elle commence donc à être statistiquement robuste.


Entre le 1er et 13 mars, le virus circulait librement au Québec. Son taux de croissance composé était de 18.57%. C'est une estimation du taux de croissance naturel dans une population naïve.


Les premières annonces de confinement ayant eu lieu le 12 mars, on peut postuler que le rythme de croissance entre le 1er et le 13 mars sont le taux de croissance naturel du virus, dans une population naïve (j’aime ce mot, c’est vraiment ce que nous étions). Sans mesure de confinement aucune. Avec les aéroports bondés et sans mesure de protection. Les frontières ouvertes.


Notez que pour ce modèle, que ces infectieux soient effectivement résidents au Québec, ou qu’ils entrent au pays par avion en étant contaminés, entre ces dates, ne fait pas de différence. Les gens contaminés sont juste dans le modèle.


Parenthèse : ce que vous ne devez pas faire, chers modélisateurs du dimanche! 😉


Tracer une courbe exponentielle à partir du nombre de cas détectés ne vous donnera pas la bonne information. Est-ce que le pays détecte peu? Beaucoup? Est-ce qu’il détecte simplement les gens symptomatiques? Est-ce qu’il test de façon aléatoire? Si, de plus, un gouvernement s’est fait prendre par surprise, mais commence à augmenter sa fréquence de tests pour rattraper le retard, la croissance des cas mesurée sera trop élevée! C’est notre cas présentement.


Par contre, si vous avez un fragment de cette courbe de cas détectés qui est parallèle au taux de croissance de la mortalité, alors vous pouvez croire que la détection est efficace et suit le portrait de la réalité. Ce serait le cas au Québec, pour les deux dernières semaines du moins.

Modèle épidémiologique


Bon, je suis un économiste, je ne suis pas un épidémiologiste. Ça va, c’est noté, et si vous me le reprochez sur Twitter, je vais vous dire de venir lire ici. Alors je vais prendre le modèle le plus simple qui soit. S’il y a une chose que je sais faire cependant, c’est de jouer avec des systèmes d’équation mathématiques. Et celui-là, c’est assez facile. J’en ai fait des bien pires!


Ma contribution porte essentiellement sur la calibration du modèle avec des données fiables, lorsqu'on est encore tôt dans l’épidémie.


Voici le modèle.

Le modèle dit :

  • S: tu as X% de la population qui risque d’attraper la maladie. Disons 66%, soit 5,6 M de Québécois. Ce taux dépend du fameux R0.

  • I: chaque jour, tu as (dI/dt) nouveaux infectés. Ça dépend du punch du virus, p. Je peux estimer celui-là.

  • R: finalement la plupart des malades vont guérir. Le taux de guérison (a) est le contraire du taux de mortalité (tu guéris ou tu crève, c’est simple).

  • Le modèle dit essentiellement ce qui a le potentiel de se passer. La force dévastatrice du virus. Notez qu'il n'y a pas de lavage de mains dans le modèle. Pas de port du masque. Pas d'isolation des malades. À la fin du modèle, tous les gens susceptibles vont effectivement pogner le virus! Le modèle est construit comme ça. Ça ne veut pas dire que c’est la réalité. D’accord? En économie, on modélise l'économie potentielle, puis on observe l'état de l'économie réelle pour comparer. Je vois ce modèle comme cela.

On n'a que le R0 et le taux de mortalité qu’on ne connait pas. Sauf que nous avons plusieurs études préliminaires. R0 est estimé entre 2 et 3, donc chaque malade infecte 2 ou 3 personnes. Le taux de mortalité, on parle de 2% à 5%. Plusieurs espèrent 1%. On va faire des tests avec différentes valeurs.


Je vais prendre R0 = 3 et taux de mortalité = 3% pour commencer. (Notre (a) est donc de 97%, et notre population susceptible est 66% des Québécois, donc S = 5,6 millions de personnes.)


La magie, c’est qu’avec les décès connus jusqu’à maintenant, on a suffisamment d’information pour calibrer le punch du virus, le p. Voici de l’économétrie, une formule magique que les économistes, ou les Data Scientists, vous vendent! Ce n’est pas si sorcier, et vous pouvez le faire sur Excel avec un clic droit de la souris. (Pour les détails techniques, me contacter.)

On a un p = 0,00000003.


En changeant mes paramètres R0 et du taux de mortalité aux valeurs extrêmes dont j’ai parlé plus haut, le p varie entre 0,00000002 et 0,00000004.


3 Scénarios pour le Québec : The Good, the Bad, the Ugly.


Avec les paramètres et le modèle que je viens de vous expliquer, on va passer tout de suite aux choses sérieuses. Voici 3 modèles de ce qui risque de se passer au Québec avec le coronavirus.


Premier graphique : le nombre total de malades au Covid-19 selon 3 scénarios.

On comprend : si on ne faisait rien, avec les paramètres de ce virus, on était foutu! Si on réduisait notre mobilité de seulement 50% (comme le font le reste du Canada actuellement, les États-Unis sont estimés à 33%), la situation serait quand même catastrophique. Le meilleur scénario réduit la mobilité de 75%.


Deuxième graphique, la même chose, en cas par jours.

On comprendra de ces modèles, l’apocalypse qu’on a tout juste évité.


The Ugly :

· 5,6 millions de contaminés. 169 700 morts.

· Pic le 30 avril, avec 239 928 cas par jour. Pic de morts le 23 mai, avec 7198 morts par jour!


The Bad :

· 2,8 millions de contaminés. 84 850 morts.

· Pic le 5 juin, avec 59 994 cas par jour. Pic de morts le 28 juin, avec 1800 morts par jour!


The Good :

· 1,4 millions de contaminés. 42 220 morts.

· Pic le 9 août, avec 14 998 cas par jour. Pic de morts le 29 août, avec 450 morts par jour!


Le bon scénario fait encore peur. La claque va être forte, et la durée va être longue. C’est le "bon" scénario, parce qu’avec nos 6000 lits en soins intensifs et nos quelques 2000 respirateurs, le système de santé risque de pouvoir passer au travers. C’est l’objectif minimum du gouvernement d’ici le vaccin. On peut faire mieux. On ne doit pas faire pire.


(Notez qu’un patient reste en moyenne de 5 à 20 jours à l’hôpital, donc les lits se libèrent).


Pour avoir un ordre de grandeur, gardez en tête que le Québec a connu environ 70 000 décès en 2018, environ le même nombre en 2019, et ce nombre de décès va naturellement augmenter vers les 80 000 et plus avec le vieillissement de la population. Le Good scénario qui montre 42 000 morts, c'est gros, mais c'est 50% des morts qu'il y aurait eu de toutes façons. Et pour le moment, il semblerait que nous avons éliminé la grippe et les accidents de voiture comme cause de mortalité ce dernier mois.


Bien sûr dans la réalité, on peut aller plus loin que ce 75%. Si vous faites parti du 75% à la maison, le virus ne rentrera pas pas la porte d'entrée. Vous êtes normalement en sécurité. Pour le 25% qui circulent encore, ils peuvent prendre des mesures de précaution. Se laver les mains, par exemple, on réduit les risques de 50%. Si on se tient à 2 mètres de distance, on réduit aussi les risques. Tous des facteurs qui font que la vraie courbe peut être plus basse encore.


Je vous laisse réfléchir aux points suivants :


  • Plus le virus est contagieux, plus la courbe est haute et à pic. Mais le désastre se termine plus tôt.

  • Plus on aplatit la courbe, plus ça va être long.

  • La capacité du système de santé dicte l’objectif à atteindre, et au Québec, je suis près à parier que l’objectif était bel et bien une réduction de la mobilité de 75%.

  • Dans ce modèle, le virus se propage parmi les personnes encore susceptibles. En concret : ceux qui sont encore dehors et ne font pas attention. Vous allez voir les chiffres continuer d’augmenter dans les médias, mais si vous êtes confiné à la maison, ce ne sera pas vous dans ces chiffres. Occupez-vous d'abord de vous. Comme externalité, ça aidera aussi les autres.

Finalement, je sais que plusieurs espéraient, qu’avec un bon confinement de 2 ou 3 semaines, on puisse sortir le virus des frontières du Québec. C’est possible. Ce genre de modèle n’est pas construit pour cela. Ce n’est qu’un modèle. Donc c’est encore possible, on garde espoir.


Calibrer le modèle pour le Québec


Je dois faire quelques détails techniques ici, si vous n’aimez pas ça, vous pouvez passer à l’autre section juste en dessous.


Comme expliqué au début, j’ai calibré le modèle à partir de la mortalité, connue, du 24 mars 2020 au 5 avril. Elle infère une quantité d’infections ayant eu lieu, en moyenne, entre le 1er et le 13 mars. Cette quantité est déterminée par le taux de mortalité que je décide de postuler : 1%, 3% ou 5%. Ici je choisis 3%. Il faut 33,3 infections pour tuer une personne. (Je ferai varier ce taux à la fin et expliquerai ce que ça implique.) Cette partie de la courbe est connue et ne cesse de progresser avec les nouvelles données que nous aurons chaque jour.


Le modèle calibre les scénarios de 0%, 50%, 75% et 90% de confinement à partir du 14 mars. Le modèle est dynamique et s’améliorera dans le temps.

Encore une fois, comme j’expliquais plus haut, nous connaissons les cas officiels. Ils ont été infectés en moyenne 9 jours avant la publication du résultat. Nous devons reculer cette courbe de 9 jours. On voit que les scénarios de 75% et de 90% sont à éliminer : nous avons déjà détecté plus de cas qu’il serait supposé en avoir dans ces scénarios. Je crois, malheureusement d'ailleurs, que les résultats qui entrent depuis le 30 mars ont été une déception pour nos autorités.


Vous comprendrez également que la courbe de cas détectés peut augmenter rapidement simplement parce que nous sommes en train de rattraper le retard sur le plan du dépistage et donner un portrait plus fidèle à la réalité! C’est une bonne nouvelle : nous détectons plus, nous détectons mieux. (Ce que le modèle de dit pas, ces cas détectés, nous pouvons les isoler, et réduire encore plus la contagion. Identifier les cas est important.)


Que s’est-il passé au Québec après le 13 mars?


Le gouvernement du Québec a été le premier à agir en Amérique du Nord en annonçant la fermeture des écoles le 12 mars, effectif pour le lundi 16. Mais tout de suite après, les gens se sont rués dans les Costco et autres magasins à grande surface! La contamination a dû être plus grande cette fin de semaine-là. Nous verrons les premiers morts de cette fin de semaine dans les prochains jours…


Il faut vraiment commencer à mesurer les premières mesures de confinement à partir du lundi 16 mars. Et encore, elles étaient partielles. Probablement efficaces entre 40% et 50%.


N’oublions pas que nous avons eu une longue semaine de débat avant de réussir à fermer les aéroports et les frontières! Nous verrons les nouveaux morts causés par ce délais cette semaine! Prenez des notes!


Le 23 mars, le gouvernement a annoncé la fermeture des commerces non-essentiels. Les frontières étaient fermées ou en train de l’être. Le retour des snowbirds, malgré les anecdotes journalistiques, est marginal au point où le modèle est rendu. Le confinement était peut-être de 66%?


Le 30 mars, le gouvernement a accentué les mesures policières. Le 4 avril, Google a publié une étude montrant que les québécois auraient réduit leur mobilité à presque 75% (merci d’espionner nos téléphones, Google!). Le premier ministre l’a mentionné aujourd’hui.


C’est donc une lente adaptation qui a eu lieu entre le 12 et le 30 mars.


Mon modèle du Québec, la ligne bleu épaisse, tient compte de ce lent ajustement. Initialement encore dans le scénario sans contrainte (pendant la fin de semaine "Costco"), nous progressons lentement vers le scénario 75%. Cette lenteur d’ajustement aura des coûts humains. Mais ils sont limités.

À long terme, le modèle du Québec tend vers le scénario 75% de confinement. Vous voyez l'écart, les dommages sont limités.


Mon meilleur modèle du COVID-19 pour le Québec

(En date du 5 avril 2020)


Toutes ces calibrations m’amènent au modèle suivant.

Aujourd’hui, le 5 avril 2020, il y aurait potentiellement 16 048 cas dans la nature.

Les 7944 cas annoncés sont des cas infectés le ou avant le 27 mars dernier. De ces infections ayant eu lieu le ou avant le 27 mars, nous en identifions 71,8%, en constante progression, et il resterait 3125 cas fantômes du 27 mars pas (encore) identifiés. Ils peuvent être asymptomatiques.


De mes deux précédents articles, ici et ici, j’inférais un taux de cas fantômes d’au moins 25% en se comparant avec le dépistage de la Corée du Sud, et au plus 50% avec la même méthode qui est utilisée ici. Que nous arrivions présentement avec un taux de 28,2% est du même ordre de grandeur.


Je suis plutôt confiant sur le court terme. Mes projections vont jusqu'au 15 avril. Et comme avec toute projection, plus on s'éloigne, plus les choses peuvent changer.


À long terme, ce modèle donne ceci. Encore une fois, ce n'est qu'une projection du potentiel du virus. Je ne suis pas près à prendre des paris sur l'exactitude des chiffres. Je le montre pour comprendre les ordres de grandeur, parce que je crois que ça aide à ne pas relâcher les efforts.



Le pic serait visible le 21 juillet avec 15 000 cas par jour. Un total de 42 224 morts d’ici Noël, avec un sommet de 450 morts par jour le 12 août.


Mettez ces chiffres en perspectives, nous avons bon an mal an 80 000 morts par année normalement. Nous aurons un bond de 50%, et peut-être que certaines victimes seraient mortes de toutes façons. Le scénario du pire, avec les mêmes paramètres, estime 170000 morts. Nous somme en voie d'en prévenir 130 000. Nous éviterons le pire.


Mais vous serez quand même 1,4M avec une bonne grippe pas trop le fun! 😉


Analyse de sensibilité et estimer les cas fantômes


Si le charabia technique ne vous intéresse pas, félicitations, vous avez fini de lire! Vous savez l’essentiel. Vous pouvez partager cet article avec vos amis.


Pour les autres, je vais défendre mes hypothèses de R0 = 3 et de taux de mortalité = 3%.


Faire varier le taux de mortalité fait varier grandement le nombre de cas fantômes. Il ne s’agit pas d’une relation épidémiologique testée en laboratoire, mais une conséquence du système d’équation du modèle. Forcément : si vous postulez que le virus n’est pas très mortel et que le taux de mortalité n’est que de 1%, il faut 100 malades pour faire un mort. Ce qui veut dire qu’avec nos 94 décès en date du 5 avril, vous auriez eu 9400 malades en circulation libre entre le 1er et le 13 mars! Est-ce réaliste? Et surtout, avec les 90 000 tests que nous avons effectués jusqu’à maintenant, détectons-nous si peu de cas? Est-ce que nos tests sont vraiment mauvais?


C’est l’implication que fait un bas taux de mortalité.


Voici la distinction entre les taux de 2% et de 4% de mortalité.


Remarquez aussi la pente abrupte de la courbe à partir du 11 mars dans le taux de mortalité de 2%. C'est en contradiction avec la pente observée de mortalité. Oui la pente s'accélère naturellement dans ce modèle, mais pas à ce niveau de zoom, pas à cette date. Pour ces raisons, je trouve que le taux de mortalité de 3% semble être crédible, avec le taux de cas fantômes que cela implique.


Finalement, faire varier le R0 a le même effet sur le taux de détection. Voici le modèle avec un R0, donc un virus moins contagieux, de 2. Il y a là, encore, moins de cas fantômes. Nous détecterions presque tous les cas. À noter ici, pour les partisans du "le virus circule déjà depuis longtemps et il y a beaucoup de cas fantômes", cela implique un R0 beaucoup plus élevé, donc un virus très contagieux.


Sensibilité à long terme


À long terme, un virus moins mortel, qui a donc plus de cas fantômes, se propage plus rapidement. Le pic est plus rapide. Inversement, le taux de mortalité plus élevé, avec moins de cas fantômes, aura un pic plus lent. Les différences ne sont pas énormes, du 11 au 28 juillet. Le taux de mortalité influe plus sur, justement, le nombre de morts au final.


Diminuer le R0, diminuer la contagion, a le même effet : elle retarde l’arrivé du pic encore plus fortement. Ici, le 28 août.


Dernier scénario: les paramètres recommandés par le Dr Gaétan Barrette


Simple clin d’œil, voici les paramètres que M. Barrette m’a recommandé sur Twitter. R0 de 2 et mortalité « beaucoup plus bas » que mon 4% initial.


Ces paramètres plus optimistes que les miens (virus moins contagieux à la base, mortalité moins forte) donne une courbe semblable à la mienne.


J’attirerai l’attention sur ces points :

  • Taux de détection de 47,5% des cas (versus 71% pour mon modèle). Il y aurait beaucoup plus de cas fantômes qu'avec mes paramètres.

  • Date du pic le 15 août (plutôt que 21 juillet pour mon modèle). Rendu là…

  • Évidement, beaucoup moins de morts. Mais ça, nous le saurons à la fin.

Conclusion


Je publie ceci non pas pour alarmer la population, mais plutôt pour lui donner espoir.


Non pas pour battre de vitesse toute l’équipe de scientifiques du Dr. Horacio Arruda, mais…. Ok je veux battre de vitesse toute son équipe!


Et aussi pour contribuer sur les hypothèses et les légendes urbaines qui circulent :

  1. Il y a probablement moins de cas fantômes que vous croyez.

  2. Le virus est probablement plus mortel que vous croyez.

  3. Le virus circule au Québec depuis la fin février / début mars, mais pas avant ça.

  4. Le gouvernement provincial n'a réagit qu'une semaine trop tard. Le gouvernement fédéral, au moins 2 semaines trop tard. C'est sommes toutes bon, quand on connait la vitesse d'un gouvernement normalement.


Je suis optimiste! Je pense que nous sommes sur la trajectoire de 75%, malgré un petit retard au démarrage, et que dans la vraie vie, nos comportement ont changés et font que la réalité sera encore moins pire que ça. Mais ça donne aussi une idée de ce qui nous attend si on relâche la garde.


Reste à savoir quel est le prix à payer. Ce sera probablement pour un autre billet.


D’ici là, prenez-soins de vous.

Mathieu Marchand

Le Vulgaire Économiste

3 672 vues2 commentaires

2 Comments


Mathieu Marchand
Mathieu Marchand
Apr 07, 2020

Bonjour. Merci pour le commentaire.


Effectivement, la documentation des sources et le soucis du détail comme les intervalles de confiance sont mes lacunes depuis l'école. Beaucoup de professeurs me l'ont reproché. Ce pourquoi je préfère vulgariser pour faire comprendre au plus grand nombre plutôt que de rédiger des articles scientifiques qui se perdrons dans les abysses du néant. Avec un salaire et quelques jours de plus, je pourrais documenter professionnellement. Avec la réalité actuelle, je préfère aller jouer avec les enfants. ;). Les sources et les hypothèses, avec intervalles de confiances, figurent dans mon 1er article : https://www.mathieumarchand.com/post/covid-19-au-quebec-estimer-les-cas-fantomes.


Pour le modèle, j'explique bien qu'il ne s'agit que d'un modèle de 3 équations, il ne peut pas tenir compte de tout!…

Like

pcarmich
Apr 07, 2020

Bonjour, merci pour cette lecture intéressante. Je suis statisticien travaillant en recherche biostatistique/épidémiologique. Je ne suis pas un expert en modélisation d'épidémies, mais je suis un critique professionnel de modèles. Le travail effectué ici est bien documenté et motivé. Toutefois, je note un certain manque de critique autour des faiblesses du modèle projeté, et d'un manque d'intégration de l'incertitude autour des hypothèses formulées. Évidemment, comme n'importe quel modèle, ce n'est qu'une simplification de la réalité et on pourrait passer une vie juste à tenter d'améliorer un modèle particulier, il faut simplement avoir un point de départ valide. Cependant, je pense qu'il y a une erreur quant à l'interprétation du modèle SIR: Susceptible, Infecté et Rétabli. Ici, rétabli ne veut pas…

Like
Post: Blog2_Post
bottom of page