• Mathieu Marchand

COVID-19 au Québec: Estimer les cas fantômes - Part deux

Don’t understand le français? Try deepL : www.deepl.com/translator. It’s like a Star Trek universal translator, except it doesn’t do Klingon yet.


Cet article est le deuxième d’une série pour tenter d’estimer les cas fantôme infectés au coronavirus / Covid-19, au Québec. Dans le premier article, j’utilisais le nombre de morts, donnée la plus fiable et la moins susceptible d’erreur de mesures, en reculant dans le temps pour revenir au moment de l’infection. J’arrivais à la conclusion qu’il y avait déjà 250 cas au Québec à la fin de février, et que nous avions à 2501 cas fantômes en date du 27 mars. Allez le lire, c’est vraiment bon! 😉


Ici, je tenterai une nouvelle approche en se basant sur les résultats de tests effectués par la Corée du Sud en février jusqu’à la mi-mars 2020.


Rappel : Pourquoi est-ce important d’estimer les cas fantômes?


Les cas fantômes sont les cas non-détectés. Les scientifiques s’entendent pour dire qu’une proportion de la population a effectivement contracté le virus, mais n’ont pas développés de symptômes, ou alors l’ont simplement pris pour une simple grippe. Ils portent le virus, mais leur organisme le combat bien et ils ne le savent pas.


D’un côté, ils sont contagieux et peuvent propager la maladie sans le savoir. Si, comme moi, vous êtes un geek de sous-sol qui fait des modèles, vous DEVEZ tenir compte des cas fantômes pour faire vos projections. (Faire une simple projection de fonction exponentielle sur Excel à partir des cas officiels ne vaut rien. Vous faites du overfitting, désolé les mecs!).


De l’autre côté, les cas fantômes développeront vraisemblablement une immunité, ce qui leur permettra de retourner à une vie normale et contribuera à empêcher un éventuel retour du virus dans la population (la fameuse immunité de troupeau). Idéalement, nous voudrions un maximum de cas fantômes : cela voudrait dire que le virus est moins dangereux que prévu, et que la pandémie se terminera plus vite. À tout le moins, ces cas fantômes, une fois guéris, pourraient retourner travailler.


Les cas officiels ne sont pas un portrait de la réalité d'aujourd’hui


La plupart des pays, pris de court par la rapidité de la pandémie, ne testent que ceux qui ont des symptômes. Les premières semaines, au Québec, nous ne testions que ceux qui revenaient de voyage. Cette situation s’est résorbée aujourd’hui, mais toujours est-il que si vous n’avez pas de symptômes, probablement que vous n’irez pas vous faire tester. C’est tout un pan potentiel de la population, porteur asymptomatique du virus, qui demeure inconnu.


De plus, tel que mentionné dans mon premier article, le portrait officiel détecte des cas qui ont été contaminés il y a en moyenne 11 jours. Les cas officiels du 31 mars ont été infectés le 20 mars ou avant. Durant ces 11 jours, entre ces symptômes et le test, ces personnes ont pu continuer à propager le virus, surtout si elles font partie de cette catégorie de gens qui ne semblent pas écouter les consignes. Il semble que la principale arme du coronavirus soit sa capacité à se cacher dans la population et éclore à retardement. C'est pour ça que nous avons tous été pris les culottes baissées.


La méthode de dépistage de la Corée


L’économiste Andreas Backhaus publiait un article de 13 mars 2020 (il semble que c’était une autre époque) portant sur les données de la Corée du Sud. Vous pouvez le lire ici. https://medium.com/@andreasbackhausab/coronavirus-why-its-so-deadly-in-italy-c4200a15a7bf. Vous avez probablement vu flotter le graphique suivant sur internet sans savoir d’où il venait. Il vient de là! Il compare la Corée du Sud avec l’Italie.


La Corée du Sud a été le premier pays touché après la Chine et a déployé immédiatement une stratégie de dépistage de masse : barrages policiers dans les rues, dépistage à l’auto, etc. Leur portrait n’est pas parfait, mais il a eu le mérite de dépister plusieurs cas asymptomatiques qui ne sont pas testés actuellement dans les autres pays, y compris au Québec. C’est ce qui se rapproche le plus, pour le moment, d’un échantillonnage aléatoire tel que l’on ferait lors d’un sondage.


Les résultats sont surprenants : 30% des porteurs en Corée étaient âgés de 20 à 29 ans! L’Italie, en contraste, ne teste que les cas présentant des symptômes, probablement même à leur arrivé à l’hôpital. Connaissant leur situation, il s’agit majoritairement de personnes âgées.


Le taux de contamination des 20-29 ans en Corée du Sud est possiblement trop élevé. Il faudrait une deuxième étude pour les valider. Néanmoins, il y a plusieurs explications avancées récemment qui accordent une crédibilité à ce chiffre.


  • Les jeunes de cette tranche d’âge sont plus mobiles et sans contraintes. (Vous avez des enfants à la maison? Vous comprenez sûrement ce que contrainte veut dire.) Ils sont plus susceptibles de participer à des attroupements, voyager et rencontrer plusieurs personnes. La contamination se propage plus facilement chez cette tranche d’âge, avant qu’eux-mêmes ne la transmettent aux autres générations.

  • Cette même mobilité les rend probablement plus susceptibles, justement, de rencontrer un barrage policier effectuant des dépistages de coronavirus, et donc seraient plus testés. Nous n’avons pas cette donnée.

  • Il y a aussi eu le fameux patient 31 en Corée[1]. Ce dernier aurait continué de circuler malgré les interdictions et aurait potentiellement contaminé 1160 autres personnes à lui seul! Était-ce tous des jeunes? Nous ne le savons pas, mais ce serait suffisant pour biaiser totalement les résultats de ce graphique.

  • Finalement, il est accepté par la communauté scientifique maintenant que le SRAS-Cov2 est un virus plus virulent pour les tranches d’âges plus élevées et envers les personnes immunodéficientes. À l’inverse, il semblerait que ce virus pourrait être plus asymptomatique chez les tranches plus jeunes, bien que cela reste à démontrer.


Voici ce graphique dans lequel nous ajoutons les données du Québec publiées le 27 mars.


Le Québec teste beaucoup, et a donc un portrait relativement plus fiable que plusieurs autres pays, dont l’Italie. Toutefois, nous ne testons pas encore, à ma connaissance, les gens sans symptômes. Nous en échappons donc certains. À coup sûr, nous ne détectons pas les cas fantômes.


Ajuster les données du Québec en supposant que l’échantillon coréen soit représentatif


Je dis bien en supposant que l’échantillon coréen soit représentatif. En même temps, il s’agit des seules données du genre disponible actuellement. D’ici à ce qu’un autre gouvernement réalise un échantillonnage probabiliste complet, nous devons faire avec.


D’abord, la démographie sud-coréenne est plus jeune qu’au Québec, comme on peut le voir ici. Il y a notamment beaucoup moins de personnes âgées en Corée, mais la différence au chapitre des plus jeunes générations n’est pas si grande.



En ajustant mes calculs en fonction de la démographie différente des deux populations, voici la distribution des cas observés au Québec (en bleu), et ce qu’elle devrait être si elle était similaire à la Corée du Sud (en gris).



Calculer le nombre de cas Québécois selon les nouvelles distributions


Le 31 mars 2020, il y avait 4132 cas au Québec. J’utilise donc ces 4132 cas que je multiplie par le pourcentage dans le dernier graphique en haut. J’obtiendrai le nombre de personnes infectées au Québec par tranche d’âge (en bleu) et le portrait que l’on devrait voir (en gris) si le portrait de contamination était similaire à la Corée du Sud.


(Il y a d’autres manipulations mineures, je redistribue le 5% de cas inconnus, je regroupe les tranches d’âge de 19 ans et moins, mais c’est du charabia technique pour les gens intéressés à ce genre de chose.)


Voici le résultat :



Ajustements pour trouver les cas fantômes


Dans le dernier graphique, il n’y a pas de cas fantômes : il y a exactement 4132 cas bleu et gris. Ils sont juste répartis différemment. Ce n’est pas le but de l’exercice.


Il y a un autre problème : il y a des faux fantômes! Nous détectons 613 cas de 30-39 ans alors qu’il ne devrait y avoir que 409 cas? Nous ferions des faux positifs? Nous dirions à des gens qu’ils sont malades alors qu’ils ne le sont pas? Bien sûr que non!


Les faux tests positifs peuvent exister, mais il doit y en avoir peu. Je laisserai soins aux spécialistes de ce domaine de valider. Je ne suis qu’un économiste, je lis des chiffres, mais je n’ai aucune donnée sur la qualité des tests.


Je vais donc faire confiance aux spécialistes et formuler ces trois hypothèses :

  1. Il n’y a pas de faux tests négatifs.

  2. Il y a des cas fantômes que nous ne détectons pas.

  3. La distribution de la Corée du Sud est représentative de la réalité.


Cela veut dire que les colonnes bleues sont le minimum absolu. Si tous ces tests sont vrais, alors il y a au minimum 613 cas de 30-39 ans, au minimum 701 cas de 40-49 ans et ainsi de suite. Vous me suivez?


Toutes les colonnes grises doivent être au minimum à la même hauteur que les colonnes bleues. En revanche, elles peuvent être plus hautes (on ne détecte pas tout le monde). Et on veut garder la même proportion entre les colonnes grises.


Alors pour vulgariser mes manipulations mathématiques au maximum : qu’est-ce qu’on fait? On remonte toutes les colonnes grises!


Ma méthodologie est de trouver le plus petit nombre possible de cas qui :

  1. Ne produirait pas de faux positifs

  2. Produirait des cas fantômes

  3. Respecterait la distribution représentative de la Corée du Sud que nous avons calculé au début.

Il y a un algorithme derrière ça. Il n’est pas trop « fency ». Il donne ceci en résultat :



Sous cette méthodologie, nous détecterions 100% des cas de Covid-19 chez les 40-49 ans. Il y aurait des cas fantômes dans toutes les autres catégories d’âge. Surtout chez les 20-29 ans, comme en Corée du Sud! Il s’agit du minimum de cas fantômes possibles pour respecter ces 3 conditions. Il pourrait très bien être plus élevé. Il a le mérite de donner une borne inférieure.


Voici le même graphique présenté différemment pour calculer le nombre de cas fantômes.



Il y aurait donc au minimum 2387 cas fantômes au Québec en date du 31 mars. Il y aurait 6549 cas dans la nature plutôt que le 4162 cas rapporté. Côté positif, les tests que nous effectuons détecteraient 63,6% des cas!


Comparé à la méthodologie de mon autre article où je postulais 2500 cas fantômes (4 jours plus tôt toutefois), et environ 50% de détection des cas, l’ordre de grandeur me semble raisonnable.


Que faire pour la suite?


Dans les prochains jours, je fusionnerai mes deux modèles afin d’affiner l’estimation du portrait réel du Québec. Et je ferai les projections, notamment pour estimer la date d’atteinte du fameux « peak ».


Pour le reste, je crois que j’ai ici une méthode qui pourrait être utile, combinée à d’autres méthodes, pour tenter d’estimer le nombre de cas fantômes. Des études effectuées sur des échantillons probabilistes (comme pour un sondage) seraient très utiles. À présent nous n’avons que l’exemple de la Corée du Sud, et sa validité pourrait très bien être contestée. Mais les économistes, contrairement aux autres sciences, nous n’attendons pas les données parfaites avant de nous prononcer. Nous utilisons les données disponibles, et lorsqu’il y en a d’autres, on refait nos prévisions. Ça aide à garder espoir et combler le temps.


J’aimerais que le gouvernement procède à un dépistage par échantillonnage aléatoire afin de connaître un portrait plus fiable de la situation. Au moment d’écrire ces pages, le gouvernement procède à presque 10 000 tests par jour. Consacrer 1000 ou 2000 de ces tests à un programme d’échantillonnage aléatoire au cours des prochains jours ne me semble pas un énorme sacrifice. L’information retirée serait très utile.

D’ici là, prenez-soins de vous.


Mathieu Marchand

Le Vulgaire Économiste




Sources [1] https://www.post-gazette.com/opinion/editorials/2020/03/20/Patient-31-South-Korea-social-distancing/stories/202003190019

https://medium.com/@andreasbackhausab/coronavirus-why-its-so-deadly-in-italy-c4200a15a7bf.

©2020 par Mathieu Marchand - Le Vulgaire Économiste.
Créé avec Wix.com