« 95.000 morts du Covid ? Comment l’INSEE surestime la hausse de mortalité » par Pierre Chaillot

Le 30/06/2022 par Laurent Mucchielli

« 95.000 morts du Covid ? Comment l’INSEE surestime la hausse de mortalité » par Pierre Chaillot

Le 19 mai 2022, l’INSEE a publié une étude consacrée à l’impact de l’épidémie de Covid-19 sur la mortalité de mars 2020 à décembre 2021. Plus d’un an après son premier bilan démographique, l’INSEE choisit de nouveau les éléments de comparaison qui surestiment le plus possible la mortalité. Ce faisant, l’institut se met au service de la communication gouvernementale, manquant à son devoir de neutralité et d’objectivité

Le 19 mai 2022, l’INSEE a publié une étude consacrée à l’impact de l’épidémie de Covid-19 sur la mortalité de mars 2020 à décembre 2021. Nous avions déjà répondu point par point au précédent bilan démographique, lui aussi très alarmiste, publié le 19 janvier 2021. Plus d’un an après, l’INSEE choisit de nouveau les éléments de comparaisons qui surestiment le plus possible la mortalité. Ce faisant, l’institut se met au service de la communication gouvernementale, manquant à son devoir de neutralité et d’objectivité.

L’INSEE annonce donc que, « De mars 2020 à décembre 2021, les décès observés ont dépassé de 95 000 ceux attendus ». On note que la vérité progresse pas à pas. Pour mémoire, le 16 avril 2021, les médias faisaient leurs gros titres sur le 100 000ème mort français du Covid comptabilisé par Santé Publique France (nous avions répondu à ces estimations dans une vidéo). La mode était d’annoncer 100 000 morts en un an, alors que l’Insee en annonce aujourd’hui 95 000 en presque deux ans. Deux fois moins donc. La révision est plus que conséquente. Cette nouvelle étude de l’INSEE pose toutefois deux nouveaux problèmes : 1) Pourquoi commencer l’année 2020 en mars et quel impact a ce choix sur les résultats ? 2) Que sont ces fameux « décès attendus » qui auraient été dépassés de 95 000 en deux ans ?

Des dates choisies pour maximiser la surmortalité

Concernant le premier point, il est contraire à tous les usages de ne pas regarder une mortalité sur un multiple de 12 mois. La mortalité varie selon les saisons. On peut retrouver les séries des données de décès français sur le site de l’INSEE. Les décès sont plus nombreux l’hiver que l’été. La mortalité est liée notamment à la température extérieure.

Dès lors, lorsque l’on veut faire un calcul de surmortalité, il faut nécessairement le faire sur des périodes de 12 mois, afin de comparer ce qui est comparable. L’idéal est de couper l’année autour du mois de juin, au moment des creux de mortalité, car les hausses de mortalité hivernales peuvent être décalées selon les années. Utiliser l’année calendaire peut parfois laisser toute la période de surmortalité sur une seule année ou parfois la couper en deux. Dans tous les cas, il n’est pas normal de faire une étude sur 22 mois au lieu de 24. 

L’INSEE nous donne d’ailleurs l’impact de sa décision dans son étude.

Selon les calculs de l’INSEE, l’année 2020 a en fait commencé par une sous-mortalité de 8 900 personnes. Évidemment, les décès français sont en quasi-totalité le fait de personnes âgées. Lorsque 8 900 personnes décèdent en moins que l’attendu sur janvier-février, il ne s’agit pas de personnes qui sont devenues immortelles. Elles vont nécessairement décéder et se retrouver donc “en plus” un peu plus tard. Il faut donc bien inclure cette période dans l’étude pour être objectif sur la surmortalité totale.

Un modèle hors-sol
 
Attelons-nous maintenant à comprendre comment l’INSEE a calculé ses décès attendus, la pertinence de ses choix et leurs impacts sur l’estimation de la surmortalité. 
Contrairement au bilan démographique de 2021, l’INSEE prend en compte le fait que la population française grandit et vieillit. De fait, il est normal que le nombre de décès augmente. Pour comparer une année à l’autre, il est donc nécessaire de se baser sur les taux de mortalité par âge, plutôt que sur le nombre de décès total. L’INSEE a également intégré le fait que 2020 était une année bissextile. Sur 650 000 morts de 2020, 1900 sont attribués au fait qu’il y a un jour en plus dans l’année. Ce sont des progrès indéniables. On doit cependant se poser des questions sur le fait que ces « détails » aient pu être négligés dans des bilans démographiques.

Il reste, pour terminer cette estimation des « décès attendus », à proposer une méthode pour déterminer les taux de mortalité, pour chaque âge, attendus en 2020. L’INSEE explique son choix dans la partie méthodologie de l’étude.

La « tendance de la décennie 2010-2019 » signifie que l’INSEE prolonge la hausse ou la baisse des taux de mortalité observés sur 10 ans. A l’occasion de la vidéo explicative sur l’espérance de vie, nous avions décomposé le calcul incluant celui des taux de mortalité. Toutes les données et calculs sont toujours consultables en ligne. Le lecteur y retrouvera tous les éléments expliqués ici. La supposition que fait l’INSEE entraîne directement le nombre de décès prévus illustré en début d’étude. 

Comprendre l’effet de moisson

Régulièrement, le plus souvent tous les deux à trois ans, le nombre de décès augmente brutalement, surtout l’hiver. Cet évènement est appelé « moisson » et l’INSEE y fait bien référence dans son étude. En 2020, cela faisait déjà quatre ans qu’aucune « année moisson » n’était survenue en France. Pourtant, avec une population de plus en plus vieillissante, ce type d’évènement a de plus en plus d’impact. Il ne semble donc pas voué à disparaître, mais au contraire à s’accentuer. Les enfants sont capables de reproduire des algorithmes de couleur dès la maternelle. Ici, n’importe quel lecteur devrait s’attendre à ce qu’une forte augmentation de la mortalité apparaisse prochainement et non pas que la mortalité stagne indéfiniment. Il n’est donc pas raisonnable que le modèle proposé par l’INSEE reste « plat » sans que l’on se pose plus de question que cela. J’appelle cela « ne pas lever le nez de sa copie ». Cela arrive fréquemment lorsque la personne qui construit un modèle ne se pose pas la question de savoir si ce dernier a réellement du sens. Ici, le simple « bon sens » devrait alerter tout statisticien sur la pertinence de la courbe rouge des décès attendus. Surtout que, s’il n’y a pas eu de hausse de mortalité depuis longtemps, les « morts en moins » ne sont pas des personnes qui vivront éternellement. Il s’agit d’un report de décès qui finira par se voir dans une hausse de mortalité future. Nul ne peut affirmer qu’il est normal qu’elle ait lieu en 2020, mais nul ne peut affirmer non plus qu’elle ne pouvait pas avoir lieu. Les exercices prospectifs ne sont jamais des prévisions et ni des « résultats ». Ils doivent toujours être étudiés dans le cadre de scénarios multiples en explicitant clairement les hypothèses et les connaissances qu’ils apportent à chaque fois. En l’occurrence, l’exercice minimal est d’envisager le scénario de poursuite de la tendance récente mais également le scénario « moisson ».

Pour comprendre la méthode de continuité de tendance des taux de mortalité utilisé par l’INSEE, prenons par exemple les taux de mortalité des personnes de 80 ans. Ces taux de mortalité sont stables depuis quelques années. De plus, les taux observés sont supérieurs à l’année précédente une année sur deux. Mais en prenant pour référence la tendance 2010-2019, l’INSEE suppose que le taux de mortalité de l’année 2020 est nécessairement plus bas que 2019. Cela pose de multiples problèmes. Pour s’en rendre compte, il faut, une fois de plus, lever le nez de sa copie.

Le premier problème est que le taux de mortalité prévu en 2020 est un taux de mortalité plus bas que ce qui n’a jamais été enregistré dans toute l’histoire de France. C’est donc un taux de mortalité qui n’a jamais existé. Le taux de mortalité de 2019 était déjà un record absolu et l’INSEE suppose que 2020 va nécessairement le battre. Or cette supposition n’est pas du tout raisonnable.

De plus, si nous prolongeons la tendance linéaire, nous découvrons qu’en 2068, le taux de mortalité tombe à 0. Doit-on alors supposer qu’à cette date, les personnes de plus de 80 ans ne mourront plus du tout ? Que si vous êtes né dans les années 80, vous serez éternel ? Ce n’est pas sérieux. Encore mieux, au-delà de 2068, les personnes de plus de 80 ans vont commencer à ressusciter… La seule conclusion qui s’impose est que cette tendance à la baisse va nécessairement s’arrêter. Il est tout à fait possible que le minimum ait été atteint en 2019, qui est une année record de sous-mortalité partout en Europe. Encore une fois, avoir très peu de morts une année n’est qu’un report sur les années suivantes.

Quand le résultat dépend de la méthode choisie

Ajoutons, que l’INSEE a testé trois scénarios de baisse de quotient de mortalité. Le premier calé sur 2000-2014 (choix éloigné de 2020, à une période où les taux de mortalité baissent fortement), un deuxième sur 2014-2019 (qui montre que les taux de mortalités ne baissent presque plus depuis 5 ans) et le troisième sur 2010-2019 (qui montre une tendance baissière surtout à cause du début de période). L’Insee choisit de ne commenter que le dernier scénario qui montre une surmortalité plus forte qu’en choisissant le deuxième. C’est extrêmement inhabituel. Lorsque l’on utilise des modèles, la moindre des choses est de prévoir un intervalle de confiance. Toute surmortalité ou sous-mortalité ne peut s’envisager que sur ce qui est en dehors de cet intervalle.

Le choix de l’INSEE est de ne commenter qu’un seul scénario, celui de taux de mortalités plus bas que ce qui n’a jamais été observé, et dont on sait pertinemment qu’ils ne pourront pas baisser indéfiniment. Ce n’est pas raisonnable.

Si on choisit d’autres taux de mortalité, notamment ceux observés les cinq années précédentes, on conclut que l’année 2020 a finalement un nombre de décès inférieur à ce qui a été observé par exemple en 2015. Pour mémoire, 2015 est la dernière année de mortalité importante, avec un hiver qui fit lui aussi déborder les services d’urgence des hôpitaux français. La mortalité 2020 est au-dessus des 4 années qui ont suivi. Mais si ces quatre années correspondent plutôt à des années de sous-mortalité, il est alors normal de finir par vivre une année de « rattrapage ».

Ce 95 000 que titre l’INSEE est donc bien au-dessus de toute estimation réalisable avec des données observées. La réalité observable en regardant simplement les cinq dernières années devrait amener à la conclusion que la mortalité en 2020 se situe entre une sous-mortalité de 12 000 personnes (sur la base de 2015) et une surmortalité de 37 000 personnes (sur la base de 2019), ce qui est évidemment beaucoup moins vendeur.

Un parti-pris qui n’a rien à faire là

Ainsi, l’INSEE a tout fait pour construire un modèle qui surestime la mortalité 2020. Les raisons de ce choix s’éclairent dans la deuxième partie de l’étude. De façon à nouveau très inhabituelle, une très grosse partie de cette étude consiste à citer des « résultats » d’analyses pro-gouvernementales sur lesquels l’INSEE n’a aucune prise, ni sur les méthodes, ni sur la qualité des données en entrée.

Ainsi, la deuxième partie de l’article compare la surmortalité précédemment calculée au nombre de décès Covid-19 diffusés par Santé Publique France. Nous en avons déjà parlé, cet organisme travaille sous la tutelle du Ministère de la Santé. Tout comme la DREES, il n’est hélas pas possible d’attendre de sa part autre chose qu’une validation des décisions du Ministre. L’INSEE présente alors une illustration de la manière dont elle comprend la mortalité de 2020 : 

Ainsi, sans avoir aucune donnée interne pour valider le fait qu’il existe une mortalité propre à la Covid-19, l’institut en fait un présupposé. L’INSEE ne peut pas savoir si des personnes sont décédées « du virus », et encore moins combien, sur la base de ses propres données. La seule donnée publique, vérifiable par chaque citoyen, est que, depuis le début de l’année 2020, des mesures extrêmement contraignantes ont été mises en place par le gouvernement. Le titre de cette étude devient alors : Mortalité depuis le début des mesures mises en place dans le cadre de l’épidémie de Covid-19 : 95 000 décès de plus qu’attendus de mars 2020 à décembre 2021. Ce qui, là encore, est tout de suite beaucoup moins vendeur…

Parmi les arguments avancés par l’étude justifiant le comptage des morts Covid-19, nous retrouvons les « morts à domicile Covid-19 qui ne sont pas comptabilisés ». Cette estimation provient étrangement d’un article de l’INED, alors que c’est bien l’INSEE qui diffuse les décès par lieu (domicile, hôpital, EHPAD ou autre). 

Pour mémoire, nous avons montré grâce au rapport de l’ATIH que ces 6 000 décès correspondant à la surmortalité à domicile en 2020 peuvent aussi bien s’expliquer par le nombre de personnes qui n’ont pas été prises en charge pour AVC et infarctus pour cause de confinement. Avant de déclarer que la surmortalité est due au seul virus, il est normalement nécessaire de lire les sources disponibles pour ne pas tomber dans un biais de confirmation.

Parallèlement, l’étude fait la promotion des mesures gouvernementales, avec pour source les agences gouvernementales. L’INSEE n’a pourtant aucun moyen de justifier que la réduction des contacts ou les gestes de protection aient un quelconque impact sur la mortalité. L’argument des accidents de la route est révélateur du parti-pris. En 2020, le nombre de décès par accidents de la route a baissé de 500. Ce qui n’est pas vraiment le même ordre de grandeur que la surmortalité de 95 000 personnes annoncée, ou que les 6 000 décès possiblement attribuables aux AVC et infarctus non soignés.

Quand la Covid fait disparaître la grippe (qui rapporte moins d’argent aux hôpitaux)

L’INSEE tombe ensuite dans le piège de la codification, en prenant pour acquis le fait que la grippe aurait complètement disparu pendant deux ans pour laisser toute la place à la Covid-19.

Or nous avons montré dans cette vidéo qu’il n’y plus de statistiques de grippes en France depuis deux ans, possiblement parce qu’il est beaucoup plus rentable pour les hôpitaux de déclarer des patients atteints d’infection respiratoire dans les cases correspondant à la Covid-19 (ici en jaune) que dans les cases correspondant à la grippe. Pour mémoire les Groupes Homogènes de Malades (GHM) dans lesquels sont classés chaque séjour des patients de hôpitaux, déterminent le montant que sera remboursé l’hôpital. Le GHM est déterminé à partir des codes rentrés par les agents des Départements de l’Information Médicale (DIM) des hôpitaux (et pas par les médecins). Ces codes appartiennent à la Classification Internationale des Maladies (CIM-10) réalisée par l’Organisation Mondiale de la Santé (OMS). Or, pour la première fois, des codes d’urgences ont été mis en place dès le début de la crise par l’OMS. Les consignes aux services d’informations médicales (DIM) sont détaillées par l’ATIH :

En France, les patients sont donc tous supposés atteints de Covid-19 et il n’est pas permis de préciser que le virus n’est pas identifié. Ces consignes très larges concernant la codification Covid-19 sont quasiment les mêmes en Belgique. Mais, en plus, d’autres codes ont été introduits en octobre 2020 pour faire figurer la Covid-19 chez les patients arrivant à l’hôpital, mais considérés « guéris » de la Covid-19.

A partir d’octobre 2020 il n’est plus nécessaire d’avoir une infection respiratoire, ni même un test positif Covid-19 pour rentrer dans les statistiques Covid-19. Il suffit de déclarer que le patient a eu la Covid-19 auparavant et que son séjour en serait une « suite ». Faire passer toute difficulté respiratoire comme conséquence d’un précédent Covid par le jeu de la codification vient directement alimenter le discours des « Covid-long » ou des « séquelles du Covid ». Les statistiques sont nécessairement très larges puisque que 3,6 millions de personnes en permanence souffrent de problèmes respiratoires en France. Ainsi même avec un test Covid-19 négatif, une maladie respiratoire est considérée quand même de la faute de la Covid-19.

Ces codifications d’urgence ont permis aux hôpitaux d’obtenir une facturation bien plus intéressante que celle des classiques grippes. L’ensemble des tarifs selon les années est consultable sur le site de l’ATIH. La description des symptômes étant très large, tout patient pouvait se retrouver dedans. Il est évident que depuis la mise en place des nouveaux codes, les hôpitaux ont un intérêt financier direct à déclarer un patient malade du Covid-19 (donc avec un code d’urgence U07, U08, U09, U10 ou U11) qui permet à la fonction groupage de le considérer dans le GHM 04M07 Infections et inflammations respiratoires pour 2 208 € le séjour en niveau 1, plutôt que dans le banal Grippes pour 1 007 € le séjour.

Notre hypothèse est qu’il n’y a pas eu une disparition des bronchites, pneumonies, bronchopneumathies, bronchiolites, tuberculoses et autres grippes, mais un transfert de codage qui fait croire à la disparition de toutes les maladies respiratoires, regroupées dorénavant sous la bannière de Covid-19. C’est tout le problème de prendre pour argent comptant des données administratives hospitalières récupérées sans contrôle qualité, et qui dépendent de choix politiques et financiers. Pour ceux qui s’intéressent plutôt à l’économie, on retrouve la même entourloupe avec les données du chômage.

Quand l’INSEE sort de son domaine de compétence et discourt sur l’effet de la vaccination

Plus loin, l’INSEE se permet même de faire la promotion de la vaccination, citant cette-fois directement les statisticiens du Ministère de la Santé, comme-si le ministère allait se juger objectivement lui-même.

Nous avons détaillé plusieurs fois, notamment dans une vidéo spécialement consacrée aux statistiques de la DREES, les nombreux biais des données de la DREES. Le plus simple à comprendre est celui des tests : le vaccin a permis entre juillet 2021 et mars 2022 d’avoir accès au passe vaccinal. Avoir un passe vaccinal permet de ne pas se tester. Ne pas se tester permet de ne pas être déclaré positif Covid-19. Un vaccin, pas de test. Pas de test, pas de Covid. Pas de Covid, le vaccin marche. Et le tour est joué.

Pour finir, l’INSEE s’étonne toutefois que la mortalité en 2021 soit restée élevée, malgré l’effet moisson et surtout la vaccination déclarée efficace à 90% un peu plus haut.

L’INSEE s’étonne notamment que la mortalité ait augmenté chez les jeunes. L’institut évite soigneusement de se demander quelles mesures ont été mises en place en 2021, visant notamment des jeunes, qui pourraient avoir un impact sur la mortalité. Si l’INSEE n’était pas enferré dans un biais de confirmation et la volonté de montrer que « le virus tue et les mesures protègent, en particulier la vaccination », il aurait pu découvrir que cette hausse de mortalité a commencé précisément à l’été 2021. Il aurait pu alors se demander ce qui a spécifiquement commencé à l’été 2021. Il aurait pu en particulier se demander ce qui, en 2021, peut expliquer la soudaine augmentation de mortalité des jeunes, jusqu’ici parfaitement épargnés. L’INSEE aurait pu se rendre compte que les données de vaccination par âge sont publiques, fournies par l’ECDC. Elle aurait ensuite pu vérifier s’il existe ou non une corrélation entre ces données et la mortalité, comme nous l’avons fait pour toute l’Europe.

Pour conclure

En fin de compte, nous avons donc une étude de l’INSEE qui surestime au maximum la surmortalité de 2020, et qui se lance dans un exercice de promotion du discours gouvernemental. Nous avons vu que les éléments proposés sont basés sur des hypothèses extrêmement fragiles à condition de se pencher sur les sources et méthodes utilisées. Nous avons montré que la simple étude de quelques scénarios alternatifs tout aussi probables amène à des conclusions complètement opposées. Cette étude est le parfait reflet du biais de confirmation dans lequel nous vivons depuis deux ans. Plutôt que de remettre les préjugés en question pour comprendre ce que nous vivons, certains préfèrent prendre pour argent comptant tout ce que dit le gouvernement. Il va sans dire qu’aujourd’hui c’est encore la meilleure façon de garder sa place au soleil.

Pierre Chaillot, statisticien

À lire aussi

9 Commentaire(s)

  1. Sur l’absence de grippe, il me semble que les données du réseau Sentinelles valident celle-ci.

    Modalités de la surveillance des IRA par le réseau Sentinelles:
    Chaque année, des virus à tropisme respiratoire circulent en France métropolitaine entrainant des infections respiratoires aiguës (IRA). Ces virus sont principalement les virus grippaux, et d’autres virus respiratoires comme le virus respiratoire syncytial (VRS), le rhinovirus ou le métapneumovirus, mais aussi le SARS-CoV-2 (COVID-19) depuis 2020. Ils nécessitent une surveillance rapprochée, car ils peuvent être la cause d’épidémies plus ou moins sévères.
    Pour effectuer cette surveillance en médecine de ville, les médecins généralistes Sentinelles rapportent depuis le 17 mars 2020 le nombre de cas d’IRA vus en consultation (ou téléconsultation), selon la définition suivante :
    apparition brutale de fièvre (ou sensation de fièvre) et de signes respiratoires.
    Une surveillance virologique est également réalisée par les médecins généralistes et pédiatres Sentinelles, avec le prélèvement d’un échantillon des cas d’IRA vus en consultation, afin d’identifier les virus circulants.

    La saison 2020/2021 a été marquée par :
    – la circulation du virus SARS-CoV-2 (COVID-19)
    – l’absence exceptionnelle de circulation des virus grippaux
    Durant la période de surveillance 1 202 prélèvements ont pu être réalisés.
    Les virus recherchés par les laboratoires partenaires étaient le SARS-CoV-2 (COVID-19), les virus grippaux, le rhinovirus (hRV), le métapneumovirus (hMPV) et le virus respiratoire syncytial (VRS).
    Sur 1193 prélèvement testés 3 était positif à au moins pour un virus grippal

    Saison 19/20 : Parmi les 2 358 prélèvements réalisés, 2 358 ont pu être analysés (100,0%), dont 1 136 (48,2%) étaient positifs pour au moins un virus grippal.
    Saison 18/19 : Parmi les 2 525 prélèvements réalisés, 2 524 ont pu être analysés (99,9%), dont 1 293 (51,2%) étaient positifs pour au moins un virus grippal.
    Saison 17/18 : Parmi les 2 759 prélèvements réalisés, 2 758 ont pu être analysés (99,9%), dont 1 592 (57,7%) étaient positifs pour au moins un virus grippal.
    Saison 16/17 : Parmi les 2 974 prélèvements réalisés, 2 973 ont pu être analysés (99,9%), dont 1 437* (48,3%) étaient positifs pour au moins un virus grippal.
    Saison 15/16 : Parmi les 4 029 prélèvements réalisés, 4 024 ont pu être analysés (99,9%), dont 2 123* (52,8%) étaient positifs pour au moins un virus grippal.
    Saison 14/15 : Parmi les 2 613 prélèvements réalisés, 2 610 ont pu être analysés (99,9%), dont 1 450* (55,6%) étaient positifs pour au moins un virus grippal.

Laisser un commentaire