Ergebnis für URL: http://www.ummisco.ird.fr/perso/bacaer/2020MMNP.html
       Un modèle mathématique des débuts de l'épidémie de coronavirus en France

                        Math. Model. Nat. Phenom. 15 (2020) 29
                        [1]https://doi.org/10.1051/mmnp/2020015
                   [2]https://hal.archives-ouvertes.fr/hal-02509142

                                    Nicolas Bacaër

                      Institut de recherche pour le développement
       Unité de modélisation mathématique et informatique des systèmes complexes
                             Les Cordeliers, Paris, France
                                 nicolas.bacaer@ird.fr

     * [de] Um den Artikel auf Deutsch zu lesen, benutzen Sie den in Ihrem Browser
       integrierten automatischen Übersetzer.
     * [en] To read the article in English, use your browser's machine translator.
     * [es] Para leer el artículo en español, utilice el traductor automático de su
       navegador.
     * [it] Per leggere l'articolo in italiano, utilizzare il traduttore automatico
       del browser.
     * [ja]
       日本語de記事wo読muniha,_BuRaU6Zani&#20869
       ;蔵saretei5ru自動翻訳機能wogo&#2103
       3;用kudasai5._
     * [pt] Para ler o artigo em português, utilize o tradutor automático do seu
       navegador.
     * [ru] CHtoby prochitat' stat'yu na russkom yazyke, vospol'zujtes' vstroennym
       avtomaticheskim perevodchikom vashego brauzera.
     * [zh]
       要阅读中文文本,请使&#29
       992;你的浏览器内置的自&
       #21160;翻译器._

    Résumé

   On étudie un modèle mathématique S-E-I-R à deux phases, inspiré de l'épidémie
   actuelle de coronavirus. Si les contacts sont réduits à zéro à partir d'une
   certaine date T au début de l'épidémie, la taille finale de l'épidémie est proche
   du nombre R(T) de cas cumulés, multiplié par la reproductivité
   \(\,\mathcal{R}_0\,\) de l'épidémie. Plus généralement, si les contacts sont
   divisés par le nombre q au temps T, avec \(\,\mathcal{R}_0/q < 1\), alors la
   taille finale de l'épidémie est proche de \(R(T) \, \mathcal{R}_0\,
   (1-1/q)/(1-\mathcal{R}_0/q)\). On ajuste approximativement les paramètres du
   modèle aux données relatives au coronavirus en France.

1.   Le modèle

       La figure 1\(^a\,\) montre le nombre cumulé de cas confirmés de coronavirus
   en France entre le 25 février et le 29 mars 2020. Ces données incluent à la fois
   les laboratoires de ville et les patients hospitalisés [10]. Il faut distinguer
   la date du 15 mars à partir de laquelle des mesures drastiques ont été prises
   subitement pour arrêter l'épidémie (fermeture des écoles, des restaurants, etc.).
   Pour ces trois dates, le nombre cumulé de cas confirmés est passé de 13 à 5423
   puis à 40174. La figure 1\(^b\,\) montre les mêmes données en coordonnées
   logarithmiques ainsi que des droites de régression linéaire. On observe trois
   périodes. Dans la première, qui va jusqu'au 6 mars, la croissance est rapide mais
   assez irrégulière. Dans la deuxième, qui va jusqu'au 15 mars, la croissance est
   un peu moins rapide mais régulière. Dans la troisième, à partir du 16 mars, la
   croissance est ralentie mais toujours régulière. Si l'on ajuste une droite sur
   l'ensemble des deux premières périodes, qui va du 25 février au 15 mars, on
   trouve que le nombre de cas croît exponentiellement avec un taux l ~= 0,31 par
   jour (en rouge). Le temps de doublement est (ln 2)/l ~= 2,2  jours. Si en
   revanche on se limite à la deuxième période, avec des données qui sont
   particulièrement bien alignées en échelle logarithmique, on obtient l ~= 0,225
   par jour et un temps de doublement de 3,1 jours (en bleu). Comme les données du
   début de l'épidémie sont perturbées par une part importante de nouveaux cas
   importés et par des effets stochastiques, c'est probablement la deuxième
   estimation qui est la plus fiable. Pour la troisième période, après la mise en
   place de mesures drastiques, le temps de doublement passe à 4,9 jours.

   [Figure1a.png] [Figure1b.png]

   Figure 1. a) Nombre cumulé de cas confirmés en France entre le 25 février et le
   29 mars 2020, d'après  Santé publique France  et [11]. b) Logarithme népérien de
   ce nombre et droites de régression linéaire.

       On va étudier un modèle mathématique inspiré de cette épidémie. Divisons la
   population française en cinq compartiments selon une variante du modèle classique
   S-E-I-R (voir par exemple [3, p. 61]) :
     * \(S\) : personnes saines
     * \(E\) : personnes infectées en phase latente, autrement dit, pas encore
       infectieuses
     * \(I\) : personnes infectieuses sans protection
     * \(R_1\) : personnes retirées de la chaîne de transmission et comptabilisées
       parmi les cas confirmés
     * \(R_2\) : personnes retirées de la chaîne de transmission mais non
       comptabilisées.

   Chacun de ces deux derniers compartiments regroupe donc à la fois ceux qui sont
   encore infectieux mais isolés et ceux qui ne sont plus infectieux car guéris ou
   décédés. Certains malades ont des symptômes de faible gravité et restent chez eux
   sans se faire tester, d'autres habitent dans des maisons de retraites et n'ont
   pas non plus été testés malgré les complications voire le décès ; ce sont ces
   catégories que l'on retrouve dans le compartiment \(\,R_2\). On peut évidemment
   raffiner à l'infini ce modèle pour le rendre plus réaliste mais on a essayé de
   limiter au maximum le nombre de paramètres inconnus ; on a aussi pour but
   principal d'obtenir un résultat théorique relatif à la taille finale de
   l'épidémie.

       Introduisons quelques notations :
     * \(N\) : la population totale (supposée grande) de sorte que
       \(N=S(t)+E(t)+I(t)+R_1(t)+R_2(t)\)
     * \(a\) : le taux de contact effectif
     * \(b\) : le taux auquel les personnes infectées en phase latente deviennent
       infectieuses
     * \(c\) : le taux moyen auquel les personnes infectieuses sont isolées et donc
       retirées de la chaîne de transmission
     * \(f\) : la fraction d'individus infectieux qui sont comptabilisés parmi les
       cas confirmés au moment de l'isolement (\(0 \leq f \leq 1\)). Cette fraction
       peut varier au fil du temps mais on supposera pour simplifier qu'elle est
       constante.

   On a alors \begin{eqnarray} \frac{dS}{dt} &=& -a\, S\, \frac{I}{N}\tag{1}\\
   \frac{dE}{dt} &=& a\, S\, \frac{I}{N} - b\, E\tag{2}\\ \frac{dI}{dt} &=& b\, E -
   c\, I\tag{3}\\ \frac{dR_1}{dt} &=& f\, c\, I\, ,\tag{4}\\ \frac{dR_2}{dt} &=&
   (1-f)\, c\, I\, .\tag{5} \end{eqnarray} Pour faire le lien avec les données de la
   figure 1, \(R_1(t)\)  correspond au nombre cumulé de cas confirmés à l'instant
   \(t\). On définit \(\,R(t)=R_1(t)+R_2(t)\,\). On a alors \begin{equation}
   \frac{dR}{dt} = c\, I.\tag{6} \end{equation} On déduit de  \(R_1(0)=R_2(0)=0\) \[
   R_1(t)=f\, R(t),\quad R_2(t)=(1-f) R(t),\quad \forall t\geq 0.\]

       Au début de l'épidémie, le nombre de cas reste très petit par rapport à la
   population totale de sorte que \(S(t)\simeq N\), ce qui conduit à la
   linéarisation \[ \frac{dE}{dt} \simeq a\, I - b\, E,\quad \quad \frac{dI}{dt} =
   b\, E - c\, I. \] Les nombres \(E(t)\) et \(I(t)\) mais aussi les
   nombres \(R_1(t)\) et \(R_2(t)\) tendent donc à croître exponentiellement
   comme \(e^{\lambda t}\). \(\,\lambda\,\) est la plus grande valeur propre de la
   matrice \begin{equation}\tag{7} \left (\begin{array}{cc} -b & a\\ b & -c
   \end{array} \right ). \end{equation} Le polynôme caractéristique est
   \begin{equation}\tag{8} \lambda^2 +(b+c)\lambda +b(c-a)=0. \end{equation} On a
   donc \begin{equation}\tag{9} \lambda=\frac{-(b+c)+\sqrt{(b+c)^2-4b(c-a)}}{2} =
   \frac{-(b+c)+\sqrt{(b-c)^2+4ab}}{2}\, . \end{equation}

       [9] indique que la durée d'incubation, c'est-à-dire la période avant
   apparition des symptômes, est de 5 à 6 jours. La période de latence peut être un
   peu plus courte puisqu'on peut devenir infectieux avant de montrer des symptômes.
   On fixe à 4 jours la durée moyenne dans la phase latente. C'est \(\,1/b\). On
   prend donc \(\,b= \mbox{0,25}\) par jour.

       La durée moyenne dans le compartiment infectieux avant isolement, qui
   vaut \(1/c\ \), est plus difficile à estimer car elle dépend de nombreux
   facteurs. Elle dépend des caractéristiques biologiques du virus, des
   caractéristiques des personnes telles que leur âge, mais aussi de la promptitude
   avec laquelle les cas sont isolés, ce qui varie d'un pays à l'autre. L'épidémie
   en France a lieu alors que les habitants sont déjà bien au courant de l'existence
   de la pandémie. Les malades ne tardent pas à être isolés. Certaines personnes ne
   sont pas du tout infectieuses. D'autres personnes sont infectieuses plusieurs
   jours avant d'être isolées. Supposons que la moyenne soit de l'ordre de 1 jour,
   la forme du modèle sous-entendant que la distribution est exponentielle. On
   aurait cette moyenne dans un modèle plus raffiné si 80% des infectés restaient
   infectieux pendant 0 jour et si 20% des infectés restaient infectieux pendant 5
   jours avant d'être isolés. En résumé, on a choisi \(\,c= 1\,\) par jour.

       On déduit de la formule (9) que \begin{equation}\tag{10} a =
   \frac{(2\lambda+b+c)^2-(b-c)^2}{4b}=(\lambda+c)\left (1+\frac{\lambda}{b}\right
   ). \end{equation} ce qui permettrait de calculer numériquement le taux de contact
   effectif à partir du taux de croissance observé l.

       Imaginons que des mesures de santé publique puissent diviser le taux de
   contact effectif par un nombre k tel que \(\,k > 1\). Combien doit valoir au
   minimum ce nombre pour arrêter l'épidémie ? Cette valeur minimale est
   traditionnellement notée \(\,\mathcal{R}_0\,\) à la suite de Lotka, qui l'a
   appelée la « reproductivité » [6, p. 102]. Avec \(\,a'=a/\mathcal{R}_0\,\), le
   nouveau taux de croissance de l'épidémie \(\,\lambda'\,\) doit être nul. D'après
   l'équation (8), cela conduit à \(\ c- a/\mathcal{R}_0=0\) et à \[ \mathcal{R}_0 =
   \frac{a}{c}=\left (1+\frac{\lambda}{b}\right ) \left (1+\frac{\lambda}{c}\right )
   \simeq \mbox{2,33}\] si l'on utilise la valeur numérique (\(\lambda\simeq
   \mbox{0,225}\,\) par jour) suggérée par la courbe épidémique de la figure 1. Vues
   les incertitudes sur les paramètres b et c, ceci ne peut être qu'une valeur
   approchée.

       De manière plus technique (voir par exemple [7]), on aurait pu remarquer que
    \(\mathcal{R}_0\)  était aussi le rayon spectral de la matrice \[\left
   (\begin{array}{cc} 0 & a \\ 0 & 0 \end{array} \right ) \left (\begin{array}{cc} b
   & 0 \\ -b & c \end{array} \right )^{-1}.\]

       Revenons au modèle S-E-I-R non linéaire (1)-(6). Rappelons comment déterminer
   la taille finale de l'épidémie en l'absence complète d'intervention ; c'est une
   adaptation facile et d'ailleurs bien connue de la méthode utilisée pour le modèle
   S-I-R (voir par exemple [4, p. 76]). Avec l'équation (1), on a \[\frac{d}{dt} \ln
   S = -\frac{a}{N} I(t).\] Donc en intégrant entre \(t=0\) et \(t=+\infty\),
   \begin{equation}\tag{11} \ln S(\infty) - \ln S(0) = -\frac{a}{N} \int_0^\infty
   I(t)\, dt\, . \end{equation} \(S(\infty)\) désigne la limite quand \(t\to
   +\infty\) de la fonction \(S(t)\,\). Cette fonction est décroissante et positive.
   Avec \(\ R(0)=0\) et l'équation (6), on a \begin{equation}\tag{12} R(\infty) =
   c\int_0^\infty I(t)\, dt. \end{equation} Par ailleurs, on a à tout
   instant \(S(t)+E(t)+I(t)+R(t)=N\). L'épidémie finit par s'arrêter :
   \[E(t)\mathop{\longrightarrow}_{t \to +\infty} 0,\quad
   I(t)\mathop{\longrightarrow}_{t \to +\infty} 0.\] On a donc
   \begin{equation}\tag{13} S(\infty)+R(\infty)=N. \end{equation} En combinant (11),
   (12) et (13), on a \[N-R(\infty)=S(0)\, \exp\left (-\frac{a}{c}
   \frac{R(\infty)}{N} \right ).\] Au début de l'épidémie, il n'y a que quelques
   personnes infectées dans la population, donc \(S(0)\simeq N\). L'équation
   implicite pour la taille finale de l'épidémie peut s'écrire comme
   \begin{equation}\tag{14} 1-\frac{R(\infty)}{N} \simeq \exp\left (-\mathcal{R}_0
   \, \frac{R(\infty)}{N}\right ), \end{equation} qui se trouve avoir la même forme
   que pour le modèle S-I-R [4]. Avec \(\,\mathcal{R}_0\simeq \mbox{2,33}\,\), on
   trouve \(R(\infty)/N \simeq 87\%\). Seule une fraction f de ces cas est
   confirmée.

2.   Deuxième phase avec intervention drastique

       Imaginons qu'à une certaine date T, des mesures drastiques soient prises de
   sorte que le nouveau taux de contact effectif soit réduit à 0. Supposons qu'il y
   ait à cet instant un nombre cumulé de cas confirmés égal à \(\,R_1(T)\). Par
   exemple, il y avait 5423 cas cumulés le 15 mars, date à laquelle sont entrées en
   vigueur les mesures concernant les écoles et les lieux publics. Peut-on alors
   prévoir quelle aurait été sous ces hypothèses la nouvelle taille finale de
   l'épidémie, ou du moins celle confirmée?

       Vers la fin de la phase exponentielle où \(t\leq T\) et où le nombre total de
   cas représente encore une part infime de la population totale, on a \[E(t)\simeq
   u\, e^{\lambda t},\quad I(t)\simeq v\, e^{\lambda t},\quad R(t)\simeq w\,
   e^{\lambda t}.\] \((u,v)\) est un vecteur propre associé à la plus grande valeur
   propre de la matrice (7), c'est-à-dire \(\lambda\). Ainsi, \[-b\, u+a\, v=\lambda
   \, u.\] Avec l'équation (10), on a \[u=\frac{a\,
   v}{\lambda+b}=\frac{\lambda+c}{b}\, v\, .\] Mais \(dR/dt \simeq \lambda
   R\) si \(\,t < T\,\) et si t n'est pas trop proche de 0. Donc \[I(T)=\frac{1}{c}
   \frac{dR}{dt}(T)\simeq \frac{\lambda }{c}\, R(T).\] Avec \(I(T)\simeq v\,
   e^{\lambda T}\,\), on a \[E(T)\simeq u\, e^{\lambda T} = \frac{\lambda+c}{b}\,
   v\, e^{\lambda T} \simeq \frac{\lambda+c}{b}\, I(T) \simeq \left
   (\frac{\lambda^2}{bc}+ \frac{\lambda }{b}\right ) R(T) \, .\]

       On suppose que les contacts sont réduits à zéro. On a pour \(\,t > T\)
   \begin{equation}\tag{15} \frac{dS}{dt} = 0,\quad \frac{dE}{dt} = - b\, E,
   \end{equation} tandis que les autres équations (3), (4) et (5) restent
   identiques. Sans avoir à résoudre ce système, la taille finale de l'épidémie sera
   \(R(\infty)=R(T)+E(T)+I(T)\). Il y a en effet \(\,E(T)+I(T)\,\) individus
   infectés qui ne sont pas encore dans les compartiments R au temps T. On a ainsi
   \[R(\infty)\simeq R(T) \left (1+\frac{\lambda^2}{bc}+ \frac{\lambda }{b}+
   \frac{\lambda}{c}\right ) = R(T) \left (1+\frac{\lambda}{b} \right ) \left
   (1+\frac{\lambda}{c} \right )=\mathcal{R}_0 \, R(T) \, .\] Avec \(R_1(t)=f\,
   R(t)\,\), on obtient \[R_1(\infty)\simeq \mathcal{R}_0 \, R_1(T).\]

   Ainsi, si les contacts sont réduits à zéro à partir d'une certaine date
     * peu après le début de l'épidémie pour que l'approximation linéaire soit
       encore valable
     * assez grande pour que le système linéarisé ait eu le temps de converger vers
       le vecteur propre associé à la première valeur propre,

   alors la taille finale (confirmée ou totale) de l'épidémie est proche de celle
   que l'on obtient en multipliant le nombre cumulés de cas (confirmés ou au total)
   à cette date par la reproductivité de l'épidémie. Un résultat semblable s'obtient
   de la même manière pour un modèle S-I-R. En annexe, on remarque cependant que ce
   n'est plus la reproductivité qui détermine le quotient \(\,R(\infty)/R(T)\)  dans
   les modèles avec une période infectieuse qui n'est pas distribuée
   exponentiellement, mais une expression plus compliquée.

       Avec \(R_1(T)=5\,423\)  et  \(\mathcal{R}_0\simeq \mbox{2,33}\,\), cela
   donne  \(R(\infty)\simeq 12\, 600\). Soulignons encore une fois l'incertitude
   autour des paramètres b et c, qui se retrouve dans ce résultat.

       Il y a une analogie avec le concept de « potentiel d'accroissement » des
   populations en démographie [8, p. 176]. C'est le rapport entre la population
   finale stationnaire et la population à un certain instant si la fertilité est
   divisée subitement à cet instant par la reproductivité, de sorte que la
   population se retrouve avec un taux asymptotique de croissance nul. Comme dans
   notre calcul, Keyfitz a obtenu une formule relativement simple pour le «
   potentiel d'accroissement » en supposant que la population initiale est « stable
   » au sens de Lotka (c'est-à-dire donnée par le premier vecteur propre). Cette
   formule fait aussi intervenir la reproductivité, quoique de manière plus
   compliquée que pour notre modèle S-E-I-R [8, p. 179].

       Notons aussi que l'estimation de \(R(T)+E(T)+I(T)\)  à partir de la seule
   donnée \(R(T)\)   est analogue au problème qui s'était posé aux débuts de
   l'épidémie de VIH pour estimer le nombre de personnes séropositives à partir du
   nombre de cas déclarés de SIDA.

       La figure 2\(^a\,\) illustre ce modèle à deux phases. On a pris
   \(\,N=65\times 10^6\)  (la population de la France) et les conditions initiales
   \begin{equation}\tag{16} S(0)=N-1, \quad E(0)=1, \quad I(0)=0,\quad R(0)=0.
   \end{equation} Le paramètre  \(a\)  est donné par la formule (10) avec
   \(\lambda=\mbox{0,225}\,\) par jour, comme dans la figure 1. On dispose de peu
   d'information au sujet du paramètre f. On sait rétrospectivement qu'un grand
   nombre de décès dûs au virus dans les maisons de retraite n'étaient pas
   comptabilisés parmi les cas confirmés au début de l'épidémie. Choisissons par
   exemple f=0,5 pour l'illustration. On a pris  \(T=\mbox{43,2}\)  jours de sorte
   que  \(R_1(T) \simeq 5\,438\,\) soit proche de la donnée 5423 pour le 15 mars. En
   poursuivant la simulation un peu plus longtemps que dans la figure, on trouve
   bien numériquement que \(\,R_1(\infty)/R_1(T)\simeq \mbox{2,33} \simeq
   \mathcal{R}_0\).

   [Figure2a.png] [Figure2b.png]

   Figure 2. a) Exemple de simulation du modèle à deux phases. b) Le quotient
   \(\,R_1(\infty)/R_1(T)\)  en fonction de \(T\).

       La figure 2^b montre comment le quotient  \(R_1(\infty)/R_1(T)\,\) varie en
   fonction de l'instant T où le taux de contact est réduit à zéro. On observe
   effectivement un plateau où ce quotient est proche de \(\,\mathcal{R}_0\). Dans
   le cas \(\,T\to 0\,\), on a \(\,R_1(T)\to 0\)  et  \(R_1(\infty)\to f(E(0)+I(0))
   > 0\). On a donc \(R_1(\infty)/R_1(T) \to +\infty\). Le quotient se rapproche de
   \(\,\mathcal{R}_0\,\) si T est de l'ordre de l'inverse de la différence entre les
   deux valeurs propres de la matrice (7). Si au contraire \(\,T \to \infty\,\),
   alors l'intervention intervient trop tard. L'épidémie est déjà passée et
   \(R_1(\infty)/R_1(T)\to 1\). Avec \(\,N\to +\infty\,\), la largeur du plateau, où
    \(R_1(\infty)/R_1(T)\)  est proche de  \(\mathcal{R}_0\,\), croît probablement
   comme \((\ln N)/\lambda\), puisque tel est par exemple le comportement du temps
   jusqu'au pic épidémique dans un modèle SIR à coefficients constants (voir [2] ou
   [5, p. 12]).

3.   Généralisation

       Dans la réalité, le taux de contact effectif n'est sûrement pas tout à fait
   nul pour  \(t > T\). La valeur obtenue pour \(\,R(\infty)\,\) peut néanmoins être
   considérée comme une borne inférieure de la valeur réelle. Car il est certain que
   la taille finale de l'épidémie sera supérieure avec des contacts qui ne sont pas
   nuls qu'avec des contacts qui sont nuls. Rappelons à ce sujet que les modèles
   épidémiques de type S-I-R ou S-E-I-R avec un taux de contact variable ne sont pas
   « monotones », dans le sens qu'une réduction du taux de contact peut parfois
   conduire à une taille finale de l'épidémie plus grande [1].

       Considérons maintenant le cas où le taux de contact n'est pas réduit à 0 mais
   divisé par un nombre q (\(q > 1\)). La réduction à 0 correspond au cas limite où
   \(\,q \to +\infty\). On a pour \(\,t > T\), \begin{equation}\tag{17}
   \frac{dS}{dt} = -\frac{a}{q}\, S\, \frac{I}{N},\quad \frac{dE}{dt} =
   \frac{a}{q}\, S\, \frac{I}{N} - b\, E, \end{equation} tandis que les équations
   (3), (4) et (5) restent identiques. Par le même raisonnement que dans la section
   1, on a pour \(\,t > T\) \[\frac{1}{S} \frac{dS}{dt} = - \frac{a}{q\, c\, N}
   \frac{dR}{dt}.\] On en déduit, en intégrant entre t=T et t=+infty, \[\ln
   \frac{S(\infty)}{S(T)} = - \frac{\mathcal{R}_0}{q}\, \frac{R(\infty)-R(T)}{N}\,
   ,\] avec  \(\mathcal{R}_0=a/c > 1\)  et \(\,S(\infty)=N-R(\infty)\,\). On a donc
   \begin{equation}\tag{18} 1-\frac{R(\infty)}{N} = \frac{S(T)}{N} \exp \left (-
   \frac{\mathcal{R}_0}{q} \, \frac{R(\infty)-R(T)}{N}\right ). \end{equation} Comme
   dans la section 2, supposons que le temps T ne soit ni trop petit ni trop grand,
   c'est-à-dire dans le plateau de la figure 2\(^b\). En première approximation,
   \(\,S(T)\simeq N\)  et  \(R(T)\)  est petit par rapport à  \(N\). Deux cas se
   présentent alors.

       Dans le cas  \(1 < q < \mathcal{R}_0\,\), comme dans l'argument graphique
   classique [4], on trace les membres de gauche et de droite de l'équation (18) en
   fonction de \(R(\infty)/N\). On voit que la solution \(\,R(\infty)/N\,\) n'est
   pas infinitésimale mais proche de la solution strictement positive de l'équation
   \begin{equation}\tag{19} 1-\frac{R(\infty)}{N} \simeq \exp \left
   (-\frac{\mathcal{R}_0}{q} \, \frac{R(\infty)}{N}\right ). \end{equation}

       Si au contraire  \(q > \mathcal{R}_0\), alors la solution  \(R(\infty)/N\,\)
   de l'équation (18) est petite. Avec \[\,S(T)=N-E(T)-I(T)-R(T),\quad
   E(T)+I(T)+R(T)\simeq \mathcal{R}_0\, R(T),\] une approximation à l'ordre 1 de
   l'exponentielle dans l'équation (18) conduit à \[1-\frac{R(\infty)}{N} \simeq
   \left [1-\frac{\mathcal{R}_0\, R(T)}{N} \right ]\, \left [1-
   \frac{\mathcal{R}_0}{q} \frac{R(\infty)-R(T)}{N} \right ].\] En négligeant
   \(1/N^2\,\), on a \[1-\frac{R(\infty)}{N} \simeq 1-\frac{\mathcal{R}_0\, R(T)}{N}
   - \frac{\mathcal{R}_0}{q} \frac{R(\infty)-R(T)}{N} .\] Finalement,
   \begin{equation}\tag{20} R(\infty) \simeq R(T) \, \mathcal{R}_0\,
   \frac{1-1/q}{1-\mathcal{R}_0/q}\, . \end{equation} Avec  \(q\to +\infty\) on a
   \(R(\infty) \simeq R(T) \, \mathcal{R}_0\). On remarque aussi que
   \(\,(1-1/q)/(1-\mathcal{R}_0/q) > 1\), comme il se doit. Une formule identique à
   (20) lie \(\,R_1(\infty)\)  et  \(R_1(T)\).

       La figure 3 montre avec une ligne continue, en fonction du paramètre q, la
   taille finale de l'épidémie en échelle logarithmique. On a simulé numériquement
   le système (1)-(6) pour tT. Comme dans la figure 2\(^a\,\), la
   population totale est  \(N=65\times 10^6\)  et le paramètre \(a\)  est donné par
   la formule (10) avec  \(\lambda=\mbox{0,225}\,\) par jour. On a encore pris
   \(\,f=\mbox{0,5}\)  et  \(T=\mbox{43,2}\)  jours de sorte que  \(R_1(T) \simeq
   5\,438\). La figure montre aussi avec des petits ronds la valeur de la formule
   (20) pour \(\,q > \mathcal{R}_0\). Elle montre enfin avec de petits losanges la
   solution strictement positive de l'équation (19) pour \(\,q < \mathcal{R}_0\). On
   voit que les deux approximations cessent d'être valable au voisinage du seuil
   (\(q=\mathcal{R}_0\)).
   [Figure3.png] Figure 3. \(\ln(R(\infty)/N)\) en fonction de  \(q\)  (ligne
   continue), comparé avec la formule (20) (petits ronds) valable pour  \(q >
   \mathcal{R}_0\)  et avec la solution de l'équation (19) (petits losanges) valable
   pour \(q < \mathcal{R}_0\).

       On notera que la taille finale de l'épidémie varie de plusieurs ordres de
   grandeurs si \(\,q\simeq \mathcal{R}_0\). Comme il est difficile de le
   quantifier, la prédiction de la taille finale de l'épidémie est également
   difficile dans cette zone. Il n'y a que si le paramètre q est nettement supérieur
   à la reproductivité que la prévision avec la formule (20) devient moins sensible
   à la valeur de q.

4.   Estimation du paramètre q

       Essayons d'estimer le paramètre q en ajustant une simulation du modèle aux
   données postérieures au 15 mars, y compris celles jusqu'au 15 avril qui ne
   figuraient pas dans la figure 1. [10] avertit néanmoins que « le nombre de cas
   confirmés en France ne reflète plus de manière satisfaisante la dynamique de
   l'épidémie », étant donné que « les patients présentant des signes de COVID-19 ne
   sont plus systématiquement confirmés par un test biologique ».

       On part de la donnée  \(R_1(T)=5\,423\)  et des relations
   \[R(T)=R_1(T)/f,\quad R_2(T)=(1-f) R(T).\] Comme les données des 8 jours qui
   précèdent sont particulièrement bien alignées, on démarre la simulation de notre
   modèle avec \[\,R(T-\tau)=e^{-\lambda \tau} R(T)\] avec
   \(\lambda=\mbox{0,225}\)  par jour et  \(\tau=8\)  jours, et avec les estimations
   correspondantes \[I(T-\tau)\simeq \frac{\lambda}{c}\, R(T-\tau), \quad E(T-\tau)
   \simeq \left (\frac{\lambda^2}{bc}+ \frac{\lambda}{b} \right )R(T-\tau),\quad
   S(T-\tau)=N-E(T-\tau)-I(T-\tau)-R(T-\tau).\]

       Le taux de contact effectif est  \(a/q\)  si  \(t > T\,\). On essaie
   d'ajuster le nombre de cas confirmés aux données jusqu'au 15 avril. Le meilleur
   ajustement donne \(\,q=\mbox{1,7}\). Cette valeur est inférieure au seuil
   \(\,\mathcal{R}_0\,\). Il semblerait que les mesures de confinement soient encore
   insuffisantes. Mais les tous derniers points de la figure montrent que l'écart
   avec le modèle grandit dans le sens d'un ralentissement de l'épidémie réelle. Il
   se peut que la valeur de f choisie ne soit pas appropriée ou qu'elle ait varié au
   cours de l'épidémie. Ou alors le modèle est peut-être un peu trop simpliste. On
   s'attend notamment à ce qu'une distribution non exponentielle des temps passés
   dans les différents compartiments influence le moment où la courbe commence à
   s'infléchir.
   [Figure4.png] Figure 4. Logarithme népérien du nombre de cas confirmés entre le 7
   mars et le 15 avril (petits ronds, données de  Santé publique France  [11]) et
   \(\ln(R_1(t))\)  en fonction du temps  \(t\)  dans 4 simulations avec de haut en
   bas  \(q\in \{\mbox{1,5} ;\, \mbox{1,7} ;\, 2 ;\, \mbox{2,5} \}\).

       En conclusion, on a exploré un scénario à deux phases où le taux de contact
   est réduit à partir d'un certaine date. On a trouvé une formule approchée simple
   pour la taille finale de l'épidémie en fonction du nombre de cas détectés au
   moment de la réduction. Il reste néanmoins à énoncer et à démontrer plus
   rigoureusement ce résultat, probablement en le faisant apparaître comme un
   résultat asymptotique lorsque \(\,N\to +\infty\).

    Remerciements

       On remercie Hisashi Inaba, Ali Moussaoui et Frédéric Hamelin pour leurs
   commentaires sur le manuscrit.

Annexe

   Considérons un modèle S-I-R avec une période infectieuse qui n'est pas
   nécessairement distribuée exponentiellement, avec les notations
     * \(I(t,x)\) : la densité de personnes infectées depuis x unités de temps au
       temps t
     * \(a(x)\) : le taux de contact effectif ;
     * \(b(x)\) : le taux auquel les personnes infectées cessent de transmettre
       l'infection.

   On a au début de l'épidémie \begin{eqnarray*} I(t,0)&\simeq& \int_0^\infty a(x)\,
   I(t,x)\, dx\\ \frac{\partial I}{\partial t}+\frac{\partial I}{\partial
   x}&=&-b(x)\, I(t,x)\\ \frac{dR}{dt}&=&\int_0^\infty b(x)\, I(t,x)\, dx
   \end{eqnarray*} On en déduit, comme dans la théorie des populations stables de
   Lotka [6] que \[I(t,x)\simeq k\, e^{\lambda t} \, e^{-\lambda x - \int_0^x b(y)\,
   dy} .\] k est une constante. Le taux de croissance l est l'unique solution de
   l'équation \[1=\int_0^\infty a(x) e^{-\lambda x - \int_0^x b(y)\, dy}\, dx.\]
   Avec \(I(t)=\int_0^\infty I(t,x)\, dx\,\), le problème est d'estimer
   \(I(T)+R(T)\)  à partir de  \(R(T)\). Mais \[ \lambda R(T) \simeq
   \frac{dR}{dt}(T)=\int_0^\infty b(x)\, I(T,x)\, dx\simeq \int_0^\infty b(x)\, k\,
   e^{\lambda T}\ e^{-\lambda x - \int_0^x b(y)\, dy}\, dx.\] On en déduit que
   \[k\simeq \frac{\lambda R(T) e^{-\lambda T}}{\int_0^\infty b(x)\, e^{-\lambda x -
   \int_0^x b(y)\, dy}\, dx}.\] Finalement, \[ \frac{I(T)+R(T)}{R(T)} \simeq
   \frac{\lambda \int_0^\infty e^{-\lambda x - \int_0^x b(y)\, dy}}{\int_0^\infty
   b(x)\, e^{-\lambda x - \int_0^x b(y)\, dy}}+1.\] On voit que ce résultat n'a pas
   de raison particulière de coïncider avec la formule suivante
   \[\mathcal{R}_0=\int_0^\infty a(x)\, e^{- \int_0^x b(y)\, dy}\, dx.\] Dans le cas
   spécial où les taux sont constants, avec \(a(x)\equiv a\) et \(b(x)\equiv b\,\),
   on a cependant \(\lambda=a-b\)  et donc \[\frac{I(T)+R(T)}{R(T)} \simeq
   \frac{\lambda}{b}+1=\frac{a}{b}=\mathcal{R}_0.\]

    Références bibliographiques

    1. Bacaër N., Gomes M.G.M. (2009) Sur la taille finale des épidémies avec
       saisonnalité. Bull. Math. Biol. 71:1954-1966.
       [3]https://hal.archives-ouvertes.fr/hal-01299608
    2. Bacaër N. (2020) Sur le pic épidémique dans un modèle S-I-R, Quadrature
       117:1-4. [4]https://hal.archives-ouvertes.fr/hal-02518993
    3. Corlosquet-Habart M., Janssen J., Manca R. (2012) Modélisation stochastique
       du risque de pandémie : stratégies de couverture et d'assurance. Lavoisier,
       Cachan.
    4. Hillion A. (1986) Les Théories mathématiques des populations. Presses
       Universitaires de France, Paris.
    5. Lauwerier H.A. (1984) Mathematical Models of Epidemics. Mathematisch Centrum,
       Amsterdam.
    6. Lotka A.J. (1939) Théorie analytique des associations biologiques, 2e partie.
       Hermann, Paris.
    7. Nkague Nkamba L. (2012) Robustesse des seuils en épidémiologie et stabilité
       asymptotique d'un modèle à infectivité et susceptibilité différentielle.
       Thèse, Université de Lorraine et Université Gaston Berger.
    8. Pressat R. (1995) Éléments de démographie mathématique. AIDELF, Paris.
    9. Sansonetti Ph. (2020) Covid-19 ou la chronique d'une émergence annoncée.
       Exposé, Collège de France, 18 mars 2020.
   10. Santé publique France (2020) Covid-19, point épidémiologique hebdomadaire du
       09 avril 2020. [5]www.santepubliquefrance.fr
   11. [6]https://fr.wikipedia.org/wiki/Pand%C3%A9mie_de_Covid-19_en_France

References

   1. https://doi.org/10.1051/mmnp/2020015
   2. https://hal.archives-ouvertes.fr/hal-02509142
   3. https://hal.archives-ouvertes.fr/hal-01299608
   4. https://hal.archives-ouvertes.fr/hal-02518993
   5. https://www.santepubliquefrance.fr/
   6. https://fr.wikipedia.org/wiki/Pand%C3%A9mie_de_Covid-19_en_France


Usage: http://www.kk-software.de/kklynxview/get/URL
e.g. http://www.kk-software.de/kklynxview/get/http://www.kk-software.de
Errormessages are in German, sorry ;-)