Covid-19 programme modélisation
Répondre à la discussion
Page 1 sur 2 1 DernièreDernière
Affichage des résultats 1 à 30 sur 31

Covid-19 programme modélisation



  1. #1
    Miloslav Bilik

    Covid-19 programme modélisation


    ------

    Bonjour,

    Je cherche à comprendre les raisons d'un rebond des décès en France débutant vers le 20 juillet, et s'atténuant légèrement depuis deux semaines, et franchement cette semaine-ci.

    Un ajustement exponentiel se fait avec un r2 de 0.92, mais un arc de parabole mieux encore (0.96)..

    J'essaie sans succès de trouver des sources d'un programme de modélisation épidémiologique du type EIRS ou plus complexe, comme ce rebond est bien plus tardif que le déconfinement, est sa hausse nettement moins forte que celle vue en mars.

    Sincèrement, je ne me pense pas capable d'écrire un programme correct, surtout quand je lis que le gouvernement avait prévu 500,000 morts en utiisant un programme de 150,000 lignes écrit en dix ans, et réputé buggé..

    Et avoir les sources me permettrait d'essayer d'ajuster au mieux la dizaine de paramètres (e gros) minimisant les écarts avec les données recueillies (site ECDC).

    Si quelqu'un pouvait m'aider, je lui en serais profondément reconnaissant.

    Merci de votre patience, et bien amicalement,

    Milos

    -----

  2. #2
    yves95210

    Re : Covid-19 programme modélisation

    Bonjour,

    Si tu regardes l'évolution du nombre quotidien d'admissions à l'hôpital, il n'y a effectivement pas eu d'effet immédiat du déconfinement; ce nombre a continué de baisser jusqu'à la mi-juin au même rythme d'environ -5,4% par jour. Ce n'est que vers la mi-juin(1) que cette baisse est devenue moins sensible (environ -1,2% par jour).
    Le nombre d'admissions est reparti à la hausse un peu avant la mi-juillet(2), d'abord lentement (environ +2% par jour), puis plus rapidement après le 20 août(3) (environ +4,6% par jour). Cette hausse s'est interrompue brutalement après la mi-septembre(4).
    Ce n'est donc pas étonnant que tu n'arrives pas à trouver un bon "fit" avec une exponentielle sur toute la période dont tu parles...

    Compte-tenu du délai moyen entre l'infection et l'hospitalisation d'un patient (11 ou 12 jours), ces dates correspondent respectivement :
    (1) à l'assouplissement des mesures post-confinement, début juin.
    On peut supposer que jusque-là ces mesures étaient assez strictes - et strictement appliquées - pour que la baisse du nombre de cas constatée durant le confinement se poursuive. Beaucoup de gens n'avaient pas repris le travail sur site (étaient soit en télétravail soit au chômage), les établissements scolaires n'avaient que partiellement rouvert, les bars et restaurants n'avaient pas rouvert dans les régions "rouges", les déplacements n'étaient autorisés que dans la limite de 100km, évitant le brassage de population entre régions plus et moins touchées par l'épidémie, etc. Et de manière générale, le climat d'inquiétude que cela créait rendait sans-doute les gens plus prudents...
    (2) au début des vacances scolaires et des migrations estivales.
    (4) à la rentrée scolaire.

    Pour le (3) il faut regarder l'évolution du nombre d'hospitalisations par tranche d'âge : entre fin mai et (environ) le 20 août, le pourcentage d'admissions de patients de plus de 70 ans est tombé progressivement de 65% à 40%, conduisant à une croissance moins rapide du nombre d'hospitalisations (puis de décès) que celle du nombre d'infections. Depuis il n'a cessé d'augmenter, pour dépasser à nouveau les 50% fin septembre.
    Autrement dit, il y a eu un décalage de plusieurs semaines entre la reprise de l'épidémie dans la partie la plus jeune de la population et dans la partie la plus âgée (dans laquelle le pourcentage de décès est beaucoup plus élevé). Mais le rebond du nombre de décès dont tu parles n'est sensible qu'à partir de la mi-août, du moins si on se réfère aux données des hôpitaux (attention aux chiffres publiés sur différents sites, qui donnent lieu parfois à des rattrapages - comme on l'a vu par exemple lorsque les décès en Ehpad attribués au Covid en mars ont été ajoutés au nombre de décès début avril).

    Si tu veux reproduire cette évolution à l'aide d'un modèle, d'une part il faut tenir compte des interventions assouplissant ou renforçant les mesures visant à freiner l'épidémie, et des événements modifiant globalement le comportement social de la population (aspects saisonniers, vacances, rentrée).
    D'autre part il faut que le modèle soit compartimenté (au moins) par tranche d'âge, avec des taux de transmission distincts à l'intérieur de chaque compartiment et entre chaque paire de compartiments.
    D'autre part, pour "prédire" le nombre de décès à partir du modèle, il faut tenir compte du taux de létalité par tranche d'âge et de son évolution : par rapport à la période mars-juin, depuis juillet le pourcentage de décès parmi les patients hospitalisés a pratiquement été divisé par deux, sans-doute grâce aux progrès réalisés dans la prise en charge des cas graves.

    Mais je pense que tu vas avoir du mal à trouver un programme de modélisation libre d'accès et qui gère tous ces paramètres.

  3. #3
    yves95210

    Re : Covid-19 programme modélisation

    PS : ci-dessous un graphique basé sur les données des hôpitaux du 19 mars au 5 octobre (avec en tirets une courbe de tendance du nombre d'admissions, exponentielle par morceaux comme indiqués dans le message précédent - donc représentée par des segments de droite, l'échelle étant logarithmique). En particulier tu verras que le rebond du nombre de décès ne se produit qu'à partir (environ) du 10 août, et non du 20 juillet.

    Nom : graphique_donnees_hopitaux_mars-septembre.JPG
Affichages : 405
Taille : 73,2 Ko

  4. #4
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Citation Envoyé par yves95210 Voir le message
    PS : ci-dessous un graphique basé sur les données des hôpitaux du 19 mars au 5 octobre (avec en tirets une courbe de tendance du nombre d'admissions, exponentielle par morceaux comme indiqués dans le message précédent - donc représentée par des segments de droite, l'échelle étant logarithmique). En particulier tu verras que le rebond du nombre de décès ne se produit qu'à partir (environ) du 10 août, et non du 20 juillet.

    Pièce jointe 422021
    Bonjour,

    Je comprends bien que tu utilises les moyennes lissées et moi aussi, puisque les remontées se font moins les samedi et dimanche, de façon significative au moins relativement aux vendredi.

    La différence pour la létalité, je suppose, tient aux remontées par lots d'établissement n'ayant pas communiqué leurs données pendant longtemps.

    En tout cas, le graphe que j'obtiens montre nettement une montée de la létalité aux alentours du 20 juillet. Ca n'est pas ma source principale, mais même les valeurs obtenues avec ECDC me laissent perplexes en comparaison et sans corriger les absences de remontée évoquées pour des établissements.

    Merci beaucoup pour ta réponse. Si ça ne t'ennuie pas, j'aimerais bien sûr des précisions sur ces chiffres..

    Amicalement, Milos

    Merci pour ta réponse. Je serais content si tu pouvais me faire savoir d'où proviennent ces données, et les ajustements effectués.

  5. A voir en vidéo sur Futura
  6. #5
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Bonjour,

    Si tu regardes l'évolution du nombre quotidien d'admissions à l'hôpital, il n'y a effectivement pas eu d'effet immédiat du déconfinement; ce nombre a continué de baisser jusqu'à la mi-juin au même rythme d'environ -5,4% par jour. Ce n'est que vers la mi-juin(1) que cette baisse est devenue moins sensible (environ -1,2% par jour).
    Le nombre d'admissions est reparti à la hausse un peu avant la mi-juillet(2), d'abord lentement (environ +2% par jour), puis plus rapidement après le 20 août(3) (environ +4,6% par jour). Cette hausse s'est interrompue brutalement après la mi-septembre(4).
    Ce n'est donc pas étonnant que tu n'arrives pas à trouver un bon "fit" avec une exponentielle sur toute la période dont tu parles...

    Compte-tenu du délai moyen entre l'infection et l'hospitalisation d'un patient (11 ou 12 jours), ces dates correspondent respectivement :
    (1) à l'assouplissement des mesures post-confinement, début juin.
    On peut supposer que jusque-là ces mesures étaient assez strictes - et strictement appliquées - pour que la baisse du nombre de cas constatée durant le confinement se poursuive. Beaucoup de gens n'avaient pas repris le travail sur site (étaient soit en télétravail soit au chômage), les établissements scolaires n'avaient que partiellement rouvert, les bars et restaurants n'avaient pas rouvert dans les régions "rouges", les déplacements n'étaient autorisés que dans la limite de 100km, évitant le brassage de population entre régions plus et moins touchées par l'épidémie, etc. Et de manière générale, le climat d'inquiétude que cela créait rendait sans-doute les gens plus prudents...
    (2) au début des vacances scolaires et des migrations estivales.
    (4) à la rentrée scolaire.

    Pour le (3) il faut regarder l'évolution du nombre d'hospitalisations par tranche d'âge : entre fin mai et (environ) le 20 août, le pourcentage d'admissions de patients de plus de 70 ans est tombé progressivement de 65% à 40%, conduisant à une croissance moins rapide du nombre d'hospitalisations (puis de décès) que celle du nombre d'infections. Depuis il n'a cessé d'augmenter, pour dépasser à nouveau les 50% fin septembre.
    Autrement dit, il y a eu un décalage de plusieurs semaines entre la reprise de l'épidémie dans la partie la plus jeune de la population et dans la partie la plus âgée (dans laquelle le pourcentage de décès est beaucoup plus élevé). Mais le rebond du nombre de décès dont tu parles n'est sensible qu'à partir de la mi-août, du moins si on se réfère aux données des hôpitaux (attention aux chiffres publiés sur différents sites, qui donnent lieu parfois à des rattrapages - comme on l'a vu par exemple lorsque les décès en Ehpad attribués au Covid en mars ont été ajoutés au nombre de décès début avril).

    Si tu veux reproduire cette évolution à l'aide d'un modèle, d'une part il faut tenir compte des interventions assouplissant ou renforçant les mesures visant à freiner l'épidémie, et des événements modifiant globalement le comportement social de la population (aspects saisonniers, vacances, rentrée).
    D'autre part il faut que le modèle soit compartimenté (au moins) par tranche d'âge, avec des taux de transmission distincts à l'intérieur de chaque compartiment et entre chaque paire de compartiments.
    D'autre part, pour "prédire" le nombre de décès à partir du modèle, il faut tenir compte du taux de létalité par tranche d'âge et de son évolution : par rapport à la période mars-juin, depuis juillet le pourcentage de décès parmi les patients hospitalisés a pratiquement été divisé par deux, sans-doute grâce aux progrès réalisés dans la prise en charge des cas graves.

    Mais je pense que tu vas avoir du mal à trouver un programme de modélisation libre d'accès et qui gère tous ces paramètres.[/QUOTE]
    Bonjour,

    Je te remercie beaucoup pour ta réponse, qui ne m'a pas été suivie curieusement par le forum à mon adresse.

    Les données que j'ai montrent que compte tenu du nombre de tests effectués, leur positivité va croissant également.
    L'ajustement est correct mais plus depuis quelques semaines.

    Au demeurant, ça n'a pas vraiment d'importance, puisque un ajustement polynomial du second ordre était encore meilleur, mais ne me semble correspondre à rien au plan théorique..

    Tout ce que j'ai trouvé pour l'instant est quelques lignes de Maple (très condensées, qui "déroulées" pourraient faire une page), avec des paramètres fixés arbitrairement, sans doute parce que le but cherché n'était que de montrer deux courbes évolutives.

    A vrai dire Maple n'est pas ma tasse de thé; quand j'essaye d'importer deux vecteurs depuis un fichier Excel, et que j'effectue ensuite un NonLinearFit, Maple me renvoie tout simplement les données entrées dans la question, comme s'il ne pouvait répondre.
    C'est bien dommage comme il n'y a que 70 ou 80 points..

    Mais à l'inverse, si j'essaie d'écrire en Pascal ou C l'équivalent de ce ne serait qu'une ligne Maple, je ne suis pas rendu..

    Je te remercie beaucoup pour ta réponse.
    Si tu maîtrisais Maple, ou encore disposais de bibliothèques mathématiques pouvant émuler les instructions, je te serais très reconnaissant puisque ça m'éviterait des bugs..

    Bien amicalement, Milos

  7. #6
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Citation Envoyé par yves95210 Voir le message
    Bonjour,

    Si tu regardes l'évolution du nombre quotidien d'admissions à l'hôpital, il n'y a effectivement pas eu d'effet immédiat du déconfinement; ce nombre a continué de baisser jusqu'à la mi-juin au même rythme d'environ -5,4% par jour. Ce n'est que vers la mi-juin(1) que cette baisse est devenue moins sensible (environ -1,2% par jour).
    Le nombre d'admissions est reparti à la hausse un peu avant la mi-juillet(2), d'abord lentement (environ +2% par jour), puis plus rapidement après le 20 août(3) (environ +4,6% par jour). Cette hausse s'est interrompue brutalement après la mi-septembre(4).
    Ce n'est donc pas étonnant que tu n'arrives pas à trouver un bon "fit" avec une exponentielle sur toute la période dont tu parles...

    Compte-tenu du délai moyen entre l'infection et l'hospitalisation d'un patient (11 ou 12 jours), ces dates correspondent respectivement :
    (1) à l'assouplissement des mesures post-confinement, début juin.
    On peut supposer que jusque-là ces mesures étaient assez strictes - et strictement appliquées - pour que la baisse du nombre de cas constatée durant le confinement se poursuive. Beaucoup de gens n'avaient pas repris le travail sur site (étaient soit en télétravail soit au chômage), les établissements scolaires n'avaient que partiellement rouvert, les bars et restaurants n'avaient pas rouvert dans les régions "rouges", les déplacements n'étaient autorisés que dans la limite de 100km, évitant le brassage de population entre régions plus et moins touchées par l'épidémie, etc. Et de manière générale, le climat d'inquiétude que cela créait rendait sans-doute les gens plus prudents...
    (2) au début des vacances scolaires et des migrations estivales.
    (4) à la rentrée scolaire.

    Pour le (3) il faut regarder l'évolution du nombre d'hospitalisations par tranche d'âge : entre fin mai et (environ) le 20 août, le pourcentage d'admissions de patients de plus de 70 ans est tombé progressivement de 65% à 40%, conduisant à une croissance moins rapide du nombre d'hospitalisations (puis de décès) que celle du nombre d'infections. Depuis il n'a cessé d'augmenter, pour dépasser à nouveau les 50% fin septembre.
    Autrement dit, il y a eu un décalage de plusieurs semaines entre la reprise de l'épidémie dans la partie la plus jeune de la population et dans la partie la plus âgée (dans laquelle le pourcentage de décès est beaucoup plus élevé). Mais le rebond du nombre de décès dont tu parles n'est sensible qu'à partir de la mi-août, du moins si on se réfère aux données des hôpitaux (attention aux chiffres publiés sur différents sites, qui donnent lieu parfois à des rattrapages - comme on l'a vu par exemple lorsque les décès en Ehpad attribués au Covid en mars ont été ajoutés au nombre de décès début avril).

    Si tu veux reproduire cette évolution à l'aide d'un modèle, d'une part il faut tenir compte des interventions assouplissant ou renforçant les mesures visant à freiner l'épidémie, et des événements modifiant globalement le comportement social de la population (aspects saisonniers, vacances, rentrée).
    D'autre part il faut que le modèle soit compartimenté (au moins) par tranche d'âge, avec des taux de transmission distincts à l'intérieur de chaque compartiment et entre chaque paire de compartiments.
    D'autre part, pour "prédire" le nombre de décès à partir du modèle, il faut tenir compte du taux de létalité par tranche d'âge et de son évolution : par rapport à la période mars-juin, depuis juillet le pourcentage de décès parmi les patients hospitalisés a pratiquement été divisé par deux, sans-doute grâce aux progrès réalisés dans la prise en charge des cas graves.

    Mais je pense que tu vas avoir du mal à trouver un programme de modélisation libre d'accès et qui gère tous ces paramètres.
    Bonjour,

    Je te remercie beaucoup pour ta réponse, qui ne m'a pas été suivie curieusement par le forum à mon adresse.

    Les données que j'ai montrent que compte tenu du nombre de tests effectués, leur positivité va croissant également.
    L'ajustement est correct mais plus depuis quelques semaines.

    Au demeurant, ça n'a pas vraiment d'importance, puisque un ajustement polynomial du second ordre était encore meilleur, mais ne me semble correspondre à rien au plan théorique..

    Tout ce que j'ai trouvé pour l'instant est quelques lignes de Maple (très condensées, qui "déroulées" pourraient faire une page), avec des paramètres fixés arbitrairement, sans doute parce que le but cherché n'était que de montrer deux courbes évolutives.

    A vrai dire Maple n'est pas ma tasse de thé; quand j'essaye d'importer deux vecteurs depuis un fichier Excel, et que j'effectue ensuite un NonLinearFit, Maple me renvoie tout simplement les données entrées dans la question, comme s'il ne pouvait répondre.
    C'est bien dommage comme il n'y a que 70 ou 80 points..

    Mais à l'inverse, si j'essaie d'écrire en Pascal ou C l'équivalent de ce ne serait qu'une ligne Maple, je ne suis pas rendu..

    Je te remercie beaucoup pour ta réponse.
    Si tu maîtrisais Maple, ou encore disposais de bibliothèques mathématiques pouvant émuler les instructions, je te serais très reconnaissant puisque ça m'éviterait des bugs..

    Bien amicalement, Milos

  8. #7
    yves95210

    Re : Covid-19 programme modélisation

    Citation Envoyé par Miloslav Bilik Voir le message
    Merci pour ta réponse. Je serais content si tu pouvais me faire savoir d'où proviennent ces données, et les ajustements effectués.
    Revoici le lien vers les données , qui figurait déjà dans le message précédent (en bleu comme toujours sur le forum Futura quand on utilise la balise appropriée).

    Les données des hôpitaux sont mises à disposition quotidiennement sur ce site (plusieurs fichiers, l'un donnant les nombres quotidiens d'admissions à l'hôpital, d'admissions en réa, de décès et de retour à domicile par département, l'autre avec les nombres de patients hospitalisés, en réa, et les cumul des décès et des retours à domicile par région).

    Pour le graphique ci-dessus c'est le premier de ces fichiers que j'ai utilisé (donnees-hospitalieres-nouveaux-covid19-AAAA-MM-JJ-19h00.csv, où AAAA-MM-JJ est la date de la dernière mise à jour; le fichier contient toutes les données quotidiennes depuis le 19 mars).
    Les incidences (nouvelles hospitalisations et admissions en réa, décès, retours à domicile) sont enregistrées à la date de déclaration par les hôpitaux et non à la date de l'événement, d'où des retards les week-ends et jours fériés, en général rattrapés dans les deux jours qui suivent, ce qui rend préférable de faire une moyenne glissante sur 7 jours (c'est le seul "ajustement" que je fais).

    J'utilise aussi le fichier par région et par classe d'âge (donnees-hospitalieres-classe-age-covid19-AAAA-MM-JJ-19h00.csv), en faisant la différence entre la somme des nombres de patients hospitalisés et déjà sortis (décès et retours à domicile) du jour J et celle du jour J-1 pour obtenir le nombre d'admissions à l'hôpital le jour J.
    En utilisant les pourcentages hospitalisés/infectés par tranche d'âge estimés dans cette publication (plus précisément, dans l'annexe https://science.sciencemag.org/conte...je_SM_rev2.pdf) ça permet d'estimer le nombre quotidien d'infections (en moyenne 12 jour avant la date où l'admission à l'hôpital est déclarée).
    J'ai posté à plusieurs reprises des graphiques obtenus par cette méthode dans d'autres discussions sur le forum. Je commence là aussi par faire la moyenne glissante sur 7 jours des nombres de nouvelles admissions de chaque tranche d'âge, que je divise ensuite par le pourcentage ci-dessus pour obtenir le nombre de personnes infectées. Pour la date de l'infection, j'utilise une loi normale centrée sur J-12 (J étant la date de l'admission à l'hôpital) avec un écart-type de 1,5 jours.

    Tout ça avec un bête tableur (Open Office, Libre Office, Excel...), donc sans programmation (même pas de macros). Et je ne cherche pas à faire de la modélisation, juste à suivre ce qui se passe. Avec autant de retard (voire un peu plus) que les indicateurs publiés par les autorités de santé, mais à partir de données plus fiables que les taux d'incidence hebdomadaire calculés à partir des tests PCR+, dont le nombre (et le taux de positivité) dépend beaucoup de la politique de test et du profil des patients testés, pas constants dans le temps ni d'une région à l'autre).
    Dernière modification par yves95210 ; 17/10/2020 à 19h58.

  9. #8
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Bonjour,

    Et merci de votre réponse. J'avais déjà vu cette source, mais à vrai dire je suis nul pour utiliser Excel ou autres, j'ai passé une journée à écrire un programme recopiant le fichier Excel pour me débarasser des départements et garder une date unique, avant un bug du compilateur qui m'a fait perdre quelques pages de code.
    Auriez-vous l'obligeance de me dire comment se débarrasser de la première colonne pour totaliser les valeurs dans les colonnes suivantes ? C'est certainement élémentaire pour vous, mais ça me permettrait immédiatement de voir ce que deviennent les dates de début de la reprise des cas, hospitalisations, réa, décès, rtour à domicile.
    Jusqu'ici, j'avais une bonne concordance avec les données issues de ECDC et celles d'une personne s'étant donné le mal de rectifier les remontées par lots d'établissements hospitalisations, en répartissant ces données au prorata des malades sur la période sans remontée des données.

    J'espère ne pas abuser de votre temps avec cette question qui est certainement élémentaire pour vous, et vous remercie de votre patience.

    Cordialement, Milos

  10. #9
    yves95210

    Re : Covid-19 programme modélisation

    Citation Envoyé par Miloslav Bilik Voir le message
    Auriez-vous l'obligeance de me dire comment se débarrasser de la première colonne pour totaliser les valeurs dans les colonnes suivantes ?
    à l'aide de la fonction SOMME.SI du tableur.

  11. #10
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Merci beaucoup.

  12. #11
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Excusez-moi, mais je ne trouve pas comment utiliser SOMME.SI malgré différents essais, avec des range variés.
    Pourriez vous me donner un exemple ?
    Merci à vous

  13. #12
    yves95210

    Re : Covid-19 programme modélisation

    Un exemple basé sur le fichier donnees-hospitalieres-nouveaux-covid19-2020-10-18-19h00.csv, permettant de calculer les nombres totaux d'admissions à l'hôpital d'admissions en réa, de décès et de retours à domicile en France par jour :
    dans la ligne 2 d'une nouvelle colonne, copier la formule
    Code:
    =SOMME.SI($B$2:$B$64000; $B2; C$2:C$64000)
    où B est la colonne contenant la date et C la colonne contenant le nombre d'admissions à l'hôpital, 2 la ligne contenant la première date (pour le département 1). Les colonnes D, E, F contiennent les autres nombres dont on veut faire les totaux journaliers.

    Pour obtenir le nombre d'hospitalisations pour toutes les dates contenues dans le fichier, sélectionner la cellule contenant cette formule, placer le curseur sur le petit carré qui apparaît en bas à droite de la cellule, maintenir enfoncé le bouton clic et tirer la sélection vers le bas jusqu'à la ligne contenant la dernière date. Cela a pour effet de faire un copié-collé de la formule dans toutes les cellules ainsi sélectionnées.

    Pour obtenir les autres totaux journaliers, sélectionner la cellule contenant la formule, puis même manip mais vers la droite.

    Les caractères $ devant les identifiants de colonne ou de ligne ont pour effet de ne pas modifier ces identifiants quand on fait un copié-collé dans une autre cellule.

    Même chose avec SOMME.SI.ENS qui permet de faire la somme d'une plage filtrée suivant plusieurs conditions. Attention, l'ordre des paramètres n'est pas le même, c'est le premier qui contient la plage à sommer, et les suivants les plages devant correspondre aux conditions choisies.
    Par exemple, pour limiter la somme à la France métropolitaine (enfin, pas tout à fait, car les codes des départements corses ne sont pas numériques)
    Code:
    =SOMME.SI.ENS(C$2:C$64000; $B$2:$B$64000; $B2; $A$2:$A$64000; "<96")
    puis mêmes manips avec la souris que ci-dessus.

  14. #13
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Merci beaucoup, c'est très gentil à vous. Je vais pouvoir comparer la date à laquelle le rebond apparaît..
    Cordialement, Milos

  15. #14
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    C'est fait mais bien sûr j'ai des répétitions de dates. Je l'ai peut être déjà dit mais j'ai perdu une journée suite à un plantage, un programme Delphi qui lit le fichier d'origine, et devra sortir les totaux avec une date unique.
    Je vais continuer à le faire, l'avantage, outre de ne pas se reporter à la confiance éventuelle envers les formules d'Excel, est que la taille du fichier d'entrée importe peu pourvu qu'elle tienbugsne en mémoire.
    Si vous voulez, je vous enverrai ce programme ainsi que la source pour permettre de voir d'eventuels bugs.
    Cordialement, Milos

  16. #15
    yves95210

    Re : Covid-19 programme modélisation

    Citation Envoyé par Miloslav Bilik Voir le message
    C'est fait mais bien sûr j'ai des répétitions de dates.
    Dans l'exemple basique que j'ai donné, j'aurais peut-être dû préciser qu'il ne faut recopier la formule que jusqu'à la ligne 215 (celle qui contient les données du 18/10 pour le département 1). En procédant ainsi, il n'y a aucune raison qu'il ait des répétitions de dates.

    Ou, plus propre, faire un nouveau tableau (de préférence dans une autre feuille du classeur), avec une ligne unique par date (et la date en première colonne, au même format que dans le tableau d'origine histoire de simplifier les choses(*)), puis remplacer dans la formule l'identifiant de la cellule contenant la date "critère de sélection" dans le tableau d'origine par l'identifiant de la cellule contenant cette date dans le nouveau tableau.

    (*) Si tu préfères utiliser un format de date standard du tableur (alors que dans le fichier csv elle est dans un format qui n'est pas reconnu comme date lorsque tu l'ouvres dans ton tableur), la fonction TEXTE permet de convertir "ta" date dans le format de la plage date du tableau importé avec laquelle tu veux la comparer.
    Par exemple, si ton nouveau tableau est dans une autre feuille du classeur avec la date en colonne A, et que les données que tu as importées sont dans une feuille nommée "donnees", la formule devient
    Code:
    =SOMME.SI(donnees.$B$2:$B$64000; TEXTE($A2;"aaaa-mm-jj"); donnees.C$2:C$64000)

    Citation Envoyé par Miloslav Bilik
    l'avantage, outre de ne pas se reporter à la confiance éventuelle envers les formules d'Excel,
    Envers les formules Excel ou envers l'utilisation que tu en fais ?

    Parce que depuis que Excel (et ses équivalents libres) existe, ça se saurait si ses fonctions (surtout les plus anciennes) étaient boguées.
    Et pour faire ce genre de chose, autant passer 5 minutes sur un tableur plutôt que des heures à programmer et déboguer (Parole d'informaticien ayant fait du développement pendant de nombreuses années...)
    Après si ça t'amuse de programmer ou si tu veux faire des choses plus compliquées, la prise en main des macros Excel (ou Open Office ou Libre Office...) est assez élémentaire.
    Dernière modification par yves95210 ; 19/10/2020 à 16h09.

  17. #16
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Bonjour et merci encore,

    Je peux naturellement faire bien plus d'erreurs de programmation, et de très loin, que Excel n'en contient ou n'en a jamais contenu..

    Par contre, si les résultats sont les mêmes ça serait plus que rassurant.

    Je suis en train de finaliser les sources. L'avantage est qu'une fois fait, il peut y avoir un nombre quelconque de lignes, et comme je ne comprends rien à cette fonction utilisée.. Ça ne m'était pas venu à l'idée, forcément, de ne recopier la formule que jusqu'à la ligne x.
    Je n'en suis plus très loin, je mets en ce moment les conditions d'arrêt (fin de fichier ou/et date différente).

    Bref, je suis allé plus vite que je ne l'aurais cru, je regrette seulement de n'avoir pas écrit en C comme j'ai à répétition des tot_rad = tot_rad + rad, etc..

    Amicalement, Milos

  18. #17
    Nicophil

    Re : Covid-19 programme modélisation

    Salut,

    Est-ce que vous validez ceci ?
    https://twitter.com/gforestier/statu...41632856150016
    21.5% du total de tous les cas confirmés depuis 22 semaines (mi-mai) ont été remontés cette semaine
    =
    Plus d'1 personne sur 5 confirmée covid depuis mi-mai l'a été cette semaine.
    La réalité, c'est ce qui reste quand on cesse de croire à la matrice logicielle.

  19. #18
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Franchement, ça me paraît totalement aberrant puisqu'on verrait un pic très brutal lors de la remontée des dernières données, et ce b'est pas le cas. Je peux vérifier si vous voulez mais c'est peine perdue.

  20. #19
    yves95210

    Re : Covid-19 programme modélisation

    Salut Nicophil,

    je n'ai pas regardé les données SIDEP dans le détail.
    Mais c'est plausible compte-tenu de la progression quasi-exponentielle du nombre d'admissions à l'hôpital depuis début août, dont la croissance moyenne est de +3,5% par jour : du 18/5 au 18/10 (semaines 21 à 42 inclues) il y a eu environ 39000 admissions, dont 7200 (un peu moins de 20%) dans la semaine du 12 au 18/10.

    EDIT : croisement avec M. Bilik qui n'a apparemment pas bien compris ce qu'est une exponentielle, avec un doublement en environ 3 semaines
    Dernière modification par yves95210 ; 20/10/2020 à 13h59.

  21. #20
    yves95210

    Re : Covid-19 programme modélisation

    Voici un petit calcul tout bête, qui donne le rapport entre le nombre de nouveaux cas la 10e semaine d'une épidémie en progression exponentielle (avec une croissance de ~3,5% par jour à titre d'exemple) et le nombre total de nouveaux cas durant ces 10 semaines :
    (exp(70*0,035)-exp(63*0,035)) / exp(70*0,035) = 0,217

  22. #21
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Pardon, j'avais cru que la question portait sur la remontée tardive de données. Désolé.

  23. #22
    Lammate

    Re : Covid-19 programme modélisation

    Dans quelle mesure pouvez-vous faire confiance aux statistiques officielles?

  24. #23
    yves95210

    Re : Covid-19 programme modélisation

    Citation Envoyé par Lammate Voir le message
    Dans quelle mesure pouvez-vous faire confiance aux statistiques officielles?
    encore un complotiste ?

    Les stats officielles s'appuient sur les données remontées quotidiennement par les hôpitaux pour les nombres d'hospitalisations, d'admissions en réa, de décès (et par les labos d'analyse pour les nombres de tests PCR pratiqués et positifs). Ces données sont publiées quotidiennement sur le site qui a été maintes fois indiqué sur ce forum.
    Ce sont les mêmes données que j'utilise pour faire un suivi qui confirme grosso-modo les stats publiées sur le site de Santé Publique France. Rien ne vous empêche d'en faire autant si vous voulez vous en assurer par vous-même : rien ne vous prouve que je suis une source fiable.

    Après, libre à vous de croire que ces données sont trafiquées, dans le cadre d'un vaste complot impliquant l'administration et le personnel soignant des hôpitaux, les statisticiens qui épluchent ces données régulièrement, et le gouvernement

    (et pas limité à la France, puisque les données publiées montrent une évolution similaire de l'épidémie dans d'autres pays européens)

    Mais dans ce cas ce n'est pas la peine de venir en discuter ici. Pour cela vous trouverez votre bonheur sur les réseaux (a-)sociaux.

  25. #24
    JPL
    Responsable des forums

    Re : Covid-19 programme modélisation

    Ou chez les illuminati !
    Rien ne sert de penser, il faut réfléchir avant - Pierre Dac

  26. #25
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Avec les données d'ECDC qui concernent énormément de pays, on obtient un graphique comme ça pour le nombre de malades du Covid en France depuis juillet :

    Nom : patients depuis juillet 2020.jpg
Affichages : 192
Taille : 37,6 Ko

    Ca n'inclut pas la Polynésie, ni autre chose que la métropole, je suppose donc que la Guyane par exemple est rattachée à l'un ou 'autre, soit ignorée.
    En passant, lors de la 1ère vague, ECDC donnait le même nombre de morts au patient près, à chaque fois.
    Dernière modification par Miloslav Bilik ; 21/10/2020 à 17h37.

  27. #26
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    La même chose selon ECDC mais avec les décès, moyennés sur une semaine :

    Nom : deces lisses depuis juillet 2020.jpg
Affichages : 178
Taille : 41,3 Ko

  28. #27
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Bonsoir,

    Je peine sur les résultats, et je me demandais si tu pourrais me dire s'il y a des erreurs dans les dates et les totaux (dates manquantes, totaux erronés sur la dernière ligne ou ailleurs, ..).

    Si tu as du temps à perdre pour m'indiquer simplement si des erreurs sont présentes, ça serait sympa.

    Amicalement,

    Milos
    Fichiers attachés Fichiers attachés

  29. #28
    yves95210

    Re : Covid-19 programme modélisation

    Bonjour,

    Tes résultats ont l'air corrects.
    Mais les valeurs sont systématiquement un peu plus élevées que celles que j'obtiens à partir du fichier donnees-hospitalieres-nouveaux-covid19-[DATE].csv

    Peut-être que ça vient de ça, concernant les fichiers mis à disposition sur le site https://www.data.gouv.fr/fr/datasets...e-de-covid-19/ :
    Certains patients, présents dans la base de données hospitalières à un moment donné, sont retirés de la base de données par les établissements de santé lorsque le résultat biologique du patient est négatif par rapport au COVID-19
    J'ai vérifié que, effectivement, entre une occurrence du fichier ci-dessus datant d'il y a plusieurs jours et la dernière, les chiffres sont revus à la baisse.
    Alors que tu utilises probablement des données venant d'une base où quotidiennement seules les données du dernier jour sont ajoutées (sans remise à jour des données des dates précédentes).
    C'est apparemment le cas sur le site Géodes de Santé Publique France. Quand on choisit un indicateur (par ex. le nombre quotidien d'admissions à l'hôpital) et qu'on regarde son évolution temporelle (qu'on peut exporter sous forme de fichier de données), on retrouve apparemment les valeurs quotidiennes figurant dans ton tableau.

    A part ça, il y a une anomalie dans les données du 18/9 (pas dans ton calcul mais dans la source). Il y en a certainement eu beaucoup d'autres du même genre depuis mars, mais au moins celle-là a été signalée, sans-doute parce qu'elle était plus importante que les précédentes :
    Un établissement hospitalier de l’Essonne (91) a transmis ce jour (18/09/2020) près de 240 dossiers concernant des patients hospitalisés au cours des derniers mois. De ce fait, les indicateurs hospitaliers du 18 septembre 2020, présentés par date de déclaration, présentent une augmentation soudaine dans ce département. Cet impact est également visible à un niveau régional (région Ile-de-France) et national. Cette augmentation du nombre de personnes hospitalisées, déclarées le 18 septembre par cet établissement ne reflète pas des nouvelles hospitalisations mais des nouvelles déclarations

  30. #29
    Miloslav Bilik

    Re : Covid-19 programme modélisation

    Bonjour,

    Je te remercie pour ta réponse, qui semble montrer que mon code n'est pas trop pourri, mais il y a fallu le temps; et ce n'est que le "noyau", comme tu sais 90% des sources consistent en l'habillage et la présentation, le choix du fichier d'entrée, celui du fichier de sortie, et diverses options éventuellement. Bref, je suis loin d'avoir un programme présentable.

    J'ai effectivement chargé le CSV tout récemment.

    Comme souvent, c'est en fin de fichier, entre la fin de fichier et la dernière date, que se posent quelques problèmes ; si je comprends bien, la dernière ligne est correcte aussi.

    Merci d'avoir pris le temps de comparer ces résultats aux tiens, d'autant que je n'arrivais à strictement rien en utilisant les formules que tu m'indiquais.

    Bien amicalement, Milos

  31. #30
    yves95210

    Re : Covid-19 programme modélisation

    Citation Envoyé par Miloslav Bilik Voir le message
    Je te remercie pour ta réponse, qui semble montrer que mon code n'est pas trop pourri
    en tout cas, il donne rigoureusement (pour toutes les dates) le même résultat que Geodes, d'où tu aurais pu exporter les mêmes données cumulées.

    Ci-joint l'export que j'ai fait ce matin de l'évolution temporelle de l'indicateur 'Nombre quotidien de nouvelles personnes hospitalisées avec diagnostic COVID-19 déclarées en 24h' (c'est dans la feuille "Graphiques", qui contient aux données utilisées par Geodes pour présenter les graphiques en fonction des indicateurs sélectionnés). Je l'avais exporté au format Open Document Spreadsheet (.ods), mais Excel sait ouvrir les fichiers dans ce format.
    Attention, les nombres y sont dans un format chaîne de caractères, il faut utiliser la fonction CNUM du tableur pour les convertir en nombres utilisables pour faire des calculs ou pour les comparer à ceux que tu as obtenus.
    Fichiers attachés Fichiers attachés

Page 1 sur 2 1 DernièreDernière

Discussions similaires

  1. Modélisation du Covid et une remarque intéressante sur l'Allemagne
    Par pm42 dans le forum Covid-19, SARS-CoV2 : actualités et discussions
    Réponses: 3
    Dernier message: 02/06/2020, 09h01
  2. Actu - Covid-19 : quand l'IA propose un nouvel outil de modélisation pour aider les politiques sanit
    Par invite94355a9b dans le forum Covid-19, SARS-CoV2 : actualités et discussions
    Réponses: 0
    Dernier message: 15/05/2020, 16h40
  3. Réponses: 4
    Dernier message: 18/10/2019, 21h24
  4. Programme Scilab : Modélisation d'une autosuffisance alimentaire pour une denrée donnée
    Par theotours dans le forum Programmation et langages, Algorithmique
    Réponses: 1
    Dernier message: 19/06/2012, 15h31