bonjour
Ci-après un programme pour déterminer si un médicament est plus efficace qu'un placebo (ou pas) trouvé ici:
https://docs.python.org/3.6/library/random.html#
Je comprends bien le programme mais pas le critère utilisé pour déterminer si le médicament a un effet.Code:# Example from "Statistics is Easy" by Dennis Shasha and Manda Wilson from statistics import mean from random import shuffle drug = [54, 73, 53, 70, 73, 68, 52, 65, 65] placebo = [54, 51, 58, 44, 55, 52, 42, 47, 58, 46] observed_diff = mean(drug) - mean(placebo) n = 10000 count = 0 combined = drug + placebo for i in range(n): shuffle(combined) new_diff = mean(combined[:len(drug)]) - mean(combined[len(drug):]) count += (new_diff >= observed_diff) print(f'{n} label reshufflings produced only {count} instances with a difference') print(f'at least as extreme as the observed difference of {observed_diff:.1f}.') print(f'The one-sided p-value of {count / n:.4f} leads us to reject the null') print(f'hypothesis that there is no difference between the drug and the placebo.')
On mesure un paramètre sur 9 personnes ayant reçu un médicament. C'est la liste drug
drug = [54, 73, 53, 70, 73, 68, 52, 65, 65]
Puis sur 10 personnes ayant reçu un placebo. C'est la liste placebo
placebo = [54, 51, 58, 44, 55, 52, 42, 47, 58, 46]
On calcule la moyenne pour chaque groupe puis la différence des moyennes, OK
La différence des 2 moyennes est-elle significative ? C'est là que je ne comprends pas ce qui est fait
On rassemble les 2 groupes de mesure, puis on les mélange, puis on calcule la moyenne des 9 premières données, la moyennes des 10 données suivantes, la différence et enfin on regarde si cette différence est supérieure à la différence originale. Ceci est reproduit un grand nombre de fois
Où veut-on en venir ?
-----