bonjour

Ci-après un programme pour déterminer si un médicament est plus efficace qu'un placebo (ou pas) trouvé ici:
https://docs.python.org/3.6/library/random.html#

Code:
# Example from "Statistics is Easy" by Dennis Shasha and Manda Wilson
from statistics import mean
from random import shuffle

drug = [54, 73, 53, 70, 73, 68, 52, 65, 65]
placebo = [54, 51, 58, 44, 55, 52, 42, 47, 58, 46]
observed_diff = mean(drug) - mean(placebo)

n = 10000
count = 0
combined = drug + placebo
for i in range(n):
    shuffle(combined)
    new_diff = mean(combined[:len(drug)]) - mean(combined[len(drug):])
    count += (new_diff >= observed_diff)

print(f'{n} label reshufflings produced only {count} instances with a difference')
print(f'at least as extreme as the observed difference of {observed_diff:.1f}.')
print(f'The one-sided p-value of {count / n:.4f} leads us to reject the null')
print(f'hypothesis that there is no difference between the drug and the placebo.')
Je comprends bien le programme mais pas le critère utilisé pour déterminer si le médicament a un effet.

On mesure un paramètre sur 9 personnes ayant reçu un médicament. C'est la liste drug
drug = [54, 73, 53, 70, 73, 68, 52, 65, 65]
Puis sur 10 personnes ayant reçu un placebo. C'est la liste placebo
placebo = [54, 51, 58, 44, 55, 52, 42, 47, 58, 46]

On calcule la moyenne pour chaque groupe puis la différence des moyennes, OK
La différence des 2 moyennes est-elle significative ? C'est là que je ne comprends pas ce qui est fait

On rassemble les 2 groupes de mesure, puis on les mélange, puis on calcule la moyenne des 9 premières données, la moyennes des 10 données suivantes, la différence et enfin on regarde si cette différence est supérieure à la différence originale. Ceci est reproduit un grand nombre de fois

Où veut-on en venir ?