Bonjour à tous,
Je m’interroge sur certaines utilisations des statistiques dans le domaine scientifique. J’ai deux exemples extrêmes qui me viennent à l’esprit :
- Une corrélation existe entre le volume de pluie précipité et le débit d’un ruisseau.
- Une autre corrélation existe entre le nombre d’ascenceurs et le nombre de divorces (si si c’est vrai)
Dans le premier cas, même si on ne sait pas modéliser précisément, on peut construire par la pensée un enchainement de phénomènes physiques qui conduisent de la pluie à l’écoulement du ruisseau. La corrélation statistique démontre à mon avis l’exactitude de notre modèle « qualitatif » et peut même le rendre prédictif. C’est clairement une démarche scientifique.
Dans le second cas, on inverse la démarche. On ne voit pas très bien quel peut être le lien entre les deux phénomènes. Cependant la corrélation nous incite à penser qu’il existe et à le rechercher alors qu’il s’agit en fait d’une coïncidence. A mon avis ce n’est plus une démarche scientifique mais car on n’a pas de modèle explicatif préexistant à la corrélation statistique. Pourtant, le modèle statistique pourrait même être prédictif « par hasard » car on constate effectivement un tassement à la fois du parc d’ascenceurs et du nombre de divorces !
Ces deux exemples extrêmes permettent certes d’esquisser les limites de la démarche statistique, mais qu’en est il des statistiques par exemple en médecine ou on met en évidence des corrélations entre la consommation d’oranges et le cancer du poumon ou tout autre lien plus ou moins extravagant !?
-----