Je me pose quelques questions triviales sur le sens de l'entité mathématique qu'on nomme variance, et qu'on définit généralement comme la moyenne des carrés des écarts à la moyenne. Je la rencontre en statistiques, et lorsque je cherche à en saisir l'origine, je me heurte à des explications pour le moins variables.
Pour commencer, tout le monde s'entend sur le fait que la variance est censée nous renseigner sur la dispersion d'un ensemble de valeurs autour d'une valeur moyenne, mais personne n'explique en quoi il est pertinent de se référer à la moyenne. Pourquoi ne pas utiliser une autre valeur de référence, comme l'origine ?
Ensuite, tout le monde s'entend aussi sur le fait que l'élévation au carré des différences avec la moyenne permet de manipuler des nombres positifs, ce qui peut faire effectivement sens puisque l'écart d'une valeur à la valeur de référence ne serait pas censé venir compenser l'écart d'une autre dans le contexte d'une approche de la dispersion.
Les explications divergent ensuite, car certains précisent que l'élévation au carré permet aussi d'accorder d'autant plus d'importance aux écarts qu'ils sont grands.
Ce qui caractérise ces explications, c'est qu'elles sont formulées du point de vue des statistiques. Mais ce n'est pas parce qu'un outil est utilisé dans une discipline qu'il en est forcément issu : cet outil peut avoir été importé d'une autre discipline, et c'est dans cette dernière qu'il faut rechercher son histoire. Autrement, on risque une reconstruction fonctionnaliste, c'est-à-dire une reconstruction de l'histoire de l'outil à partir de ses usages qui fait l'impasse sur les hypothèses qui sont aux fondements de l'outil, donc sur les usages autorisés de ce dernier. Au final, on risque d'utiliser l'outil à mauvais escient par la suite. C'est assez l'histoire du culte du cargot.
Je suppose que ces explications trouvées ici et là sont des reconstructions, parce qu'aucune n'explique pourquoi il est nécessaire de se référer à la moyenne. Tout le monde l'utilise sans se poser de questions : c'est donc que son usage est probablement imposé de l'extérieur.
Partant, d'où vient la variance ? En particulier, ne trouve-t-elle pas son origine dans l'entreprise mathématique consistant à mettre en équation la gaussienne, auquel cas elle aurait été importée en statistiques avec la gaussienne, l'idée étant qu'une distribution devrait toujours être comparée à une gaussienne ? Après quelques recherches, il me semble qu'il faudrait remonter le fil en cherchant des informations sur l'origine du concept d'écart quadratique moyen ?
-----