Bonjour à tous,
Je suis prof de lettres et en ce moment je cherche à prouver un phénomène stylistique par les stats et les probas. Mais comme je n'y connais pas grand chose (à part ce que j'ai pu étudier par moi-même dans un manuel de statistique linguistique), je galère un peu. Voilà le problème: dans un poème de 21286 vers, il y a 1720 vers de quatre mots et j'ai l'impression que ce type de vers est utilisé en rafales, c'est-à-dire de manière complètement irrégulière. Pour prouver que cela n'est pas dû au hasard, j'ai suivi la méthode du bouquin dont je parlais, à savoir découper le poème en tranches égales (de plus en plus petites pour voir à quel niveau se produit le phénomène : j'ai pris n=100, n=50, n=30, n=15, n=10, n=5 puis n=2), compter le nombre de tranches qui ont 0, 1, 2, 3, ..., 100 vers de quatre mots et comparer cette répartition observée avec la répartition théorique. Or je ne sais pas s'il faut calculer l'effectif théorique selon la loi normale, la loi binomiale ou la loi de Poisson. Là dessus le manuel que j'utilise est assez flottant. Est-ce que vous pourriez m'apporter quelques éclaircissements à ce sujet ? Voilà d'ailleurs le tableau que j'obtiens pour n=100 (la colonne de droite donne le nombre de vers de quatre mots par tranches et celle de gauche le nombre de tranches concernées):
3- 22
4 17
5 10
6 23
7 25
8 21
9 19
10 26
11 13
12 11
13 10
14+ 15
Total 212
J'ai aussi oublié de préciser que p=0,081.
Merci d'avance,
Maldoror