cela étant le théorème de Bayle est quand même aussi appelé "probabilité des causes" , justement.
-----
cela étant le théorème de Bayle est quand même aussi appelé "probabilité des causes" , justement.
Justement : pas par les bayésianistes !
(C'est précisément sur ce point que Jaynes détruit à leur racine les conclusions tirées des inégalités de Bell et des expériences d'Aspect : une mauvaise compréhension du concept de probabilité conditionnelle.)
Mais minushabens a mis le doigt là où il fallait : il faut distinguer les deux méthodes statistiques et la dispute sur le concept de probabilité :(mais pour ma part je ne mettrais pas les "probabilistes" dans le même sac que les statisticiens).- d'une par l'interprétation bayesienne des probabilités, selon laquelle une probabilité modélise un "degré de confiance" en quelque-chose (la survenue d'un événement par exemple) et qui s'oppose à l'interprétation dite fréquentiste selon laquelle une probabilité est la limite d'une fréquence empirique.
- d'autre part la méthode d'estimation bayesienne en statistiques, qui consiste à estimer une distribution à partir d'une distribution dite "a priori" (i.e. précédant l'observation) et d'une observation.
Il n'y a pas de lien fort entre les deux. Et d'ailleurs la plupart des probabilistes ne se soucient pas tellement d'interprétation, et les statisticiens non plus,
Deux méthodes statistiques, la fréquencienne et la bayésienne : deux outils plus ou moins performants selon le contexte, tout le monde est d'accord.
Deux concepts de la probabilité, irréconciliables au niveau du concept de la probabilité conditionnelle : les bayésianistes et les fréquentistes, les laplacistes à la Jaynes et les propensionnalistes à la Popper, ceux pour qui une probabilité est mentale, épistémique et ceux pour qui une probabilité est physique, "ontologique".
Dernière modification par Nicophil ; 07/01/2015 à 00h44.
La réalité, c'est ce qui reste quand on cesse de croire à la matrice logicielle.
j'approuve cette correction.
la "causalité" reste juste historique dans le bayésianisme.
cordialement.
cela dit, je ne place pas trop le sujet au niveau épistémique , mais pragmatique.
encore une fois, sur un très faible échantillon d'observation , seul l'approche bayesiènne a un sens, si elle est possible.
sur un très grand nombre, les deux doivent se rejoindrent.
le pb pratique se pose sur un nb limité, ou le fréquentisme peut être réellement source de biais, et si on n'a pas ( encore ) de modèle prédictif.
mais pour lequel l'analyse des échantillons peut faire avancer le modèle de prédiction.
Bonjour,
Bien que je commence, enfin, à avoir une petite idée du statut de ces différentes approches, il me manque encore d'avoir une idée des modalités pratiques.
Il y a quelque temps j'ai entendu sur une radio nationale que le PSG avait 76% de chance de gagner leur match suivant, je voudrais savoir :
1) Qu'aurait fait un "fréquentiste" avant les calculs pour estimer cette probabilité, quels calculs aurait-il fait ensuite, comment aurait-il présenté ses résultats ?
2) Qu'aurait fait un "bayésien" avant les calculs pour estimer cette probabilité, quels calculs aurait-il fait ensuite, comment aurait-il présenté ses résultats ?
Pour prendre un autre exemple : quelle est la probabilité qu'il existe une vie carbonée ayant développé une vie sociale sur telle planète située à plus de 10 années-lumière de notre système ?
1) Que ferait un "fréquentiste" avant les calculs pour estimer cette probabilité, quels calculs ferait-il ensuite, comment présenterait-il ses résultats ?
2) Que ferait un "bayésien" avant les calculs pour estimer cette probabilité, quels calculs ferait-il ensuite, comment présenterait-il ses résultats ?
S'il existe d'autres typologies d'approches, n'hésitez pas à les présenter.
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
Bonjour Médiat.
je trouve intéressant d'essayer de se confronter à un cas réel.Bonjour,
Il y a quelque temps j'ai entendu sur une radio nationale que le PSG avait 76% de chance de gagner leur match suivant, je voudrais savoir :
1) Qu'aurait fait un "fréquentiste" avant les calculs pour estimer cette probabilité, quels calculs aurait-il fait ensuite, comment aurait-il présenté ses résultats ?
2) Qu'aurait fait un "bayésien" avant les calculs pour estimer cette probabilité, quels calculs aurait-il fait ensuite, comment aurait-il présenté ses résultats ?
.
je ne prend que le premier.
il est d'ailleurs amusant que les commentateurs sportifs , dans leurs commentaires d'avant match , se comporte plutôt comme l'un ou plutôt comme l'autre.
je dis "plutôt", parce que ce n'est jamais radical.
en préambule, il me semble étonnant que l'on donne un chiffre aussi précis, il doit s'agir plutôt de l'état actuel des paris sur le gagnant.
mais cela ne change pas l'exercice de pensée.
j'avance donc qcq idée sous toute reserve.
le bayésien fondera son analyse sur des critère qualitatifs essentiellement.
cette équipe n'est pas en forme en ce moment, fatiguée par exemple.
ils viennent de changer d'entraineur
tel joueur important est blessé,
l'équipe joue à l'extérieur ,
elle est en milieu de tableau et ne risque rien à perdre ou à gagner , donc peu investies pas le match
ou au contraire elle se bat pour le titre ou pour rester en L1.
-....
le frequentiste pur se fonderait plus sur les stats passées.
telle équipe est 2ème du championat et l'autre dernière. ( donc diff de niveau ) ( argument bayésien aussi d'ailleurs )
celle ci n'a jamais battu l'autre sur leur terrain depuis deux ans.
+ stats mutiples sur les rencontres passées.
niveau actuel des paris ( x% des parieurs ont misé sur telle équipe )
.......
à titre d'argument "mixte", on peut citer.
telle equipe est bonne à l'extérieur
telle équipe a une bonne ou une mauvaise attaque ou idem pour la défense
les scores sont tj très serrés entre les deux équipes
voilà en première intention.
Bonjour ansset,
Merci de cete réponse
C'est exactement cela qui m'avait fait sursauter
C'est ce que font tous les sélectionneurs de comptoirs ainsi que les experts ; je ne vois pas ce qu'il y a de scientifique la-dedans, je ne vois pas comment ensuite on passe aux calculs, et je ne vois pas comment interpréter le résultat, pour mon usage, concernant l'événement lui-même (et pas sur ce qu'en pense l'expert de comptoir qui en est arrivé là).le bayésien fondera son analyse sur des critère qualitatifs essentiellement.
cette équipe n'est pas en forme en ce moment,
ils viennent de changer d'entraineur
tel joueur important est blessé,
l'équipe joue à l'extérieur ,
elle est en milieu de tableau et ne risque rien à perdre ou au contraire
elle se bat pour le titre ou pour rester en L1.
Quel corpus choisir scientifiquement ? Par contre, là je vois bien comment on passe aux calculs (une fois le corpus choisi), et je ne sais toujours pas comment interpréter le résultat, puisque je ne vois pas pourquoi les matchs d'il y a 2 ans pourraient influer sur le match de demain (si cela se trouve l'équipe a été complètement changée,ou ils n'ont jamais rencontré l'autre équipe etc...)le frequentiste pur se fonderait plus sur les stats passées.
telle équipe est 2ème du championat et l'autre dernière. ( donc diff de niveau ) ( argument bayésien aussi d'ailleurs )
celle ci n'a jamais battu l'autre sur leur terrain depuis deux ans.
+ stats mutiples sur les rencontres passées.
niveau actuel des paris ( x% des parieurs ont misé sur telle équipe )
.......
à titre d'argument "mixte", on peut citer.
telle equipe est bonne à l'extérieur
telle équipe a une bonne ou une mauvaise attaque ou idem pour la défense
les scores sont tj très serrés entre les deux équipes
Pour caricaturer, moi aussi (à prendre comme une question, non comme une critique), ils utilisent tous les deux la technique du doigt mouillé, mais ce n'est pas le même doigt .
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
Une petite précision sur mon message précédent concernant l'approche fréquentiste :
Si on est capable de donner une liste de statistiques passées, dont on peut vérifier (sur le passé) que les pronostics obtenus par l'application systématique (et non ad'hoc) donnent des résultats valides (les équipes pronostiquées gagnantes à 75% gagnent effectivement dans 75% des cas), je comprendrais mieux (même s'il n'y a pas de facteur explicaif).
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
c-a-d que tu n'a pas vraiment choisi un sujet réellement scientifique.
d'ailleurs , je vois rarement des chiffres précis sortir.
mais plutôt x ou y gagnant ( de peu ou de beaucoup ), ou score serré donc forte incertitude, ou match "fermé" dont problement résultat nul à l'arrivée......
les refs aux matchs plus anciens sont surtout utilisés dans les compétitions internationales.Quel corpus choisir scientifiquement ? Par contre, là je vois bien comment on passe aux calculs (une fois le corpus choisi), et je ne sais toujours pas comment interpréter le résultat, puisque je ne vois pas pourquoi les matchs d'il y a 2 ans pourraient influer sur le match de demain (si cela se trouve l'équipe a été complètement changée,ou ils n'ont jamais rencontré l'autre équipe etc...)
Pour caricaturer, moi aussi (à prendre comme une question, non comme une critique), ils utilisent tous les deux la technique du doigt mouillé, mais ce n'est pas le même doigt .
il est assez rare ( mais pas exclus ) que la meilleure équipe du monde devienne une catastrophe deux ans après. ( ou l'inverse )
sauf dans le cas d'un changement générationnel brutal ou de viellissement des cadres.
"au doigt mouillé" : oui bien sur!
mais on parle de sport, là.
difficile d'en faire un sujet de prévision scientifique.
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
dans le second exemple, il me semble que les deux se taisent ( en tout cas ils devraient )
le fréquentiste parce qu'il n'a aucune observation.
le bayésien parce qu'il ne sait pas comment apparait la vie carbonée.
Cela me va parfaitement !
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
Bonjour,
Je serais curieux de savoir ce que feraient un fréquentiste et un bayésien dans le cas décrit là : http://forums.futura-sciences.com/ac...ml#post5086109
Par "ce que feraient" j'entends toutes les actions (au moins d'un point de vue méthodologique) avant, pendant et après les calculs ...
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
je ne sais que te répondre.
sachant que je ne suis moi même pas trop versé vers les stats et les probas.
mais dans le fil que tu cites il y a un lien très intéressant.
http://www.planecrashinfo.com/cause.htm mis par T-K
qui peut probablement inspirer les uns comme les autres.
sachant ( opinion personnelle ) que si des modèle bayésiens s'en dégagent, ils seront certainement plus prolifiques que des considérations simplement fréquentistes.
par exemple sur la formation des pilotes corrélée avec les conditions météo.
Bonsoir ansset,
Merci de votre proposition, j'ai bien vu le document de T-K, mais je ne vois toujours aucune méthodologie se dégager...
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
Bonjour,
On dirait que bien peu de gens ont la moindre connaissance de cette différence ; j'essaye encore, avec une expérience personnelle.
Tous les matins je me gare vers 8h, dans un endroit payant à partir de 9h, plusieurs fois par semaine (le point n'est pas là) j'oublie de déplacer ma voiture vers un parking (qui ouvre à 8h30) jusqu'à 10h.
Je voudrais calculer la probabilité d'avoir une contravention lorsque je me réveille à 10h pour déplacer ma voiture.
Je vois deux méthodes fondamentalement différentes :
1) Je regarde les statistiques (nombre de voitures en défaut de paiement, nombre de voitures effectivement pénalisées en 1 heure, etc.)
2) Je regarde les consignes des commissariats (longueur de trottoirs inspectée en 1 heure, nombre de personnels affectés aux contraventions, tolérance, etc.)
Est-ce que ces deux méthodes (dont on peut penser qu'elles donneront le même résultat, à peu de choses près) sont caractéristiques des approches fréquentistes et bayésiennes, ou n'ont rien à voir avec ces deux approches ?
En tout état de cause, les deux méthodes ci-dessus sont "épistémiques" en ce sens que les renseignements glanés peuvent être globaux (niveau France) ou locaux (niveau département ou ville ou rue), sur l'ensemble de la journée, ou spécifiques de la tranche horaire (etc.), et donc mesurent (aussi) ma connaissance du problème... Avec des résultats éventuellement très différents en fonction de cette connaissance.
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
bjr MediatBonjour,
On dirait que bien peu de gens ont la moindre connaissance de cette différence ; j'essaye encore, avec une expérience personnelle.
Tous les matins je me gare vers 8h, dans un endroit payant à partir de 9h, plusieurs fois par semaine (le point n'est pas là) j'oublie de déplacer ma voiture vers un parking (qui ouvre à 8h30) jusqu'à 10h.
Je voudrais calculer la probabilité d'avoir une contravention lorsque je me réveille à 10h pour déplacer ma voiture.
Je vois deux méthodes fondamentalement différentes :
1) Je regarde les statistiques (nombre de voitures en défaut de paiement, nombre de voitures effectivement pénalisées en 1 heure, etc.)
2) Je regarde les consignes des commissariats (longueur de trottoirs inspectée en 1 heure, nombre de personnels affectés aux contraventions, tolérance, etc.)
Est-ce que ces deux méthodes (dont on peut penser qu'elles donneront le même résultat, à peu de choses près) sont caractéristiques des approches fréquentistes et bayésiennes, ou n'ont rien à voir avec ces deux approches ?
En tout état de cause, les deux méthodes ci-dessus sont "épistémiques" en ce sens que les renseignements glanés peuvent être globaux (niveau France) ou locaux (niveau département ou ville ou rue), sur l'ensemble de la journée, ou spécifiques de la tranche horaire (etc.), et donc mesurent (aussi) ma connaissance du problème... Avec des résultats éventuellement très différents en fonction de cette connaissance.
si tu fais référence aux méthodologies précises et donc aux outils mathématiques réellement utilisé, je suis effectivement incapable de répondre à la hauteur de ta question.
concernant ton dernier exemple, je vois aussi les deux approches telles que tu les décrits.
Pour revenir sur les catastrophes aérienne.
Un fréquentiste "amateur" observera que le nb de crash mortel baisse ( voir la courbe ) environ une division par 5 en 25 ans.
mais quand on regarde le premier tableau , on observe des variations en fonction des causes.
On peut voir par exemple que les erreurs de pilotage lié à la météo augmentent ( ou semblent augmenter car le premier tableau est décénal ) alors que les catastrophes liées uniquement à la météo baisse.
Etant loin du domaine aéronautique, cela amène peut être des questions et/ou des réponses , voire des projections liées aux mesures qui sont ou seront prises.
( là on est dans du bayésien )
les pilotes sont ils suffisamment formés aux conditions difficiles.?
il y a t-il en parallèle des questions liées à l'électronisation/automatisation des appareils.?
Donc , si on cherche à se projeter en avant, on est dans une problématique du même ordre ( je grossi le trait ) que les prévisions climatiques.
je veux dire par là : des causes multi-factorielles et une incidence liée aux actions menées ( formation et avionique )
encore une fois, pour ce qui concerne les modélisations précises, j'espère que qcq te répondra.
cordialement.
Bonjour ansset,
Merci de vos efforts.
Finalement, je commence à comprendre pourquoi, in fine, seules les mathématiques m'intéressent .
Je suis Charlie.
J'affirme péremptoirement que toute affirmation péremptoire est fausse
je parlais d'un nb limité d'observation ou le fréquentisme par principe , s'il veut fournir des prédictions sur ces bases, ne peut être qu'impuissant.
le terme de biais est peut être inadapté ( il y a peut être un autre mot ), et pourtant , on peut voir des essais cliniques par exemple qui sont évidemment à confirmer car l'échantillon n'est pas suffisamment significatif.
la trop faible taille d'un échantillon me semble être de l'ordre du biais.
je crois que tu te trompes, et que quand il n'y a pas d'information, aucune méthode statistique ne peut donner de résultats fiables, qu'elle se base sur le principe de vraisemblance ou sur l'approche bayesienne. Le domaine d'application du bayesien n'est pas le cas des petits échantillons, mais celui des modèles avec de très nombreux paramètres, comme on en voit en écologie ou en génétique des populations par exemple.
d'abord, je n'ai pas dit aucune mais peu !je crois que tu te trompes, et que quand il n'y a pas d'information, aucune méthode statistique ne peut donner de résultats fiables, qu'elle se base sur le principe de vraisemblance ou sur l'approche bayesienne. Le domaine d'application du bayesien n'est pas le cas des petits échantillons, mais celui des modèles avec de très nombreux paramètres, comme on en voit en écologie ou en génétique des populations par exemple.
je n'ai pas dit non plus que le bayésianisme était réservé aux petits échantillons, ou alors cherches une phrase qui le montre.
attention aux déformations.
ensuite, il semble que nous soyons en désaccord effectivement.
si je fabrique un dé le plus homogène possible, sans l'avor testé , je peux prédire qu'il y a une équiprobabilité de resultat sur les faces.
si je fabrique un avion sans aile, je peut prédire qu'il ne volera pas ( s'il "vole" )comme un avion !