Bonjour,
je suis en train de lire un livre de machine learning, certaines manipulations de probabilités font intervenir des variables aléatoires discrètes et des variables aléatoires continues. Je trouve ces manipulations un peu étonnantes, peut-être que vous allez pouvoir m’éclairer.
Contexte : on considère une variable aléatoire discrète(pour classe) qui peut prendre
valeurs
. On considère également une variable aléatoire continue
à valeurs réelles (en réalité il s’agit d’un vecteur aléatoire mais la discussion est la même).
On suppose connaître la densité conditionelleainsi que la distribution de probabilité de
,
.
À ce niveau là, je me suis interrogé sur le sens de. Si
est un intervalle de
, on peut calculer
,
étant une variable continue, on suppose qu’on puisse écrire
comme l'intégrale d'une densité sur
, et cette densité sera alors
.
L’auteur ne fait pas de différence entreet
(tous les «p» sont en minuscules), donc il faut savoir selon le contexte si l’on parle de densité ou de probabilité.
La partie que je trouve la plus étrange est le calcule de, premièrement doit on le comprendre comme une probabilité ou une densité ?
Je pense qu’il s’agit d’une probabilité carest discrète mais dans ce cas on conditionne par rapport à l’événement
qui est de probabilité nulle… Est-ce alors une densité ? Mais quelle est alors son sens ?
Voici comment l’auteur la calcule,
L’auteur applique le théorème de Bayes comme si les deux variables aléatoires étaient du même type, cela me semble assez étrange, surtout le fait de multiplier une densité avec une probabilité.
Durant toute ma scolarité je n’ai jamais rencontré ce genre de situation mixte (je sais qu’il y a une point de vue unificateur qui consiste à considérer les distributions de variables aléatoires comme des Dirac mais je ne pense pas que ce soit applicable ici).
Mon texte est assez long, j'espère avoir été assez clair. Je remercie d’avance ceux qui pourront m’éclairer.
-----


(pour classe) qui peut prendre