Normalement, on prend des images dont le diagnostic a été fait par un humain et validé ensuite.
C'est la phase de filtrage : on récupère plein de données et on vire celles qui sont fausses. Suivant les cas, cela peut être relativement facile ou très long et fastidieux.
Mais si on entraine avec des données de mauvaise qualité, on va avoir un résultat douteux en effet. Ceci dit, quand on fait les choses proprement, on obtient de bons résultats notamment en radiologie où l'IA peut pointer au radiologue des détections qu'il a peut-être raté.
-----