Bonjour,
J'ai créé une simulation de labyrinthe virtuel avec différents personnages qui ont des caractéristiques définis quantitativement, par exemple un facteur de curiosité, un nombre de pauses par journée, la qualité de sa vue, etc. Si on envoie le personnage dans le labyrinthe, il va le parcourir (enfin c'est mon algorithme qui le fait) et en fonction de ses caractéristiques et des hasards de son parcours il va le résoudre ou y mourir (et oui pas de pitié)
Un gardien est devant le labyrinthe, sa mission c'est de diminuer la mortalité dans le labyrinthe en autorisant certains personnages à le faire ou non (s'ils ne le font pas ils iront voir un autre labyrinthe avec d'autres caractéristiques et un autre gardien).
Pour ce faire, je pensais que le gardien pouvait faire un score qui soit une combinaison des caractéristiques du personnage et fixer un seuil en fonction de quoi il autorise ou non l'entrée. Le modèle de ce score serait optimisé de manière à maximiser le nombre de personnages sortant du labyrinthe en une journée.
La question est quel algorithme choisir pour calculer le modèle de scoring ? Également je souhaiterais que le modèle s'optimise tout seul au fil du temps, qu'il apprenne au fur et à mesure si c'est possible
Pourriez vous me donner le nom d'un algorithme susceptible de résoudre ce problème ?
-----