Bonjour,
Pour moi, AlphaZéro a passé un cap énorme : produire une analyse intelligente sans données d'entraînement externe.
On peut donc définir une "vitesse d'apprentissage" intrinsèque (qui dépend juste de la machine).
Les courbes montrées par Google sont classique d'un apprentissage.
En temps absolu, en 1 jour, AlphaZéro bat n'importe quel humain. mais il aura fait en qques minutes plus de parties que n'importe quel humain.
Que donneraient les courbes de progression et les résultats si on comptait la durée d'apprentissage en parties jouées ? (ex : au bout de 1000 parties, que vaut alpha zéro par rapport à un humain qui aurait joué 1000 parties ?)
Si on compte le nombre de parties qu'à joué alpha zéro par rapport à Lee Seydol pour atteindre son niveau (100 000) et qu'on considère que le champion du monde en a joué environ 10 000 à son âge, peut-on considérer qu'Alphazéro est relativement 10x moins rapide à apprendre qu'un homme surdoué ?
Ma vraie question : peut-on considérer cette vitesse d'apprentissage comme une bonne évaluation du niveau d'intelligence sur une activité spécifique ?
@+
-----