Bonjour,
La présente pour poursuivre une discussion qui porte maintenant sur d'autres aspects que l'intention initiale.
Bonjour,
Pour moi, AlphaZéro a passé un cap énorme : produire une analyse intelligente sans données d'entraînement externe.
On peut donc définir une "vitesse d'apprentissage" intrinsèque (qui dépend juste de la machine).
Les courbes montrées par Google sont classique d'un apprentissage.
En temps absolu, en 1 jour, AlphaZéro bat n'importe quel humain. mais il aura fait en qques minutes plus de parties que n'importe quel humain.
Que donneraient les courbes de progression et les résultats si on comptait la durée d'apprentissage en parties jouées ? (ex : au bout de 1000 parties, que vaut alpha zéro par rapport à un humain qui aurait joué 1000 parties ?)
Si on compte le nombre de parties qu'à joué alpha zéro par rapport à Lee Seydol pour atteindre son niveau (100 000) et qu'on considère que le champion du monde en a joué environ 10 000 à son âge, peut-on considérer qu'Alphazéro est relativement 10x moins rapide à apprendre qu'un homme surdoué ?
Ma vraie question : peut-on considérer cette vitesse d'apprentissage comme une bonne évaluation du niveau d'intelligence sur une activité spécifique ?
@+AlphaZero n'a pas eu besoin de 100.000 parties pour atteindre le niveau de Lee Sedol, mais de beaucoup plus.
100.000, c'est le nombre de learning step, mais chaque learning step est composée de 4096 parties
Dans tout les cas, ça n'est pas comparable, le mécanisme d'apprentissage est différentBonjour,
même sans être connaisseur la question est très pertinente vu d'ici.
J'ai d'abord était scié par la différence du nombres de parties nécessaires chez l'humain et chez Alphazéro.
Mais l'homme n'a t'il pas un avantage sur la machine? Nous sommes habitués à des concepts comme aller en ligne droite ou en diagonale depuis notre enfance.
La passation des connaissances permet l'apprentissage des bons réflexes aux débutants: initiation par des joueurs plus expérimentés, livres... cela réduit donc le nombre de partie nécessaire à l'apprentissage.
Alors qu'Alphazéro part de zéro non?C'est tres joli comme idee. D'un point de vue technique un apprentissage profond c'est une marche dans un espace de tres haute dimension. Une caracteristique notable de ces espaces, c'est qu'ils sont beaucoup plus grands que ce que notre intuition percoit. Une consequence est que, en termes relatifs a la quantite de points possibles, l'etat final apres apprentissage n'est jamais tres tres loin de l'etat initial aleatoire.
Dans ce contexte cela fait effectivement beaucoup de sens de definir le niveau d'intelligence de cette facon. En termes pratiques cela voudrait dire qu'alphazero devrait etre considere comme d'un niveau d'intelligence tres inferieur a l'equivalent logiciel d'un humain (pour les raisons expliquees par Tryss2), avec donc une distnction entre l'intelligence et la performance. C'est un point de vue seduisant, et potentiellement fecond.On peut aussi le voir comme une variante de ce que développe Yann le Cun sur le fait que les humains sont capables d'apprendre à partir de très peu d'exemples et relativement rapidement une grande variété de situation comparé aux IAs.
Une objection est toutefois de faire remarquer qu'on fait un échange classique en informatique : on utilise la vitesse des ordinateurs pour travailler différemment des humains et atteindre une efficacité qui elle même va être meilleure sur certains critères et moins bonne sur d'autres.
Par exemple, pour le Go, on peut en effet dire qu'un humain va apprendre et éventuellement exceller sur largement moins de partie qu'AlphaZéro.
Mais si on prend en compte le temps pour former un adulte capable de comprendre les règles, les générations pour arriver au niveau actuel de maitrise du jeu, la sélection sur un grand nombre d'humains pour avoir un champion qui lui même devient très spécialisé, c'est moins clair.
Je ne dis pas qu'il y a équivalence. Je dis juste que ce genre de comparaison peut être faite sur de multiples critères, que chacun d'eux peut avoir un coefficient variable et qu'on peut donc arriver facilement à des conclusions très différentes.
-----