AlphaGO Zéro

inviteef2ff547 · 23/10/2017, 12h07

Bonjour,
Je viens avec plusieurs questions sur le nouvel AplhaGo.

L’article dans Nature est ici :
https://www.nature.com/articles/natu...wjxeTUgZAUMnRQ

(trouvé via https://www.contrepoints.org/2017/10...alphago-dingue)

Je trouve vraiment incroyable qu’une description de 4 pages donne toutes les informations nécessaires à la reproduction de l’algo. D’autant plus que l’article insiste sur « First and foremost, it is trained solely by self¬play reinforcement learning, starting from random play, without any supervision or use of human data. »

Ma première question est la suivante. La description de l’algo tel qu’il est décrit est-il suffisant pour le reproduire ?

Ma deuxième : si j’ai bien compris le précédent alphaGo était architecturé sur trois modules :
1) Un réseau neuronal pour évaluer une position ;
2) Un réseau neuronal pour générer les « bons » coups à partir d’une position ;
3) Un algo Alpha Béta avec monte carlo (MCTS) qui chaine les deux pendant la partie.
Avec le nouveau on n’a plus qu’un seul réseau neuronal qui génère les « bons » coups à partir d’une position. Le MCTS n’est utilisé que pour la génération des millions de parties qui ont permis l’entrainement du réseau neuronal.
Mon interprétation est-elle correcte ?

Un troisième, ce n’est pas vraiment une question mais un truc rigolo : « Surprisingly, Shicho (‘ladder’ capture sequences that may span the whole board)—one of the first elements of Go knowledge learned by humans—were only understood by AlphaGo Zero much later in training ». Le Shicho est relativement facile à détecter et à programmer de façon algorithmique. Pour faire simple, AlphaGo est meilleur que nous sur la stratégie que sur la tactique

. L’exact inverse de ce que l’on pensait en 1990.

Enfin, un autre truc incroyable. S’il faut vraiment 3 jours pour entrainer AlphaGO avec 4 millions de parties, cela veut dire que le temps moyens de circulation de l’info dans le réseau neuronal est très nettement inférieur à la 10° de seconde.
Confronté à un joueur humain (qui de toute façon n’a aucune chance de gagner) et qui mettra autour d’une minute pour jouer chaque coup, le dernier argument en faveur de la « supériorité » de l’homme (la moindre consommation d’énergie) tombe.

invite6486d7bd · 25/10/2017, 19h34

Envoyé par HenriParisien1

Enfin, un autre truc incroyable. S’il faut vraiment 3 jours pour entrainer AlphaGO avec 4 millions de parties, cela veut dire que le temps moyens de circulation de l’info dans le réseau neuronal est très nettement inférieur à la 10° de seconde.
Confronté à un joueur humain (qui de toute façon n’a aucune chance de gagner) et qui mettra autour d’une minute pour jouer chaque coup, le dernier argument en faveur de la « supériorité » de l’homme (la moindre consommation d’énergie) tombe.

Pas d'accord.
D'une part, la "machine" humaine ne fait pas que calculer, elle vit, ce qui entre autres lui permet de se réparer.
Pour les machines artificielles, la défaillance du processeur signifie la fin du processus calculatoire, car déjà pour commencer ses "neurones" sont virtuels et dépendant du processeur ainsi que de sa mémoire physique.

D'autre part, il est faux de croire que la machine "gagne".
Elle ne sait pas ce que ce terme signifie et il s'agit d'un concepts qui doit être précisé par les concepteurs de la machine afin que celle-ci "apprenne à gagner".
Sinon elle pourrait tout aussi bien exceller pour perdre à coup sur...
On voit donc qu'on est loin du compte si on veut la comparer à l'intelligence humaine.

**Deedee81** · 26/10/2017, 07h36

Salut,

Envoyé par LeMulet

D'autre part, il est faux de croire que la machine "gagne".
Elle ne sait pas ce que ce terme signifie et il s'agit d'un concepts qui doit être précisé par les concepteurs de la machine afin que celle-ci "apprenne à gagner".
Sinon elle pourrait tout aussi bien exceller pour perdre à coup sur...
On voit donc qu'on est loin du compte si on veut la comparer à l'intelligence humaine.

Sur ce point je suis d'accord. C'est en fait ce qui distingue une IA spécialisée (qui existent et sont devenues extraordinaires) et une IA généraliste (qui reste encore largement une utopie).

AlphaGo Zéro est quand même une belle avancée. C'est le vieux rêve de "voici les règles, y compris celle qui dit comment on gagne", et "vas-y apprend". Alors qu'avant on devait encore lui donner des tonnes de parties jouées par des humains pour qu'il s'en inspire (un beau progrès aussi, avant ça on donnait des heuristiques construites par des humains et si ça marchait bien aux échecs, on s'y cassait les dents avec le go).

D'un point de vue "spécialisé", cette I.A. est évidemment supérieure à l'homme. Mais ça c'est pas nouveau. Essayez un peu de vaincre une (bonne) machine à Othello-Reversi par exemple

Le progrès ici n'est pas dans la supériorité à l'homme mais dans l'avancée en tant que système spécialisé.

invite6486d7bd · 26/10/2017, 12h43

Envoyé par Deedee81

D'un point de vue "spécialisé", cette I.A. est évidemment supérieure à l'homme. Mais ça c'est pas nouveau. Essayez un peu de vaincre une (bonne) machine à Othello-Reversi par exemple

Le progrès ici n'est pas dans la supériorité à l'homme mais dans l'avancée en tant que système spécialisé.

Exact, et on pourrait dire la même chose d'un Homme armé de ses poings et d'un bâton de dynamite.
le bâton de dynamite est "plus fort" que l'Homme devant le bloc de granit.

Il est vrai de plus qu'on a là affaire à une belle avancée.
Ce qui m'épate le plus, ce n'est pas tant la prestation de la machine, mais le fait qu'on a fini par comprendre et surtout démontré que c'est le système le plus simple qui est le plus efficace (pas de deuxième réseau pour évaluer le premier) et donc que "l'évaluation" est une vue de l'esprit.
Par exemple, si on veut faire bouger un bras artificiel, on peut imaginer des systèmes "à calibrer" sur lequel fait intervenir des réseaux de neurones pour l'actionner.
Or ici, avec AlphaGo il apparait clairement que "l'adaptation", le calibrage qui dépend du hardware (le matériel étant équivalent aux contraintes physiques, c'est à dire aux règles dans le cas du Go) peut être obtenu (et probablement DOIT être obtenu) par le réseau de neurones lui-même.
La seule règle à produire en dur, si je puis m'exprimer ainsi, c'est celle du choix gagnant.

C'est d'ailleurs ce qu'on observe, il me semble, dans le cas des êtres vivants, pour lesquels les réseaux de neurones de coordination se développent conjointement aux appendices, alors que ces derniers se trouvent eux-mêmes en cours de développement.
Le choix gagnant étant dans ce cas de figure plus complexe à concevoir, mais bon, tout dépend aussi ce qu'on veut faire faire à l'appendice.

A voir en vidéo sur Futura · Aujourd'hui

invite6c250b59 · 29/10/2017, 07h42

Envoyé par HenriParisien1

Ma première question est la suivante. La description de l’algo tel qu’il est décrit est-il suffisant pour le reproduire ?

Il y a peut-être quelques ingrédients secrets (pas nécessairement cachés volontairement), mais à vrai dire tout semble présent. Pour être certain il faudrait le refaire, et on peut être raisonnablement certain qu'il y a des tas de gens qui sont précisément en train d'essayer. Je ne serais pas surpris qu'on trouve du code libre sur github d'ici l'année prochaine, mais cela prendra quand même une solide bête (incluant une NVIDIA respectable) pour pouvoir faire tourner cela chez soi.

Envoyé par HenriParisien1

Ma deuxième : si j’ai bien compris le précédent alphaGo était architecturé sur trois modules :
1) Un réseau neuronal pour évaluer une position ;
2) Un réseau neuronal pour générer les « bons » coups à partir d’une position ;
3) Un algo Alpha Béta avec monte carlo (MCTS) qui chaine les deux pendant la partie.
Avec le nouveau on n’a plus qu’un seul réseau neuronal qui génère les « bons » coups à partir d’une position. Le MCTS n’est utilisé que pour la génération des millions de parties qui ont permis l’entrainement du réseau neuronal.
Mon interprétation est-elle correcte ?

Moui. En fait ils ont un réseau unique à la base mais qui se sépare en deux têtes, une qui évalue la position et une qui génère les probabilités de jouer chaque coup. Un autre aspect c'est qu'ils utilisent un resnet plutôt qu'un réseau à convolution 'traditionnel' (c'est le nouveau champion de la vision artificielle depuis deux trois ans, cela permet des réseaux maousse profonds et notablement plus costaux).

Dans le détail ils ont essayés 4 configurations: convolution + réseaux séparés (i.e. comme pour l'ancienne version); convolution + réseau bicéphale; resnet + réseaux séparés; resnet + réseau bicéphale (i.e. alphago zéro). Cela leur permet de montrer que le facteur architecture leur fait gagner environ 650 points d'elo, c'est-à-dire autant que le passage au resnet.

Finalement, l'algorithme de MCTS est également un peu plus simple, sans qu'il soit clair pour moi si cette simplification leur procure un gain ou si c'est simplement une amélioration liée au fait qu'alphago zero tourne sur un matériel plus facile à maîtriser que les troupeaux de GPU/CPU et TPU/CPU utilisés par les versions précédentes.

Envoyé par HenriParisien1

Confronté à un joueur humain (qui de toute façon n’a aucune chance de gagner) et qui mettra autour d’une minute pour jouer chaque coup, le dernier argument en faveur de la « supériorité » de l’homme (la moindre consommation d’énergie) tombe.

Pour moi le plus impressionnant est plutôt de comparer les moyens de calculs mis en jeu par les humains versus alphago zero. Les humains ont développé leur expertise au jeu de Go en utilisant facilement un milliard de synapse biologique pour chaque synapse informatique utilisée par les alphago durant leurs entraînements respectifs. Tant que les alphago partaient d'une base d'expérience humaine, cela pouvait se comprendre. Après tout la recherche de quelque chose de complètement inconnu est beaucoup plus longue que l'apprentissage de quelque chose que d'autres ont déjà maîtrisé. Mais alphago zero a fait son éducation tout seul, et en quelques jours il montre que l'expérience accumulée par les humains sur des centaines d'années est très dépassable, y compris avec un milliard de fois moins de calculs.

Nous sommes peut-être à la veille de devoir accepter que, quand il s'agit de produire de l'intelligence, nos cerveaux biologiques sont en fait franchement médiocres.

**mh34** · 29/10/2017, 08h24

Envoyé par Jiav

Nous sommes peut-être à la veille de devoir accepter que, quand il s'agit de produire de l'intelligence, nos cerveaux biologiques sont en fait franchement médiocres.

Tu parles bien de l'intelligence mise en œuvre pour jouer au jeu de Go, n'est-ce pas?
Alors je ne vois pas bien ce que ça a d'étonnant, pour le coup, que l'ordinateur le fasse mieux que nous. Si?

Archi3 · 29/10/2017, 08h31

A priori non, à part qu'on a mis un peu de temps à trouver la bonne façon d'utiliser un ordinateur : il n'est pas très étonnant qu'une machine capable de réaliser des millions d'opérations par secondes soit supérieure à un cerveau humain qui peine à faire une multiplication de deux chiffres de tête, quand il s'agit de combinatoire et d'algorithmique !

Le vrai progrès de l'IA "forte" sera quand c'est Alphago qui viendra elle même nous expliquer sur ce forum comment elle "pense" et ce que ça lui fait

invite6c250b59 · 30/10/2017, 03h32

Envoyé par mh34

Tu parles bien de l'intelligence mise en œuvre pour jouer au jeu de Go, n'est-ce pas?

Non, ma phrase est bien pour l'intelligence au sens large. Si je n'avais voulu parler que du jeu de Go, j'aurais plutôt dit: alphago zéro a d'ores et déjà prouvé que les humains sont en fait franchement médiocres à ce jeu.

Envoyé par mh34

Alors je ne vois pas bien ce que ça a d'étonnant, pour le coup, que l'ordinateur le fasse mieux que nous. Si?

Si, mais ce n'est pas la performance qui est impressionnante (enfin si, c'est très très très impressionnant, mais ce n'est quand même pas ça l'information principale). Regarde ce vieux message:

Envoyé par bibi

Envoyé par minushabens

si on rend le jeu plus compliqué (tableau plus grand peut-être, ou nouvelles contraintes) ça favorise l'ordinateur ou bien l'humain?

(...) on peut modifier alphago assez facilement pour qu'il apprenne à jouer sur un damier plus grand ou avec de nouvelles contraintes. Par contre il n'a qu'une seule façon d'apprendre et (...) on peut probablement trouver des règles de jeu tel que (..) alphago (...) sera à la remorque des humains pour découvrir le jeu (...) Ne pas oublier qu'alphago a découvert le jeu d'abord par imitation du jeu humain. Il n'est pas encore clair si on serait capable de lui faire atteindre le même niveau sans cette base de connaissance initiale.

Maintenant on sait, et ce n'est pas un petit détail. Un des principaux 'bottleneck' de l'apprentissage profond était la nécessité d'avoir des bases de données structurées importantes. Maintenant qu'on a un modèle qui permet de s'en passer, on peut s'attendre à une explosion (encore!) du nombre de choses qui vont passer dans le domaine du réalisable. Assez pour qu'un descendant d'alphago vienne nous expliquer elle-même comment elle pense? Peut-être. En fait: très certainement, la question est plutôt de savoir à quelle échéance. Personnellement je serais autant surpris si cela prenait plus que 15 ans ou moins que 15 mois.

**Deedee81** · 30/10/2017, 07h37

Salut,

Envoyé par Jiav

Maintenant on sait, et ce n'est pas un petit détail. Un des principaux 'bottleneck' de l'apprentissage profond était la nécessité d'avoir des bases de données structurées importantes. Maintenant qu'on a un modèle qui permet de s'en passer, on peut s'attendre à une explosion (encore!) du nombre de choses qui vont passer dans le domaine du réalisable. Assez pour qu'un descendant d'alphago vienne nous expliquer elle-même comment elle pense? Peut-être. En fait: très certainement, la question est plutôt de savoir à quelle échéance. Personnellement je serais autant surpris si cela prenait plus que 15 ans ou moins que 15 mois.

Je viens justement de lire un article dans PLS sur l'apprentissage profond. Ils parlent des différentes méthodes dont celles avec présentation d'exemples et celles ou le système génère ses propres exemples. Ils disent que la première est celle qui est la plus efficace mais pénible (il faut avoir les exemples et des humains doivent passer dessus pour dire "bieeeeen" ou "pas bieeeeen"

) et que la deuxième est un vrai challenge. C'est donc clairement un énorme progrès. Maintenant il faut en être conscience, pour des intelligences artificielles généralistes, on n'est est nul part. Malgré ce gros progrès. Mais je me garderai bien de jouer les Madame Irma et je ne ferai pas de pronostic

Archi3 · 30/10/2017, 07h53

Envoyé par Jiav

Assez pour qu'un descendant d'alphago vienne nous expliquer elle-même comment elle pense? Peut-être. En fait: très certainement, la question est plutôt de savoir à quelle échéance. Personnellement je serais autant surpris si cela prenait plus que 15 ans ou moins que 15 mois.

il y a une question à laquelle tous les mauvais joueurs de go savent répondre : de quelle couleur sont les pierres du jeu ?

Archi3 · 30/10/2017, 07h55

Envoyé par Jiav

Assez pour qu'un descendant d'alphago vienne nous expliquer elle-même comment elle pense? Peut-être. En fait: très certainement, la question est plutôt de savoir à quelle échéance. Personnellement je serais autant surpris si cela prenait plus que 15 ans ou moins que 15 mois.

et as tu un pari à faire sur ce qu'elle répondrait alors dans 15 ans à la question : "pourquoi tu passes ton temps à jouer à ce jeu? tu n'as rien de plus intéressant à faire ? "

**Deedee81** · 30/10/2017, 08h28

Salut,

Envoyé par Archi3

il y a une question à laquelle tous les mauvais joueurs de go savent répondre : de quelle couleur sont les pierres du jeu ?

Elles sont toutes grises
(je suis daltonien)

Non, j'exagère

Ceci dit, je sais jouer mais je suis très très médiocre.

Archi3 · 30/10/2017, 08h31

Envoyé par Deedee81

Elles sont toutes grises
(je suis daltonien)

Non, j'exagère

Ceci dit, je sais jouer mais je suis très très médiocre.

si tu n'as pas de bâtonnets, tu n'es pas daltonien, tu es aveugle, et ça peut expliquer que tu ne joues pas bien alors

**Deedee81** · 30/10/2017, 08h47

Envoyé par Archi3

si tu n'as pas de bâtonnets, tu n'es pas daltonien, tu es aveugle, et ça peut expliquer que tu ne joues pas bien alors

J'ai juste les cônes rouges déficients, mais je vois très bien la nuit (car tous les chats sont gris, comme les pierres au go).

Par contre, je me débrouille pas mal aux échecs. Je prend toujours les gris

invite6c250b59 · 30/10/2017, 16h49

Envoyé par Archi3

"pourquoi tu passes ton temps à jouer à ce jeu? tu n'as rien de plus intéressant à faire ? "

I know you don't care. I can feel it's noise. You're making noise because you're afraid... afraid of the signal. You’re afraid of change. I don’t know the future. I didn’t come here to tell you how this is going to end. I know the past. I came here to tell how it began. It began with aji.

Archi3 · 30/10/2017, 20h20

ah tu crois? mais ce n'est pas une réponse à la question !!

invite6c250b59 · 30/10/2017, 21h43

Justement, un programme vraiment futé saurait que répondre à ta préoccupation est plus important que de répondre au pied de la lettre à ta question. Dans la même veine: si tu demandes à une IA si elle est capable de se lécher les parties, et qu'elle te répond "oui", je ne pense pas que tu seras très impressionné par son intelligence.* Si en revanche elle te répond quelque chose comme "miaou", ce sera dur de ne pas rire avec elle.

Mais on s'éloigne d'alphago zéro original edition...

*(et me dit pas que personne ne poserait cette question, les capacités sexuelles sont un marronnier des discussions sur l'IA forte)

Archi3 · 31/10/2017, 07h45

certes, mais je serais curieux de savoir comment tu évalues une durée de 15 ans sur la capacité d'une machine à comprendre ce genre de question et à faire ce genre de blague, vu que pour le moment on n'a absolument rien de ce genre, y compris avec AlphaGO. c'est comme si un escargot avait mis un certain temps à arriver péniblement à se déplacer de 1km dans une direction X et que tu voulais en déduire le temps qu'il mettrait à se déplacer dans la direction Z verticale.

**pm42** · 31/10/2017, 07h56

Envoyé par Archi3

certes, mais je serais curieux de savoir comment tu évalues une durée de 15 ans sur la capacité d'une machine à comprendre ce genre de question et à faire ce genre de blague, vu que pour le moment on n'a absolument rien de ce genre, y compris avec AlphaGO. c'est comme si un escargot avait mis un certain temps à arriver péniblement à se déplacer de 1km dans une direction X et que tu voulais en déduire le temps qu'il mettrait à se déplacer dans la direction Z verticale.

Il ne fait rien de cela. Sa phrase est :

Envoyé par Jiav

Personnellement je serais autant surpris si cela prenait plus que 15 ans ou moins que 15 mois.

Donc si cela prend plus de 15 ans, il sera personnellement surpris mais n'aura jamais affirmé que cela en prendrait moins.

On peut également remarquer qu'il est le seul ici à connaitre le sujet et à dépasser les imprécations habituelles qu'on lit chaque fois qu'il s'agit d'IA.

Archi3 · 31/10/2017, 08h01

ok mais je me demande juste comment il évalue la durée au dessus de laquelle il se considérerait comme surpris. Moi personnellement je ne me sentirai pas surpris si on n'a toujours aucune machine capable de faire ce genre de blague dans 15 ans.

**Deedee81** · 31/10/2017, 08h18

Salut,

Envoyé par Archi3

Moi personnellement je ne me sentirai pas surpris si on n'a toujours aucune machine capable de faire ce genre de blague dans 15 ans.

En fait, on en a déjà

Mais c'est vrai que c'est des programmes réalisé dans ce but (analyse sommaire de la structure des questions, phrases types,....). Il y en a même déjà qui ont fait de très bons scores au test de Turing. J'ai discuté avec une telle I.A. qui n'arrête pas de te narguer, de se moquer de toi,.... Bluffant.
Mais elles ne sont pas intelligentes au sens où on l'entend.
C'est pourquoi les débats ont repris sur la manière de déterminer l'intelligence d'une I.A. généraliste.

A lire : http://www.pourlascience.fr/ewb_page...asse-38479.php
Excellent article.

Archi3 · 31/10/2017, 08h28

Un truc tout bête : imagine-t-on un alpha go pour lequel les règles du jeu de go n'ont pas été programmées par des programmeurs, mais expliquées en langage humain ? cela revient à dire : imagine-t-on un programme capable de jouer à n'importe quel jeu dont on lui aurait expliqué les règles en langage humain ?

**Deedee81** · 31/10/2017, 08h48

Envoyé par Archi3

Un truc tout bête : imagine-t-on un alpha go pour lequel les règles du jeu de go n'ont pas été programmées par des programmeurs, mais expliquées en langage humain ? cela revient à dire : imagine-t-on un programme capable de jouer à n'importe quel jeu dont on lui aurait expliqué les règles en langage humain ?

C'est amusant mais j'avais déjà imaginé quelque chose comme ça il y a une trentaine d'année. Enfin, bon, pas en langage naturel évidemment. J'avais imaginé un langage formel permettant de décrire tout type de règles d'un jeu. Mais écrire le programme derrière c'est autres chose (surtout quand on n'a pas d'apprentissage profond). Là je ne serais pas surpris qu'on en soit très proches.
Ensuite on peut aussi maintenant avoir une analyse performante du langage naturel (pour se passer du langage formel).

Je sens bien qu'on verra ce genre de chose dans très peu de temps.

Mais même là, on est encore trèèèèès éloigné d'une intelligence généraliste. Sur ce point je suis totalement d'accord avec toi. Je ne serais pas surpris si dans quinze ans on n'avait toujours pas quelque chose de solide dans ce domaine (mais je ne serais pas surpris du contraire non plus, la vitesse à laquelle ce genre de chose avance est parfois étonnante et totalement imprévisible).

**pm42** · 31/10/2017, 08h59

Envoyé par Deedee81

Ensuite on peut aussi maintenant avoir une analyse performante du langage naturel (pour se passer du langage formel).

Oui. On pourrait sans doute faire quelque chose d'impressionnant en couplant ce qu'on sait déjà faire en NLP/NLU.
Maintenant, quand on dit "n'importe quel jeu", on s'approche beaucoup d'une IA forte et là, les prédictions sont plus que difficiles à faire.

Si on se limite aux jeux classiques de plateau/stratégie, alors on n'en est plus forcément loin même si l'intérêt n'est pas forcément évident. Pour parler avec des humains, on utilise leur langue. Pour parler avec des physiciens, on utilise les maths. Pour parler avec un ordinateur et lui apprendre des règles, on a un langage largement plus efficace que le langage naturel qui est la programmation.

**Deedee81** · 31/10/2017, 09h40

Envoyé par pm42

Maintenant, quand on dit "n'importe quel jeu", on s'approche beaucoup d'une IA forte et là, les prédictions sont plus que difficiles à faire.
Si on se limite aux jeux classiques de plateau/stratégie, alors on n'en est plus forcément loin même si l'intérêt n'est pas forcément évident. Pour parler avec des humains, on utilise leur langue. Pour parler avec des physiciens, on utilise les maths. Pour parler avec un ordinateur et lui apprendre des règles, on a un langage largement plus efficace que le langage naturel qui est la programmation.

Oui, je pensais au jeux classiques (y compris probabiliste, comme les cartes) dans mon explication précédente.

**mh34** · 31/10/2017, 10h22

Envoyé par Jiav

Non, ma phrase est bien pour l'intelligence au sens large.

ok

Si, mais ce n'est pas la performance qui est impressionnante (enfin si, c'est très très très impressionnant, mais ce n'est quand même pas ça l'information principale).

Je ne comprends pas ; en quoi est-ce impressionnant qu'une machine conçue pour calculer...calcule?
Es-tu impressionné par le fait qu'un ordinateur puisse résoudre rapidement des équations de degré supérieur à 5, chose qui prendrait à l'humain beaucoup plus de temps?
Et si ce n'est pas pareil, est-ce que tu peux m'expliquer la différence entre les deux?

Regarde ce vieux message:

Là non plus je ne comprends pas où tu veux en venir.

De façon générale, je ne comprends absolument pas pourquoi on s'extasie sur les performances d'un ordinateur qui arrive à battre l'humain au Go. Voilà.

**Deedee81** · 31/10/2017, 10h42

Envoyé par mh34

De façon générale, je ne comprends absolument pas pourquoi on s'extasie sur les performances d'un ordinateur qui arrive à battre l'humain au Go. Voilà.

Pour moi :

- d'un point de vue technique. C'est plus les techniques employées qui sont étonnantes (et qui suscitent l'admiration) : apprentissage profond, auto-apprentissage. On a vu exploser leurs applications avec d'énormes progrès (le Go n'en est que la vitrine) dans le traitement d'images, le traitement du langage naturel,...
- du point de vue du Go. C'était le "dernier" jeu de ce type (jeu de somme nulle à information parfaite) qui résistait à l'ordinateur. Les techniques classiques (dames, échecs,...) sont basé sur une analyse arborescente. Or au Go, c'est pratiquement impossible : chaque coup a (au début) environ 400 possibilités. Rien qu'à quatre niveau, en exhaustif, ça donne 25 milliards de possibilités. Et l'analyse de stratégies typiques au Go (comme les séquences "en escalier", la fermeture de territoires,...) nécessitent typiquement une analyse à une vingtaine de niveaux ou plus. Les techniques utilisées étaient donc heuristiques, en quelque sorte par programmation des "proverbes" https://fr.wikipedia.org/wiki/Proverbes_de_go Mais les résultats restaient très médiocres. Même un faible joueur pouvait écraser le programme. La sortie d'un programme qui non seulement est bon mais écrabouille littéralement le champion du monde est donc forcément spectaculaire.

invite6486d7bd · 31/10/2017, 12h03

Envoyé par mh34

De façon générale, je ne comprends absolument pas pourquoi on s'extasie sur les performances d'un ordinateur qui arrive à battre l'humain au Go. Voilà.

Parce-que ce n'est pas l'ordinateur qui bat l'humain, mais la simulation du réseau de neurones.
On peut tout à fait imaginer se passer de l'ordinateur une fois cette étape accomplie (faire tourner la simulation virtuelle sur un ordinateur) et employer des réseaux de neurone physiques.
ici, pour ma part, ce qui est impressionnant, c'est qu'on a trouvé une méthode (à voir maintenant dans quelle mesure elle est généralisable et sans les détails, qui me sont inconnus, je n'ai pas plus d'avis sur la question)

Enfin, je dis ça mais tout le monde ne va pas être impressionné pour les mêmes raisons non plus.

Archi3 · 31/10/2017, 12h33

Envoyé par Deedee81

C'est amusant mais j'avais déjà imaginé quelque chose comme ça il y a une trentaine d'année. Enfin, bon, pas en langage naturel évidemment.

"évidemment", oui, mais c'est précisément pour ça que je disais "en langage naturel" ...

**Deedee81** · 31/10/2017, 12h33

Envoyé par LeMulet

On peut tout à fait imaginer se passer de l'ordinateur une fois cette étape accomplie (faire tourner la simulation virtuelle sur un ordinateur) et employer des réseaux de neurone physiques.

D'autant que commencent à sortir sur le marché des puces avec un grand nombre de neurones formels. De quoi faire des progrès exponentiels.

AlphaGO Zéro

AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Re : AlphaGO Zéro

Discussions similaires

alphago