alphago

invite6c250b59 · 22/05/2017, 22h43

Bonjour,

La revanche avec Ke Jie plutôt que Lee Sedol, ainsi que deux autres formules par équipe, à partir de demain 10h30 UC+8.

http://events.google.com/alphago2017/

Il est notable que, pour Lee Sedol, à peu près tous les connaisseurs en go s'attendaient à une victoire de l'humain. Les attentes ont changé!

A+

**Deedee81** · 23/05/2017, 06h45

Salut,

Le premier match est en cours. Merci de l'info.

invite6c250b59 · 23/05/2017, 18h37

Match très intéressant.

Mon trois cents:
1) Alphago semble avoir progressé particulièrement en ce qui concerne la gestion du temps. Dans les matchs contre Lee Sedol, tous les matchs ont eu l'air relativement faciles, sauf celui perdu par la machine dans lequel le programme s'est mis à faire des coups plus ou moins erratiques après un coup de génie de Lee Sedol. Bien sur il faut mettre le crédit au joueur, mais une des raisons probables de l'effondrement apparent du programme était sa gestion de temps: à peu près le même temps pour chaque coup quel que soit le coup, alors quand est arrivé un coup de génie le programme s'est retrouvé les culottes à terre à devoir rebatir son arbre des possibilités avec un couperet de temps imposé sans égard à la situation (alors qu'il restait plein de temps au chronomètre et qu'il aurait été judicieux de l'utiliser). Là au contraire le programme semble jouer plus rapidement sur certains coups, possiblement afin de se garder une marge de sécurité. Dans ce contexte, pas certain qu'il soit encore possible de déstabiliser la machine par un coup génial.
2) Ke Jie a l'air plus solide que Sedol, ou en tout cas que Sedol a son premier match (ça c'est ma phrase 'ouais Federer il est un peu mou en revers'). Je suis curieux de voir si ce sera suffisant pour gagner une partie. Un truc intéressant c'est qu'il a joué une entrée (point 3X3) qui aurait été considérée une erreur par les experts... avant qu'alphago ne la joue régulièrement. Contrairement à ce qui s'est passé avec deepblue (bravo maintenant on démonte la machine et on a rien à dire de plus sur le jeu d'échec) alphago est déjà en train de rendre les joueurs humains meilleurs en les forçant à réévaluer certains coups. D'une certaine façon Ke Jie est probablement un opposant plus fort qu'il l'était avant la séries master.
3) alphago fait un peu moins de coups 'bêtes but safe' en fin de partie, mais c'est peut-être uniquement du au fait que la partie est demeurée pas trop inégale jusqu'à la fin. Par contre s'il pouvait jouer un peu plus vite en fin de partie quand aucun coup ne demande plus que deux neurones... c'est à faire crisser une craie au tableau!

**Matneops** · 24/05/2017, 08h20

Bonjour,

Je ne pense pas que l'entrée au san san (point 3x3) soit considérée comme une erreur par les professionnels (même avant l'apparition d'alpha go), en effet c'est un des coups possibles très solide qui permet de faire des points rapidement dans le coin. Je pense que Ke jie a voulu jouer éffectivement très solide dans cette partie, connaissant l'habitude qu'a alpha go de jouer plutôt influence.

C'était une super partie avec des coups inventifs.

Ma seule interrogation est sur le réel niveau de alpha go, était il tellement au-dessus qu'il a simplement joué de façon à maintenir un avantage de 0.5 points suffisant pour gagner la partie, où a-t-il gagné de justesse sans pouvoir faire mieux ?

A voir en vidéo sur Futura · Aujourd'hui

invite6c250b59 · 24/05/2017, 12h48

Envoyé par Matneops

a-t-il gagné de justesse sans pouvoir faire mieux ?

Si alphago évalue qu'il a 99.9991% de chances de gagner par 150 points ou 99.9992% de chances de gagner par 0.5 point, il va choisir la seconde option. C'est un choix de programmation qui mène à des coups discutables, en particulier en fin de partie où on peut probablement prouver que certains choix sont sous-optimaux. Cette partie ne fait pas exception et il est presque certain qu'il aurait pu gagner par une marge un peu plus grande (voir en particulier quand le sacrifice de d13)... donc oui quand un média titre 'victoire de justesse', ce n'est pas tout-à-fait aussi juste que le score pourrait laisser penser. En fait il semble qu'alphago était 'confiant' de gagner à peu près dès le milieu de partie.

**Matneops** · 24/05/2017, 13h12

D'accord, merci pour cette réponse. il est de plus en plus difficile d'imaginer une victoire de l'humain.

Peut être envisager de donner une pierre de handicap pour rendre la partie plus équilibrée.

**Deedee81** · 24/05/2017, 13h39

Salut,

Envoyé par Matneops

D'accord, merci pour cette réponse. il est de plus en plus difficile d'imaginer une victoire de l'humain.

De plus, ça doit être un des derniers jeux déterministe à information parfaite (*), purement cérébral, et où l'homme était encore supérieur à la machine.
Le dernier bastion vient de tomber.

Envoyé par Matneops

Peut être envisager de donner une pierre de handicap pour rendre la partie plus équilibrée.

Les parties à handicap existent depuis longtemps et dépendent du classement. Dans des tournois où des humains autant que des machines sont présents, il est évident que cela pourrait s'appliquer aussi.

(*) donc j'exclus les jeux de carte par exemple ou les jeux "physiques" comme le tennis.

invitec830472d · 24/05/2017, 23h44

Je me demande si l'IA du jeu de go ne sait faire que ça ? Je crois que c'est l'IA la plus avancée à l'heure actuelle si je ne dis pas de bêtises ? Ou est-elle suffisamment avancée pour s'adapter spontanément à un jeu très similaire ?

invite6c250b59 · 25/05/2017, 03h24

En lui-même alphago ne sait que jouer au go sur un damier standard, mais l'approche utilisée (combiner un monte-carlo tree search avec des réseaux profonds) représente une avancée généralisable (détails techniques ici). Autrement dit on devrait être capable relativement facilement de produire l'équivalent d'un alphago pour n'importe quel jeu/problème (à condition qu'on soit d'abord capable de générer des réseaux profonds intéressants pour ce jeu/problème).

invite6c250b59 · 25/05/2017, 04h02

Le deuxième est commencé. Les commentaires prématch de David Silver valent de l'or, et les questions du présentateur particulièrement brillantes!

https://www.youtube.com/watch?v=1U1p4Mwis60

**noureddine2** · 25/05/2017, 13h38

Bonjour , alphago a gagné 2 matches contre le chinois Ke Jie , http://www.01net.com/actualites/alph...e-1171886.html
le 3em match est pour Samedi 27 mai .

invite6c250b59 · 25/05/2017, 14h02

Envoyé par Jiav

(à condition qu'on soit d'abord capable de générer des réseaux profonds intéressants pour ce jeu/problème).

Si on en croit les commentaires d'avant match ils ont fait des progrès décisifs dans cet aspect en améliorant l'utilisation du self-play pour diminuer et éventuellement remplacer la base de donnée initiale (c'est souvent le facteur limitant qui empêche d'utiliser l'approche deep learning pour résoudre tel ou tel problème). Bien hâte de voir la publication qu'ils promettent pour les prochains mois.

invitec830472d · 25/05/2017, 14h11

Envoyé par Jiav

En lui-même alphago ne sait que jouer au go sur un damier standard, mais l'approche utilisée (combiner un monte-carlo tree search avec des réseaux profonds) représente une avancée généralisable (détails techniques ici). Autrement dit on devrait être capable relativement facilement de produire l'équivalent d'un alphago pour n'importe quel jeu/problème (à condition qu'on soit d'abord capable de générer des réseaux profonds intéressants pour ce jeu/problème).

Ok, merci.

invitec830472d · 27/05/2017, 23h48

Envoyé par Deedee81

Salut,

De plus, ça doit être un des derniers jeux déterministe à information parfaite (*), purement cérébral, et où l'homme était encore supérieur à la machine.
Le dernier bastion vient de tomber.

Je me demandais si une IA pouvait également battre les champions dans le domaine du jeu vidéo ? Je pense par exemple à un jeu comme Street Fighter : https://youtu.be/TRBEWQsd4LI

invite6c250b59 · 28/05/2017, 04h45

https://deepmind.com/blog/deepmind-a...h-environment/

invite9dc7b526 · 28/05/2017, 08h14

Envoyé par Deedee81

De plus, ça doit être un des derniers jeux déterministe à information parfaite (*), purement cérébral, et où l'homme était encore supérieur à la machine.
Le dernier bastion vient de tomber.

cette remarque m'inspire la question suivante: si on rend le jeu plus compliqué (tableau plus grand peut-être, ou nouvelles contraintes) ça favorise l'ordinateur ou bien l'humain?

invitec830472d · 28/05/2017, 14h26

Envoyé par Jiav

https://deepmind.com/blog/deepmind-a...h-environment/

Donc, ce n'est pas encore le cas. Mais Street Fighter est un simple jeu de combat en 2 dimensions.

invite6c250b59 · 28/05/2017, 16h53

Envoyé par minushabens

cette remarque m'inspire la question suivante: si on rend le jeu plus compliqué (tableau plus grand peut-être, ou nouvelles contraintes) ça favorise l'ordinateur ou bien l'humain?

Excellente question. Comme mentionné plus haut on peut modifier alphago assez facilement pour qu'il apprenne à jouer sur un damier plus grand ou avec de nouvelles contraintes. Par contre il n'a qu'une seule façon d'apprendre et il n'apprend pas à apprendre.

Tant que le jeu est relativement similaire (par exemple changer le komi, ou les règles pour compter le score, ou donner des pierres, etc.) et que le poids en calcul n'est pas trop grand, je miserais que ce programme va apprendre beaucoup plus vite que l'humain à ressource égale et beaucoup beaucoup beaucoup plus vite à temps égal.

Mais on peut probablement trouver des règles de jeu tel que la recherche sauce alphago ne soit pas adaptées. Un exemple simple serait d'imposer un damier d'une taille déraisonnable, par exemple 190*190. Dans ce cas la taille de calcul est tellement élevée qu'on peut montrer qu'une variante d'alphago ne serait pas capable de compléter beaucoup de parties (à capacité constante par rapport à aujourd'hui) et donc aurait un apprentissage très lent. A l'inverse les humains pourraient probablement réutiliser les raisonnements forgés sur damier 19*19 (en terme de zone d'influence, etc.) pour performer mieux que alphagobis, du moins pendant un temps. Dans ce cas alphago progressera quand même, mais il sera à la remorque des humains pour découvrir le jeu.

Ne pas oublier qu'alphago a découvers le jeu d'abord par imitation du jeu humain. Il n'est pas encore claire si on serait capable de lui faire atteindre le même niveau sans cette base de connaissance initiale.

invite6c250b59 · 28/05/2017, 17h14

Envoyé par Topix

Donc, ce n'est pas encore le cas. Mais Street Fighter est un simple jeu de combat en 2 dimensions.

Ce n'était qu'un pointeur sur le fait que deepmind (la société qui a produit alphago) s'intéresse au jeu vidéo en tant que terrain de jeu sur le reinforcement learning (un concept d'apprentissage un peu intermédiaire entre l'apprentissage supervisé et non supervisé). Sans rentrer dans les détails techniques, ce qui les intéresse est d'avoir un programme multitâche capable d'apprendre un peu n'importe quoi simplement à partir d'essai/erreur et d'une fonction récompense qui peut être très tard par rapport au jeu. Deepmind a ainsi obtenu des succès impressionnants sur une série de jeu atari en 2D. Ce qui était impressionnant n'était pas de les résoudre, mais qu'un même programme qui n'ai aucune information préalable sur ces jeux soit capable de tous les apprendre simplement à partir des contrôles de jeu et de l'écran. Cela laisse supposer qu'on pourrait un jour avoir un programme multitâche beaucoup plus flexible qu'alphago et capable d'apprendre des 'jeux' plus concrets (diagnostic automatique, contrôle robotique, etc.). Sauf erreur c'est cette réussite qui a convaincu google (maintenant alphabet) d'acheter deep_mind.

Par contre ces succès ne sont pas homogènes selon les jeux (par exemple je ne suis pas convaincu qu'alphago soit un exemple de reinforcement learning même s'ils utilisent ce terme dans leur papier) et en particulier les jeux 3D semblent être plus exigeants et demander une infrastructure visuelle spécifique. Bref, tout ça pour dire: si street fighter (que je ne connais pas) est un jeu 2D d'atari, il est probablement résolu. Si c'est un jeu 3D, il n'est probablement pas encore résolu (mais on peut s'attendre à une annonce de breakthrough un peu n'importe quand).

invitec830472d · 28/05/2017, 18h25

Street Fighter est un jeu de combat en 2D et des compétitions internationales sont organisées entre les meilleurs joueurs. J'ai pris cet exemple, car je pense que ce serait l'un des plus accessibles dans une éventuelle confrontation avec un humain. Dans l'article que vous aviez cité : "We’re really excited to see where our collaboration with Blizzard will take us. While we’re still a long way from being able to challenge a professional human player at the game of StarCraft II, we hope that the work we have done with Blizzard will serve as a useful testing platform for the wider AI research community."

On sait que ce n'est pas le cas pour un jeu comme StarCraft, mais ce dernier est beaucoup plus complexe comparé à Street Fighter.

Street Fighter : https://youtu.be/TzemwZnfDjc

invite6c250b59 · 28/05/2017, 19h35

Ah oui, j'ai déjà joué une variante en arcade quand j'étais petit!

Je ne pense pas que cela a été fait, mais très franchement ce genre de jeu n'est plus du tout un défi, i.e. ce serait assez facile (comprendre: probablement quelques mois pour un bonhomme tout seul, ou quelques jours/semaines pour une équipe d'experts avec des moyens conséquents) de produire une IA invincible pour un humain. Le truc qui facilite tout c'est qu'il y a une barre de progression que l'IA va pouvoir exploiter pour évaluer les conséquences de ses choix. Le même jeu sans barre de progression serait beaucoup plus difficile (mais probablement pas hors de portée de ce qu'à déjà fait deepmind avec les jeux atari).

invitec830472d · 28/05/2017, 19h59

Mince, cette satanée IA désacralise tout

Merci pour la réponse.

inviteb6b93040 · 05/06/2017, 11h51

Il vont pouvoir jouer dans la cour des grands avec leur dernier joujou TPU à 11,53 Petaflops pour l'apprentissage

chaque TPU intègre une connectivité réseau haut débit permettant de construire des supercalculateurs dédiés au Machine Learning, appelés Pod TPU ». Ils ajoutent : « ce module intègre 64 TPU de seconde génération et peut traiter jusqu’à 11,53 Petaflops pour entraîner les modèles d’apprentissage automatique ».
http://www.silicon.fr/google-muscle-...ng-175235.html

**noureddine2** · 19/10/2017, 10h13

Envoyé par Jiav

Ne pas oublier qu'alphago a découvers le jeu d'abord par imitation du jeu humain. Il n'est pas encore claire si on serait capable de lui faire atteindre le même niveau sans cette base de connaissance initiale.

Bonjour , ce lien parle de
AlphaGo Zéro .
https://www.sciencesetavenir.fr/scie...icielle_117516

"d'apprendre tout seul à jouer au go", précise l'étude.

Pour s'entraîner, AlphaGo Zero joue contre lui-même, "en partant de 0" sans autre connaissance sur le go que les règles du jeu. Contrairement à AlphaGo, il n'a donc pas eu besoin de se confronter à des humains pour devenir imbattable.

Ils disent que cet Alphago Zero s'entraîne tout seul et n'a pas besoin d'imiter l'homme pour apprendre .

invite6c250b59 · 19/10/2017, 13h25

Envoyé par noureddine2

Ils disent que cet Alphago Zero s'entraîne tout seul et n'a pas besoin d'imiter l'homme pour apprendre .

Oui, c'est une annonce majeure à plusieurs points de vue. En soi la performance est époustouflante:

Learning progressed smoothly [...] Surprisingly, AlphaGo Zero outperformed AlphaGo Lee after just 36 h. In comparison, AlphaGo Lee was trained over several months. After 72 h, we evaluated AlphaGo Zero against the exact version of AlphaGo Lee that defeated Lee Sedol, under the same 2 h time controls and match conditions that were used in the man–machine match in Seoul (see Methods). AlphaGo Zero used a single machine with 4 tensor processing units (TPUs)29, whereas AlphaGo Lee was distributed over many machines and used 48 TPUs. AlphaGo Zero defeated AlphaGo Lee by 100 games to 0

invitedb5bdc8a · 22/10/2017, 19h07

C'est en effet le début d'une véritable intelligence artificielle qui se reprogramme elle même (ce qui est la clé)

Archi3 · 01/11/2017, 05h15

elle n'a pas du tout appris à jouer au go toute seule : elle a juste produit des parties toute seule au lieu d'étudier celles des humains. Je ne vois vraiment pas le rapport avec le fait de se reprogrammer, elle n'a jamais dit qu'elle voulait essayer les échecs !!

alphago

alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago

Re : alphago