Bonjour, cliquez-ici pour vous inscrire et participer au forum.
  • Login:



+ Répondre à la discussion
Page 2 sur 2 PremièrePremière 2
Affichage des résultats 16 à 27 sur 27

alphago

  1. minushabens

    Date d'inscription
    juillet 2014
    Messages
    5 459

    Re : alphago

    Citation Envoyé par Deedee81 Voir le message
    De plus, ça doit être un des derniers jeux déterministe à information parfaite (*), purement cérébral, et où l'homme était encore supérieur à la machine.
    Le dernier bastion vient de tomber.
    cette remarque m'inspire la question suivante: si on rend le jeu plus compliqué (tableau plus grand peut-être, ou nouvelles contraintes) ça favorise l'ordinateur ou bien l'humain?

    -----

     


    • Publicité



  2. Topix

    Date d'inscription
    janvier 2016
    Messages
    515

    Re : alphago

    Donc, ce n'est pas encore le cas. Mais Street Fighter est un simple jeu de combat en 2 dimensions.
     

  3. Jiav

    Date d'inscription
    juillet 2004
    Messages
    8 263

    Re : alphago

    Citation Envoyé par minushabens Voir le message
    cette remarque m'inspire la question suivante: si on rend le jeu plus compliqué (tableau plus grand peut-être, ou nouvelles contraintes) ça favorise l'ordinateur ou bien l'humain?
    Excellente question. Comme mentionné plus haut on peut modifier alphago assez facilement pour qu'il apprenne à jouer sur un damier plus grand ou avec de nouvelles contraintes. Par contre il n'a qu'une seule façon d'apprendre et il n'apprend pas à apprendre.

    Tant que le jeu est relativement similaire (par exemple changer le komi, ou les règles pour compter le score, ou donner des pierres, etc.) et que le poids en calcul n'est pas trop grand, je miserais que ce programme va apprendre beaucoup plus vite que l'humain à ressource égale et beaucoup beaucoup beaucoup plus vite à temps égal.

    Mais on peut probablement trouver des règles de jeu tel que la recherche sauce alphago ne soit pas adaptées. Un exemple simple serait d'imposer un damier d'une taille déraisonnable, par exemple 190*190. Dans ce cas la taille de calcul est tellement élevée qu'on peut montrer qu'une variante d'alphago ne serait pas capable de compléter beaucoup de parties (à capacité constante par rapport à aujourd'hui) et donc aurait un apprentissage très lent. A l'inverse les humains pourraient probablement réutiliser les raisonnements forgés sur damier 19*19 (en terme de zone d'influence, etc.) pour performer mieux que alphagobis, du moins pendant un temps. Dans ce cas alphago progressera quand même, mais il sera à la remorque des humains pour découvrir le jeu.

    Ne pas oublier qu'alphago a découvers le jeu d'abord par imitation du jeu humain. Il n'est pas encore claire si on serait capable de lui faire atteindre le même niveau sans cette base de connaissance initiale.
    The opposite of a deep truth may well be another deep truth. Information is physical.
     

  4. Jiav

    Date d'inscription
    juillet 2004
    Messages
    8 263

    Re : alphago

    Citation Envoyé par Topix Voir le message
    Donc, ce n'est pas encore le cas. Mais Street Fighter est un simple jeu de combat en 2 dimensions.
    Ce n'était qu'un pointeur sur le fait que deepmind (la société qui a produit alphago) s'intéresse au jeu vidéo en tant que terrain de jeu sur le reinforcement learning (un concept d'apprentissage un peu intermédiaire entre l'apprentissage supervisé et non supervisé). Sans rentrer dans les détails techniques, ce qui les intéresse est d'avoir un programme multitâche capable d'apprendre un peu n'importe quoi simplement à partir d'essai/erreur et d'une fonction récompense qui peut être très tard par rapport au jeu. Deepmind a ainsi obtenu des succès impressionnants sur une série de jeu atari en 2D. Ce qui était impressionnant n'était pas de les résoudre, mais qu'un même programme qui n'ai aucune information préalable sur ces jeux soit capable de tous les apprendre simplement à partir des contrôles de jeu et de l'écran. Cela laisse supposer qu'on pourrait un jour avoir un programme multitâche beaucoup plus flexible qu'alphago et capable d'apprendre des 'jeux' plus concrets (diagnostic automatique, contrôle robotique, etc.). Sauf erreur c'est cette réussite qui a convaincu google (maintenant alphabet) d'acheter deep_mind.

    Par contre ces succès ne sont pas homogènes selon les jeux (par exemple je ne suis pas convaincu qu'alphago soit un exemple de reinforcement learning même s'ils utilisent ce terme dans leur papier) et en particulier les jeux 3D semblent être plus exigeants et demander une infrastructure visuelle spécifique. Bref, tout ça pour dire: si street fighter (que je ne connais pas) est un jeu 2D d'atari, il est probablement résolu. Si c'est un jeu 3D, il n'est probablement pas encore résolu (mais on peut s'attendre à une annonce de breakthrough un peu n'importe quand).
    The opposite of a deep truth may well be another deep truth. Information is physical.
     

  5. Topix

    Date d'inscription
    janvier 2016
    Messages
    515

    Re : alphago

    Street Fighter est un jeu de combat en 2D et des compétitions internationales sont organisées entre les meilleurs joueurs. J'ai pris cet exemple, car je pense que ce serait l'un des plus accessibles dans une éventuelle confrontation avec un humain. Dans l'article que vous aviez cité : "We’re really excited to see where our collaboration with Blizzard will take us. While we’re still a long way from being able to challenge a professional human player at the game of StarCraft II, we hope that the work we have done with Blizzard will serve as a useful testing platform for the wider AI research community."

    On sait que ce n'est pas le cas pour un jeu comme StarCraft, mais ce dernier est beaucoup plus complexe comparé à Street Fighter.

    Street Fighter : https://youtu.be/TzemwZnfDjc
     


    • Publicité



  6. Jiav

    Date d'inscription
    juillet 2004
    Messages
    8 263

    Re : alphago

    Ah oui, j'ai déjà joué une variante en arcade quand j'étais petit!

    Je ne pense pas que cela a été fait, mais très franchement ce genre de jeu n'est plus du tout un défi, i.e. ce serait assez facile (comprendre: probablement quelques mois pour un bonhomme tout seul, ou quelques jours/semaines pour une équipe d'experts avec des moyens conséquents) de produire une IA invincible pour un humain. Le truc qui facilite tout c'est qu'il y a une barre de progression que l'IA va pouvoir exploiter pour évaluer les conséquences de ses choix. Le même jeu sans barre de progression serait beaucoup plus difficile (mais probablement pas hors de portée de ce qu'à déjà fait deepmind avec les jeux atari).
    The opposite of a deep truth may well be another deep truth. Information is physical.
     

  7. Topix

    Date d'inscription
    janvier 2016
    Messages
    515

    Re : alphago

    Mince, cette satanée IA désacralise tout

    Merci pour la réponse.
     

  8. EauPure

    Date d'inscription
    avril 2012
    Localisation
    Nîmes
    Messages
    5 089

    Re : alphago

    Il vont pouvoir jouer dans la cour des grands avec leur dernier joujou TPU à 11,53 Petaflops pour l'apprentissage
    chaque TPU intègre une connectivité réseau haut débit permettant de construire des supercalculateurs dédiés au Machine Learning, appelés Pod TPU ». Ils ajoutent : « ce module intègre 64 TPU de seconde génération et peut traiter jusqu’à 11,53 Petaflops pour entraîner les modèles d’apprentissage automatique ».
    http://www.silicon.fr/google-muscle-...ng-175235.html
    La béatitude est l'attitude de l’abbé : la théorie bleue
     

  9. noureddine2

    Date d'inscription
    janvier 2011
    Localisation
    maroc
    Messages
    1 617

    Re : alphago

    Citation Envoyé par Jiav Voir le message
    Ne pas oublier qu'alphago a découvers le jeu d'abord par imitation du jeu humain. Il n'est pas encore claire si on serait capable de lui faire atteindre le même niveau sans cette base de connaissance initiale.
    Bonjour , ce lien parle de
    AlphaGo Zéro .
    https://www.sciencesetavenir.fr/scie...icielle_117516
    "d'apprendre tout seul à jouer au go", précise l'étude.

    Pour s'entraîner, AlphaGo Zero joue contre lui-même, "en partant de 0" sans autre connaissance sur le go que les règles du jeu. Contrairement à AlphaGo, il n'a donc pas eu besoin de se confronter à des humains pour devenir imbattable.
    Ils disent que cet Alphago Zero s'entraîne tout seul et n'a pas besoin d'imiter l'homme pour apprendre .
     

  10. Jiav

    Date d'inscription
    juillet 2004
    Messages
    8 263

    Re : alphago

    Citation Envoyé par noureddine2 Voir le message
    Ils disent que cet Alphago Zero s'entraîne tout seul et n'a pas besoin d'imiter l'homme pour apprendre .
    Oui, c'est une annonce majeure à plusieurs points de vue. En soi la performance est époustouflante:

    Learning progressed smoothly [...] Surprisingly, AlphaGo Zero outperformed AlphaGo Lee after just 36 h. In comparison, AlphaGo Lee was trained over several months. After 72 h, we evaluated AlphaGo Zero against the exact version of AlphaGo Lee that defeated Lee Sedol, under the same 2 h time controls and match conditions that were used in the man–machine match in Seoul (see Methods). AlphaGo Zero used a single machine with 4 tensor processing units (TPUs)29, whereas AlphaGo Lee was distributed over many machines and used 48 TPUs. AlphaGo Zero defeated AlphaGo Lee by 100 games to 0

    Dernière modification par Jiav ; 19/10/2017 à 14h26.
    The opposite of a deep truth may well be another deep truth. Information is physical.
     

  11. pi-r2

    Date d'inscription
    juillet 2004
    Âge
    49
    Messages
    2 119

    Re : alphago

    C'est en effet le début d'une véritable intelligence artificielle qui se reprogramme elle même (ce qui est la clé)
    Les bonnes idées triomphent toujours... C'est à cela qu'on reconnait qu'elles étaient bonnes !
     

  12. Archi3

    Date d'inscription
    novembre 2011
    Messages
    2 000

    Re : alphago

    elle n'a pas du tout appris à jouer au go toute seule : elle a juste produit des parties toute seule au lieu d'étudier celles des humains. Je ne vois vraiment pas le rapport avec le fait de se reprogrammer, elle n'a jamais dit qu'elle voulait essayer les échecs !!
    Le plus dur n'est pas de piger les raisonnements compliqués, mais d'accepter les simples.
     


    • Publicité







Sur le même thème :





 

Discussions similaires

  1. Actu - Jeu de go : une nouvelle version d'AlphaGo a battu le N°1 mondial
    Par RSSBot dans le forum Commentez les actus, dossiers et définitions
    Réponses: 0
    Dernier message: 06/01/2017, 09h30
  2. Actualité - Alphago, de Google : la victoire de l’intelligence artificielle au go
    Par V5bot dans le forum Commentez les actus, dossiers et définitions
    Réponses: 36
    Dernier message: 07/02/2016, 16h03