IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Jeu de Go : les développeurs s'imposent face à Lee Sedol
L'IA de Google terrasse la star du Go par un score de 4-1

Le , par Michael Guilloux

65PARTAGES

7  0 
Une intelligence artificielle réussira-t-elle à battre le meilleur joueur du monde au jeu de go ?
AlphaGo a réussi à battre le champion d'Europe

Mise à jour du 09 / 03 / 2016 : première manche sur cinq remportée par AlphaGo

Face au programme AlphaGo, le Sud-Coréen Lee Sedol a reconnu sa défaite pour une première manche de 186 tours qui aura duré un peu plus de trois heures. Il y a six mois, AlphaGo remportait cinq manches à zéro contre Fan Hui, le meilleur joueur d'Europe. Contrairement à cette partie, l'affrontement a été extrêmement serré ; les commentateurs ont parlé d'un jeu qui a été « agressif » des deux côtés.

Si Lee Sedol avait déclaré avec enthousiasme être « confiant et pense que je pourrai gagner, au moins cette fois-ci », lors d'une conférence de presse qui a eu lieu hier à Séoul, il a avancé avec prudence « aujourd'hui, je sais comment son algorithme a réussi à réduire le nombre de choix possibles. J'ai le sentiment qu'AlphaGo peut, dans une certaine mesure, imiter l'intuition humaine ».

Les prochaines manches auront lieu les 10, 12, 13 et 15 mars 2016.


Source : YouTube
Né il y a plusieurs milliers d'années en Chine et très populaire en Extrême-Orient (Japon, Chine et Corée, essentiellement), le jeu de go est un jeu où s'opposent deux joueurs qui vont s'affronter sur un plateau (le goban) armés de jetons noirs et blancs (les pierres). Tour à tour, les joueurs posent leurs pierres sur les intersections du goban, composé de 19 lignes sur 19, le but étant de contrôler avec ces pierres la plus grande surface possible du plateau.

Des règles qui s'avèrent donc plutôt simples même si, pour un ordinateur, la faculté d'en maîtriser les mécanismes, notamment via une résolution formelle par une recherche arborescente (qui est à la base de la plupart des algorithmes utilisés pour les programmes de jeux à deux joueurs) va s'avérer plus complexe par exemple que s'il s'agissait d'un jeu du morpion, de dames anglaises ou d'échecs. Pour quelle raison ? Le nombre de configurations possibles : il y en a 10 puissance 3 pour le jeu du morpion (sur une grille de 10×10 au lieu de 3×3, avec l'objectif d'aligner 6 pions au lieu de 3), 10 puissance 20 pour le jeu des dames anglaises, 10 puissance 50 pour le jeu d'échecs et 10 puissance 171 pour le jeu de go.

Si en 1997, Deep Blue, un super-ordinateur construit par IBM, a battu aux échecs le champion du monde, Garry Kasparov, l'histoire n'est pas la même pour le jeu de go. Malgré les énormes progrès faits en intelligence artificielle, le programme japonais Zen était considéré comme le meilleur au monde bien qu'il restait très loin du niveau des meilleurs joueurs professionnels. Cette intelligence artificielle se basait sur l’évaluation de la pertinence des coups en simulant des milliers de parties, approche qui a été améliorée grâce à la recherche arborescente Monte-Carlo.

Cette méthode consiste à systématiquement explorer les branches de l'arbre jusqu'à une position terminale pour contourner l'une des difficultés essentielles du go : la définition d'une bonne fonction d'évaluation heuristique. Cependant, étant donné le grand nombre de parties possibles, cette approche ne peut pas explorer exhaustivement toutes les possibilités : il faut donc choisir un sous-ensemble des parties possibles. Se posent alors deux problèmes essentiels : comment choisir celles qu'on explore parmi toutes les possibilités ? Étant donné les séquences observées et leur résultat (gagné ou perdu, dans le cas du go), comment déterminer le meilleur coup ?

Un des algorithmes les plus primitifs consiste à simplement choisir les coups aléatoirement, et à évaluer chaque position par la moyenne du résultat de toutes les parties aléatoires qui passent par cette position. Pour chacun des coups possibles, la moyenne des résultats des parties obtenues après avoir joué ce coup donne une estimation de sa valeur. Il suffit ensuite de choisir le coup qui mène vers la position qui a la meilleure moyenne. Pour donner un ordre de grandeur, les meilleurs programmes actuels parviennent à générer plusieurs dizaines de milliers de parties aléatoires par seconde sur un PC puissant.

En octobre 2015, pour la première fois, une intelligence artificielle a battu un joueur professionnel sur un plateau de taille normal : AlphaGo, un programme développé par la filiale DeepMind (une entreprise britannique créée en 2010 et qui a été rachetée en 2014 par Google) a battu par 5 parties à 0 le joueur professionnel français Fan Hui, 2e dan (sur 9 au maximum) et meilleur joueur d’Europe. Il n’a en outre perdu qu’une partie sur 500 contre les meilleurs programmes déjà sur le marché. C'est dans les parties rapides Fan Hui a mieux résisté, perdant 3 à 2. Les progrès liés à la victoire d’AlphaGo n’étaient pas attendus avant une dizaine d’années dans le milieu de l’intelligence artificielle.

AlphaGo se sert également de cette technique d'exploration, mais la combine à deux autres ingrédients secrets : les deep learning (réseaux de neurones profonds) et l’apprentissage renforcé. Le deep learning est une fonction mathématique aux paramètres ajustables de manière à fournir la meilleure réponse possible. En réalité, cette fonction est en fait la combinaison de milliers de variables reliées entre elles comme un réseau de neurones biologiques. L'apprentissage renforcé, qui est une spécialité de DeepMind, consiste à faire jouer l’algorithme contre lui-même pour améliorer le réseau neuronal.

L’équivalent pour le go de la rencontre mythique qui a opposé l'ordinateur d'IBM Deep Blue au meilleur joueur d'échecs du monde en 1997, le Russe Garry Kasparov, est annoncé par Google DeepMind le 9 mars prochain à Séoul où il affrontera le meilleur joueur du monde actuel : le Sud-Coréen, Lee Sedol, 9e dan.

« J’aurai le privilège d’affronter pour la première fois un ordinateur. J’ai entendu dire qu’AlphaGo est étonnamment fort et s’améliorera encore, mais je suis confiant que je pourrai gagner, au moins cette fois-ci », a déclaré Lee Sedol par l’entremise de la revue Nature.

Si la victoire contre Fan Hui est impressionnante, ce joueur est classé 633e meilleur joueur au monde, bien loin donc du meilleur niveau mondial.

Source : Nature (maîtriser le jeu de Go avec les réseaux neuronaux profonds et l'exploration des arbres), le jeu de go et la révolution de Monte-Carlo

Et vous ?

Quels sont vos pronostics ? Pour quelles raisons ?

Voir aussi :

forum Intelligence Artificielle
Vous avez lu gratuitement 4 articles depuis plus d'un an.
Soutenez le club developpez.com en souscrivant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Avatar de Uther
Expert éminent sénior https://www.developpez.com
Le 28/11/2019 à 4:49
Je trouve dommage que Lee Se-Dol finisse ça carrière pour ça.

L'IA n'a pas de raison de signer la fin ce l’intérêt des humains pour un jeu. En tout cas, ça n'a pas été le cas pour les échecs, ni pour la course a pied après l'invention des moteurs. Il faut juste admettre que l'on est pas dans la même catégorie.
10  0 
Avatar de dlewin
Membre confirmé https://www.developpez.com
Le 16/03/2016 à 15:31
Citation Envoyé par BufferBob Voir le message
"aujourd'hui, Lee Sedol n'est plus que l'ombre de lui-même, carburant aux antidépresseurs et soumis à de violentes poussées d'urticaires, celui que l'humanité toute entière surnomme désormais « l'homme par qui le scandale est arrivé » vit reclus, passant ses journées à regarder des émissions de Cyril Hanouna emmitouflé dans une couette sale.
Dans un accès de rage incontrôlée, alors que des enfants de son quartier lui jetaient des cailloux, il aurait dit-on lancé d'un ton vindicatif mêlé de désespoir cette phrase avant de rentrer chez lui pour tenter de se faire sepuku avec un couteau à beurre : « monde de merde ! »"
Lorsque la police est entré dans l'appartement de "LeeSer", comme il était surnommé sur Facebook et Twitter ,celle-ci à découvert avec horreur que Lee Sedol bien qu'ayant déjà raté son 1er sepuku à pourtant faillit réussir sa seconde tentative. Sans l'intervention d'un voisin alerté par le bruit, M. Sedol ne serait plus vivant. En effet, vers 2h du matin, un énorme fracas aurait réveillé le voisin du dessous, mais c'est surtout la musique qui l'à alerté. En pénétrant de force dans les locaux, les policiers ont en effet découvert que cette inquiétude était justifiée puisque dans un acte insensé M. Sedol voulait en finir avec ses jours par pendaison en s’élevant symboliquement sur une montagne de jetons de go (5650 au total) qu'il aurait retiré par la suite avec les pieds après s'être passé la corde au cou. Fort heureusement, la corde étant de fabrication Chinoise, celle ci n'a pas tenu longtemps et M. Sedol est donc violemment tombé au sol causant le fracas.
Après avoir été interrogé par la police sur la raison d'avoir passé du Céline Dion en boucle, M. Sedol à déclaré
j'avais ainsi toutes les chances d'en finir
Ironie du sort ? Pour une raison encore indéterminée, le lecteur audio se serait bloqué suite à une faille dans le code du firmware: "Grâce au cas Sedol nous avons pu trouver un correctif"
à alors déclaré le responsable des développements chez Google ...
8  1 
Avatar de
https://www.developpez.com
Le 28/11/2019 à 8:21
Je vous trouve un peu prompt à juger de ses motivations et que vous sous estimez l'impact de ne pas pouvoir être le meilleur. Si vous avez fait de la compétition dans votre vie vous devriez comprendre que ça peut être une grande source de frustration et que de se dire "ok je serais le meilleur des humains" sonne comme se résoudre à la défaite.

De plus vous projetez notre culture occidentale sur un mec Sud-Coréen, ils n'ont absolument pas le même rapport que nous au succès ou à la victoire.

Et puis tout simplement il a 36 ans et ça fait 24 ans qu'il est joueur professionnel, il peut très bien se dire qu'il est au max et qu'il veut s'arrêter au sommet.
7  0 
Avatar de BufferBob
Expert éminent https://www.developpez.com
Le 16/03/2016 à 8:40
Citation Envoyé par Michael Guilloux Voir le message
Avant d’affronter AlphaGo, Lee Sedol était très optimiste et se voyait battre le programme d’IA face auquel il ne pensait pas perdre plus d’une manche sur la série de cinq.
"aujourd'hui, Lee Sedol n'est plus que l'ombre de lui-même, carburant aux antidépresseurs et soumis à de violentes poussées d'urticaires, celui que l'humanité toute entière surnomme désormais « l'homme par qui le scandale est arrivé » vit reclus, passant ses journées à regarder des émissions de Cyril Hanouna emmitouflé dans une couette sale.
Dans un accès de rage incontrôlée, alors que des enfants de son quartier lui jetaient des cailloux, il aurait dit-on lancé d'un ton vindicatif mêlé de désespoir cette phrase avant de rentrer chez lui pour tenter de se faire sepuku avec un couteau à beurre : « monde de merde ! »"
8  2 
Avatar de BufferBob
Expert éminent https://www.developpez.com
Le 18/03/2016 à 22:08
Citation Envoyé par Matthieu Vergne Voir le message
C'est rare les sujets qui flanchent autant dans la parodie. {°.°}~
c'est pas faux, il est bien plus courant de voir des discussions qui tournent au combat de coq bien codifié, si on pouvait rester sur des terrains connus et éviter de flancher svp...

Est-ce que c'est l'obsolescence de la question titre du sujet qui fait que tout le monde s'en fout maintenant ? Où il y a d'autres facteurs en jeux ?
l'obsolescence de la question titre du sujet je sais pas, perso c'est juste que sorti de l'info en elle-même ("machin a perdu" ben je vois pas grand chose de transcendant à dire, y'a même plus de pronostic d'expert à émettre puisque le match est terminé

après chacun voit midi à sa porte, y'en a probablement qui adorent discourir longuement en tournant autour d'un pot qui n'existe plus, il en faut pour tous les gouts, j'espère simplement qu'on me tiendra pas rigueur d'une poignée de lignes sur un ton qui se prend moins au sérieux

et puis faut avouer, le champion humain qui se fait ramasser et après coup cherche des excuses en expliquant que la machine, elle, ne se fatigue pas, ne ressent pas le stress etc. comme si il ne le savait pas avant le match, comme si il avait besoin de se justifier, comme si son honneur était en jeu, bref ça m'a fait marrer :p

note-à-moi-même: l'IA parviendra-t-elle en premier à remplacer les développeurs ou à comprendre une blague ?
5  1 
Avatar de dlewin
Membre confirmé https://www.developpez.com
Le 21/03/2016 à 12:28
Citation Envoyé par Matthieu Vergne Voir le message
C'est rare les sujets qui flanchent autant dans la parodie. {°.°}~

Est-ce que c'est l'obsolescence de la question titre du sujet qui fait que tout le monde s'en fout maintenant ? Où il y a d'autres facteurs en jeux ?
En parler ce n'est jamais "s'en foutre", puisqu'on n'ignore pas le sujet. Au contraire, l'histoire s'est arrêtée avec la victoire de la machine et nous la continuons avec une fiction partie de BufferBob que je trouve très drôle et bien plus sympa que les trolls habituels qui eux dévient sur un sujet différent et de façon désagréable.

Cela n'enlève en rien cette avancée de l'IA que je trouve déterminante car le GO est resté le bastion bien gardé de la recherche : la compléxité du jeu rend difficile le déterminisme des algorithmes (stocastique), d’où le reinforcement learning qui à l'avantage de se baser sur très peu de valeurs (30 millions de déplacements) mais est largement autonome, puisque nous sommes dans un apprentissage non supervisé. N'en déplaise il y à eut un après Deep blue, il y maintenant un après AlphaGo.

Par ailleurs je rappelle juste que c'est la course aux données est le nouvel eldorado : big data, deep learning, machine learning . ... tous les empires industriels sont à 200% dessus : NVIDIA, Amazon[1], Facebook, Microsoft (incluant IA+Win10), Google et même Elon musk qui à une attitude bien ambiguë puisqu'il à quand même lancé son IA. D'ailleurs il est révélateur de voir que les jobs qui arrivent en dev. concernent bien Hadoop, le load balancing, clustering, les containers (Docker,Lxc, etc), les réseaux de neurones principalement, etc etcc
Bref tout un ecosystème bien complet qui à donné déjà raison à Philp K. Dick plusieurs fois.

En reprenant donc ces 2 points, il y à un schéma global qui se dessine : les données - l'interprétation de ces données : Google n'est pas un philanthrope et est suffisamment subtile pour rester en veille technologique (google labs) je vois donc dans cette vitrine technologique qu'est ALphaGo un coup dur pour les autres majors et surtout un pas énorme pour l'IA.

Cependant, on parle souvent de sentiments dans les tests de Turing, mais je rejoins Jankelevitch où l'humour et l'ironie font parties intégrantes de notre humanité car cela n’a aucune utilité (cela ne crée rien aucun process, produit, etc) à part mieux vivre, je trouve donc qu'en rire parfois nous amène notre humanité face aux machines.

On peut, après tout, vivre sans le je-ne-sais-quoi, comme on peut vivre sans philosophie, sans musique, sans joie et sans amour.
Mais pas si bien.

[1]A ce propos: je conseille cette trés bonne introduction
3  0 
Avatar de patewing
Membre à l'essai https://www.developpez.com
Le 05/01/2017 à 16:27
L'équipe de deep mind a bien précisé qu'ils se concentraient sur le jeu de stratégie en temps réel : Starcraft II.
ça ne veut pas dire pour autant qu'ils arrêtent tous les processus antérieur comme AlphaGo.

A ce que je sache, la "pratique culturelle du go" c'est de chercher à s'améliorer pour trouver le coup divin (la séquence parfaite du début jusqu'à la fin de la partie).
Même AlphaGo ne l'a pas encore trouvé malgré son niveau extrêmement élevé. Vu le caractère asymptotique de sa progression ce n'est pas pour demain.
3  0 
Avatar de Coriolan
Expert éminent sénior https://www.developpez.com
Le 26/05/2017 à 11:18
Citation Envoyé par Matthieu Vergne Voir le message
Est-ce que AlphaGo est capable de me dire combien fait 10² ? De me citer des différences entre une vache et un mouton ? Ou encore de me dire si les chances de pleuvoir par chez moi dans les 5 prochaines minutes sont grandes, vu le beau soleil qu'il y fait ? Non. Donc merci d'arrêter les amalgames stupides de ce genre, ça ne vaut pas un forum de développeurs. Qu'on traite AlphaGo comme un expert de Go si vous voulez, mais pas comme une machine intelligente. C'est même d'autant plus décevant de voir que c'est l'auteur DVP qui prend ses rêves pour la réalité, alors que l'article d'origine n'affirme pas cela.
C'était juste une question pour introduire la news, pas vraiment une affirmation. Et puis j'ai rajouté un autre éclaircissement pour montrer qu'on parle bien du jeu de Go.
4  1 
Avatar de yahiko
Rédacteur/Modérateur https://www.developpez.com
Le 28/11/2019 à 7:56
Excuse en bois.
Ce n'est pas parce que Magnus Carlsen, champion du monde des échecs, ne peut pas battre les meilleurs moteurs IA d'échecs qu'il a abandonné les échecs.
C'est comme si un athlète disait qu'il arrêtait le 100m parce qu'il ne peut pas courir plus vite qu'une Bugatti Veron.
Dans n'importe quelle discipline donnée, on ne demande pas à une personne d'être plus fort que les machines, mais simplement de briller parmi ses semblables.
4  1 
Avatar de Jean-Philippe André
Rédacteur/Modérateur https://www.developpez.com
Le 28/11/2019 à 15:52
Ca reste aussi une décision qui peut se comprendre du point de vue physique, meme si 36 ans c'est jeune, mais on a bien vu Kramnik stopper à 40 ans et Anand continuer à être dans le top 10.

Essayer de comprendre son choix de prendre sa retraite, c'est prétentieux de notre part
3  0