Page 1 sur 1

Poker et Intelligence Artificielle

Publié : Vendredi 04 Janvier 2008 13:48
par Seb6759
Comme beaucoup vous pensez surement que l'homme est et restera meilleur qu'un ordinateur au poker. Comme beaucoup vous vous dites qu'un ordinateur ne peut pas bluffer, ou qu'il ne pourra jamais comprendre le jeu soit disant limite aleatoire d'un Gus Hansen ou autre champion. Dans ce cas comme beaucoup vous vous trompez !

Peut etre etes vous au courant que cet été a eu lieu la premiere partie officielle homme vs machines au poker. Et effectivement c'est l'homme (en l'occurrence Phil Laak et Ali Eslami) qui a gagné ... mais de peu ! Et croyez moi il y a fort à parier que l'année prochaine (ou au plus dans deux ans) ce sera la victoire de l'ordinateur !

Pour plus d'info sur ce qui s'est passé cet été :
http://www.cs.ualberta.ca/~games/poker/man-machine/

Publié : Vendredi 04 Janvier 2008 14:54
par Raf
Yep!
J'étais là-bas dans le cadre de mes études, et j'avoue que c'est assez impressionant de voir Phil Laak jouer, il commentait chacun de ses coups, disait ce qu'il allait faire à l'avance, et arrivait à super bien deviner les cartes de l'ordinateur.
D'ailleurs l'avoir vu jouer m'a fait comprendre que le poker bah jpense que ça restera un loisir pour moi, pas l'niveau :roll:
Ali Eslami faisait un peu moins le show par contre, mais il a eu les mauvaises séries de cartes...
Sinon au niveau de la recherche, pour l'instant c'est en poker limit, ya quelques programmes qui font du no limit mais ça en est qu'au début, et ça reste du 2 joueurs. Pour jouer contre le meilleur en head-up 2 joueurs (vainqueur de la compétition machine-machine) c'est là : Bluffbot
Cet année, en poker limit les chercheurs commencent a s'inéresser au multi-joueurs.[/url]

Publié : Vendredi 04 Janvier 2008 15:56
par Florian
ça marche en limit car c'est une variante très mathematique, qui ne laisse guère de place à la fantaisie

en no limit en revanche, le pc ne pourra jamais avoir un niveau correct. le poker est avant tout un jeu d'observation et les machines ne peuvent maitriser cet aspect là, et encore moins les aspects psychologiques et emotionnels.

Publié : Vendredi 04 Janvier 2008 16:50
par Raf
Je suis pas vraiment d'accord avec toi, pour le no limit, c'est juste que la recherche commence a peine dans ce domaine.

Sinon pour ce qui est de l'observation, une machine peut mémoriser tous les coups donc c'est pas vraiment un problème, pour l'aspect psychologique et émotionnel, c'est une faiblesse humaine je trouve, et justement là l'ordinateur a un avantage, il ne sera jamais on tilt après un bad beat de la mort.

Publié : Vendredi 04 Janvier 2008 16:57
par K4T4N4
Même si la machine ne gère pas le côté émotionnel et psychologique, l'humain lui, ne bénéficie pas de ces infos contre la machine.

Publié : Vendredi 04 Janvier 2008 17:54
par Florian
Raf a écrit :Sinon pour ce qui est de l'observation, une machine peut mémoriser tous les coups donc c'est pas vraiment un problème, pour l'aspect psychologique et émotionnel, c'est une faiblesse humaine je trouve, et justement là l'ordinateur a un avantage, il ne sera jamais on tilt après un bad beat de la mort.


suffit pas de memoriser tous les coups pour etre un bon joueur
comment la machine peut savoir si on bluffe ou non?
en memorisant tous nos betting pattern? et pour un joueur completement imprevisible qui ne fait jamais les coups de la meme façon, comment la machine va t elle reagir?

une machine ça reste quand meme très con
par exemple, si je fais 10 fois le meme bet pour bluffer, la 11e fois elle interpretera mon bet comme un bluff non? donc il suffit d'avoir du jeu la 11e fois

je vois vraiment pas comment ils vont reussir à integrer la gestion des bluffs. Quand la machine va t elle decider d'arracher un coup? l'interpretation du comportement des autres joueurs est tout bonnememnt impossible alors qu'au poker on joue contre les autres



et pour le trash talk, comment qu'elle va faire votre machine?? :twisted: :arrow:

Publié : Vendredi 04 Janvier 2008 17:54
par Florian
K4T4N4 a écrit :Même si la machine ne gère pas le côté émotionnel et psychologique, l'humain lui, ne bénéficie pas de ces infos contre la machine.


suffit de connaitre son algorythme alors :wink:

Publié : Vendredi 04 Janvier 2008 18:40
par Seb6759
Florian va voir ce que Phil Laak dit sur le site dont j'ai donné le lien, tu risques d'etre etonné ..
Pour tes questions je laisse Raf y repondre, je pense qu'il est plus capable que moi d'utiliser les bons termes pour te convaincre.
D'ailleurs Raf je pense savoir qui tu es ... bureau de Jeremy à l'INRIA ? :)

Publié : Vendredi 04 Janvier 2008 18:51
par Raf
Oui il ne suffit pas de mémoriser tous les coups pour avoir un bon joueur, sinon ce serait plié, et on aurait des programmes super balèzes au poker.
Comment la machine peut savoir si on bluff ou non?
hum... Je sais pas trop, pour l'instant ya encore rien de fait de ce côté là, d'ailleurs si t'as des idées... :wink:
Mais bon, je peux te retourner la question, comment toi détecteras-tu si la machine bluff ou non?

Dans les premiers programmes de poker qui étaient faits ils utilisaient des méthodes dites de monté-carlo, ils lançaient des simulations de parties à partir de l'état courant pour prendre une décision, en utilisant cette méthode des tactiques comme le "check-raise" ont été utilisé par le programme sans que ce soit codé en dur dedans, donc je pense que l'on peut obtenir des programmes capables de bien bluffer.

Sinon contre le joueur imprévisible, il suffit d'avoir un programme qui joue selon l'équilibre de Nash ou du moins qui essaient de l'approcher (c'est des programmes basé la dessus qui ont joué contre Laak et Eslami).
Si tu joues suivant l'équilibre de Nash, en gros tu ne peux pas perdre mais tu ne peux pas gagner non plus. :?
Un exemple classique c'est pierre-papier-ciseau : l'équilibre de Nash sur ce jeu c'est de jouer avec une proba 1/3 chacun des coups, donc en moyenne tu fais match nul.
Cette stratégie te permet de te "protéger" en quelque sorte. Mais à côté de cette stratégie il t'en faut une autre qui essaie d'exploiter ton adversaire, contre un boubourse qui fait toujours "pierre" par exemple, la stratégie de Nash va faire match nul, par contre si tu modélise ton adversaire, tu détectera que jouer tout le temps "papier" c'est pas si con que ça.

Le problème au pokpok c'est que l'équilibre de Nash est pas si facile que ça a calculer... On essaie donc d'approcher cet équilibre.
Mais je pense qu'un programme qui mix équilibre de Nash/modélisation d'adversaire peut être très bon.
Reste à l'écrire... :roll:

Pour ton exemple oui, tu peux essayer d'apprendre à la machine que tu as une certaine manière de jouer et puis en changer, mais ça a un coût non? Les 10 première fois ou tu aura bluffé tu auras perdu déjà pas mal pour réussir à la piéger la 11 eme fois.

L'interpréation du comportement se fait par l'observation des betting pattern non? 'fin bon jsuis pas vraiment un bon joueur au poker donc je sais pas trop, toi comment tu détecte quelqu'un qui tente d'arracher un coup et quelqu'un qui a touché son jeu?
'fin bref, pour le moment de toute façon ya pas encore de programme d'écrit, on verra en juillet... wet and sea :D

Publié : Vendredi 04 Janvier 2008 19:05
par Seb6759
(Raf est ce que tu as raté la derniere ligne de mon precedent post ou tu veux garder le mystere ? :p)

Publié : Vendredi 04 Janvier 2008 19:24
par Raf
Seb6759 a écrit :(Raf est ce que tu as raté la derniere ligne de mon precedent post ou tu veux garder le mystere ? :p)

:D
Oui j'étais en train de répondre, et euh oui c'est moi, on doit pas être des dizaines à lille à étudier le sujet :p

Publié : Jeudi 10 Janvier 2008 21:16
par ZeElmo
Florian a écrit :suffit pas de memoriser tous les coups pour etre un bon joueur
comment la machine peut savoir si on bluffe ou non?
en memorisant tous nos betting pattern? et pour un joueur completement imprevisible qui ne fait jamais les coups de la meme façon, comment la machine va t elle reagir?

une machine ça reste quand meme très con
par exemple, si je fais 10 fois le meme bet pour bluffer, la 11e fois elle interpretera mon bet comme un bluff non? donc il suffit d'avoir du jeu la 11e fois


Dans ce cas là, elle pourrait en déduire que quand tu bets de cette manière, tu bluffes x%du temps et tu as du jeu x%.
Ca pourrait être une donnée qu'elle incluerait dans sa prise de décision.

Je dis juste ça comme ça vient , rien de fondé....
En fait j'aimerais bien savoir si c'est possible, donc si il y a des têtes qui passent par ici...