no início de 2017, Libratus, uma inteligência artificial da Universidade Carnegie Mellon, que conseguiu vencer 4 jogadores profissionais de poker jogar Texas Hold’em. Agora, acabam de conferir que Libratus tem uma competência sobre isto-humana para receber esse jogo. Os programas de IA têm derrotado os melhores humanos em damas, xadrez e go, todos os jogos de desafio, mas em que ambos os jogadores conhecem o estado exato do jogo em todos os instantes. Os jogadores de poker, pelo contrário, lidam com detalhes oculta: quais são as cartas têm os seus adversários e se um oponente está puxando um blefe.
Numa guerra de vinte dias, que envolveu mais de 120.000 mãos de Rivers Casino, em Pittsburgh, Libratus se tornou a primeira máquina pra derrotar os incríveis jogadores humanos em heads-up no-limit Texas Hold’em. Libratus venceu qualquer um dos jogadores individualmente em jogo de dois jogadores e coletivamente acumulou mais de 1,8 milhões de euros em fichas. “As técnicas em Libratus não fazem uso o conhecimento especializado (não) ensina um profissional ou de detalhes humanos e não são específicas do poker”, assinalam-Sandholm e Brown no documento. “Portanto, se aplicam a uma grande quantidade de jogos de detalhes imperfeita”.
Tal detalhes oculta é onipresente em interações estratégicas do mundo real, relataram, incluindo a negociação comercial, a segurança cibernética, as finanças, os preços e as aplicações militares. 161 (o número um seguido de 161 zeros) possíveis pontos de decisão no jogo.
Logo após, crie a sua própria estratégia detalhada pra primeiras rodadas de Texas Hold’em e uma estratégia aproximada para as próximas rodadas. Um modelo destas abstrações no poker é reunir mãos parelhos e tratá-las de modo idêntica. “Intuitivamente, há pouca diferença entre uma escada de cor King-high e uma cor Queen-high”, disse Brown. “Tratar destas mãos como idênticas corta a complexidade do jogo e, dessa forma, faz com que seja mais fácil do ponto de vista computacional.
- O Sabadell entra na ‘nuvem’, filme e TIC e lança um capital de risco
- 87 Sabia que
- A→B, B→C ⊢ A→C
- Painel de máscaras
- Análise Económico
- Oferece proveitos “verdadeiramente úteis” pra vida real
Mas nas rodadas finais do jogo, um segundo módulo constrói uma nova abstração baseada no estado do jogo. No decorrer da competição de janeiro, Libratus fez este cálculo, utilizando o micro computador Bridges do Centro de Supercomputação de Pittsburgh. Em que momento um inimigo executa um movimento que não está na abstração, o módulo calcula uma solução para esse subjuego que inclui o movimento do adversário.
Sandholm e Brown chamam esta solução de subjuego aninhado. O terceiro módulo é projetado para aperfeiçoar a estratégia do plano à quantidade que o jogo progride. Tipicamente, falou Sandholm, os robôs fazem uso o aprendizado automático pra localizar erros pela estratégia do adversário e explorá-los. Desde o painel em branco.
Sem que ninguém lhe ensine. Falta de treinamento humano. Em compensação, o módulo de efetivação automática de Libratus analisa o tamanho das apostas dos adversários pra detectar furos potenciais da própria estratégia. Então, Libratus acrescenta estes ramos de decisão faltantes, calcula estratégias pra elas e as adiciona ao plano.
E também vencer os profissionais humanos, Libratus foi avaliado contra as melhores inteligências artificiais anteriores no poker. Estes incluem Baby Tartanian8, um bot criado por Sandholm e Brown, que obteve o Concurso Anual de Poker por Computador 2016, executado em conjunto com a Associação pro Avanço da Conferência Anual de Inteligência Artificial. Esquema de uma rede neural imaginária E. I.
As máquinas vêem um jogo como o de uma árvore. Simplificando, de cada nó partem dois ramos, que são as possíveis decisões ou caminhos a tomar. Por qualquer um desses ramos brotam frutos, que são as possíveis reações do oponente. Segundo, por onde saiu o fruto, desse jeito brotarán outros dois ramos. Folhagem e frutos lutam por um objetivo: obter a luminosidade do sol. Obviamente, nem todos os ramos são tão frondosas, nem ao menos todos os frutos tão engajador pra elas. Digamos que a máquina pontue cada juagada (ramos/frutos). Olhar a árvore, no teu conjunto, de baixo para cima, nos daria uma visão de qual é o curso perfeito pra atingir o sol.
Mas isto leva tempo. Desta forma se podem podar alguns ramos, com seus frutos, deixando-o mais estreito. As redes neurais são como jardineiros com experiência. Podem aprender que os ramos são geralmente as que mais grande chegar, ou as que darão mais fruto. A experiência faz-lhe categorizar os ramos em atividade de que sejam mais produtivas ou frondosas e, assim, ajudam a tomar decisões por onde podar.
