Alphago – Definirtec

Definição – O que significa AlphaGo?

AlphaGo é um estreito AI, um programa de computador desenvolvido pelo Google DeepMind para jogar Go, um jogo de tabuleiro de estratégia chinês para dois jogadores semelhante ao xadrez. AlphaGo é o primeiro programa de IA capaz de derrotar um jogador profissional humano, o jogador 2-dan Fan Hui, em outubro de 2015, em um tabuleiro de tamanho real sem limitações. Em seguida, derrotou um dos jogadores humanos mais bem classificados do mundo, 9-dan Lee Sedol, em março de 2016, vencendo quatro jogos em cinco.

Definirtec explica AlphaGo

O projeto AlphaGo foi iniciado em 2014 como um ambiente de teste para ver se o algoritmo de rede neural do Google DeepMind que utiliza aprendizado profundo poderia competir no Go. O algoritmo para AlphaGo é uma combinação de busca em árvore e técnicas de aprendizado de máquina e reforçado com treinamento extensivo com humanos e outros jogadores de computador. Ele usa a busca em árvore de Monte Carlo e é guiado por uma rede de política e valor, implementada usando tecnologias de rede neural profunda. A rede de políticas é treinada e ajuda a IA a prever o próximo movimento com maior probabilidade de vencer, enquanto a rede de valor é treinada para restringir a árvore de pesquisa e determinar o valor dessas posições, estimando os vencedores em cada posição, em vez de pesquisar até o fim até o final do jogo.

AlphaGo foi alimentado primeiro com jogadas históricas de jogadores humanos, utilizando um banco de dados de cerca de 30 milhões de jogadas, fazendo-o imitar jogadas humanas. Uma vez que a IA atingiu um grau de proficiência, ela foi treinada ainda mais, fazendo-a jogar contra suas próprias instâncias, usando aprendizado por reforço para melhorar e aprender mais.

Em outubro de 2015, uma versão de computação distribuída de AlphaGo jogou e derrotou Fan Hui, um campeão europeu de Go de 2 dan, marcando a primeira vez que um programa de computador derrotou um jogador profissional em Go. Fan Hui então ajudou como consultor para a equipe DeepMind meses após sua derrota. Em março de 2016, AlphaGo enfrentou Lee Sedol, um dos melhores jogadores do mundo, tendo alcançado o nível máximo de 9-dan. Ganhar quatro jogos contra um de Lee, isso marcou um grande avanço na pesquisa de IA, pois significava que o algoritmo de aprendizagem profunda e redes neurais usado pelo DeepMind pode ser usado para qualquer outro propósito, uma vez que não foi realmente programado para jogar Go, mas foi ensinado como jogar Go. Isso abre um novo mundo para a pesquisa de IA.