Podem as máquinas
pensar?
Podemos
esperar que as máquinas eventualmente
competirão
com os humanos em campos puramente intelectuais.
(Allan Turing)
Em 1950, Alan Turing publicou na revista Mind seu magistral artigo “Computing Machinery and Intelligence” em que colocou a seguinte pergunta: «podem as máquinas pensar?». Como essa questão, Turing inseriu como foco de discussão toda a problemática que envolve a relação entre humanos e máquinas e o advento da inteligência artificial tão complexamente elabora no tempo presente.
Na década de 1950, uma resposta positiva à
questão parecia muito improvável, no entanto, o avanço tecnológico atual
aproxima-nos cada vez mais de uma resposta definitiva ao desafio de Turing. Em
artigo publicado ontem (23/12/2020) pela revista Nature, foi apresentado
a última (r)evolução tecnológica em termos de inteligência artificial: o MuZero.
O MuZero é um programa de computador desenvolvido pela empresa de
pesquisa de inteligência artificial DeepMind para dominar jogos sem saber nada
sobre suas regras. O algoritmo MuZero aprende um modelo iterável que produz
previsões relevantes para o planejamento: a seleção de ação política, a função
de valor e a recompensa. Quando avaliado em 57 diferentes jogos, Atari games
ambiente de videogame canônico para testar inteligência artificial técnicas,
nas quais abordagens de planejamento baseadas em modelo historicamente têm
lutado, o algoritmo MuZero alcançou desempenho de última geração. Quando
avaliado em Go, xadrez e shogi - ambientes canônicos para planejamento de alto
desempenho – o algoritmo MuZero combinou, sem qualquer conhecimento da
dinâmica do jogo, o desempenho sobre-humano do algoritmo AlphaZero que foi
fornecido com as regras do jogo.
Esse é um avanço surpreendente com relação ao
seu antecessor, o AlphaZero, o que demonstra que os limites para a inteligência
artificial ainda estão longe de serem atingidos, o que instiga ainda mais a investigação
por novos recursos tecnológicos que possa aperfeiçoar a façanha. O MuZero
utiliza a aprendizagem por reforço baseada em modelo, o que o permite atingir desempenho
de ponta em jogos Atari 2600, xadrez, Go e shogi. “A aprendizagem por reforço
baseada em modelo (RL) visa abordar esta questão, primeiro aprendendo um modelo
da dinâmica do ambiente e, em seguida, planejando em relação ao modelo
aprendido” (SCHRITTWIESER, 2020, p. 604).
Podemos dizer que há ainda muito a ser
explorado na área da inteligência artificial com testes que irão para além de jogos,
mas na interação com o próprio ambiente humano, podendo suscitar muitas
fantasias que estão, até o momento, nos livros e filmes de ficção científica,
mas que pode vir um dia a se tornar a mais pura realidade.
(Luiz Maurício Bentim Menezes)
Bibliografia
SCHRITTWIESER, J. et al. Mastering Atari, Go, chess and shogi by planning with a
learned model. Nature, v. 588, p. 604-609, 2020. https://doi.org/10.1038/s41586-020-03051-4