Inovação com Redes Neurais
ILUSTRAÇÃO DE DEREK BRAHNEY | DIAGRAMA CORTESIA DE MICHAEL NIELSEN, “REDES NEURAIS E APRENDIZAGEM PROFUNDA”, DETERMINATION PRESS, 2015
A inteligência artificial está ficando muito boa em identificar as coisas: mostre um milhão de fotos, e ela pode dizer com uma precisão incrível que retrata um pedestre atravessando uma rua. Mas a AI é desesperada em gerar imagens de pedestres por si só. Se pudesse fazer isso, seria capaz de criar montes de imagens realistas, mas sintéticas, retratando pedestres em vários cenários, que um carro autônomo poderia usar para se treinar sem nunca sair da estrada.
A solução ocorreu primeiramente a Ian Goodfellow, então um estudante de doutorado na Universidade de Montreal, durante uma discussão acadêmica em um bar em 2014. A abordagem, conhecida como rede geradora de adversários, ou GAN, usa duas redes neurais - os modelos matemáticos simplificados do cérebro humano que sustenta a aprendizagem de máquina mais moderna - e coloca-os uns contra os outros em um jogo digital de gato e rato.O problema é que criar algo inteiramente novo requer imaginação - e até agora isso tem AIs perplexos.
Ambas as redes são treinadas no mesmo conjunto de dados. Um deles, conhecido como gerador, tem a tarefa de criar variações nas imagens que já foram vistas - talvez uma foto de um pedestre com um braço extra. O segundo, conhecido como o discriminador, é solicitado a identificar se o exemplo que vê é como as imagens em que foi treinado ou um falso produzido pelo gerador - basicamente, é provável que a pessoa de três braços seja real?
Com o tempo, o gerador pode se tornar tão bom na produção de imagens que o discriminador não consegue detectar falsificações. Essencialmente, o gerador foi ensinado a reconhecer e criar imagens realistas de pedestres.
A tecnologia tornou-se um dos avanços mais promissores da IA na última década, capaz de ajudar as máquinas a produzir resultados que enganam até mesmo os seres humanos.
As GANs foram usadas para criar uma fala com som realista e imagens falsas fotorrealistas. Em um exemplo convincente, pesquisadores da fabricante de chips Nvidia prepararam um GAN com fotografias de celebridades para criar centenas de rostos confiáveis de pessoas que não existem. Outro grupo de pesquisa fez pinturas falsas não-convincentes que se parecem com as obras de van Gogh. Empurrado ainda mais, as GANs podem reimaginar as imagens de diferentes maneiras - fazendo uma estrada ensolarada parecer nevada ou transformando cavalos em zebras.
Os resultados nem sempre são perfeitos: as GANs podem conjurar bicicletas com dois conjuntos de guidões, digamos, ou faces com sobrancelhas no lugar errado. Mas, como as imagens e os sons são surpreendentemente realistas, alguns especialistas acreditam que há um senso de que as GANs estão começando a entender a estrutura subjacente do mundo que vêem e ouvem. E isso significa que a IA pode ganhar, junto com um senso de imaginação, uma capacidade mais independente de entender o que vê no mundo.
