banner
Lar / blog / O estranho fracasso da IA
blog

O estranho fracasso da IA

Jul 07, 2023Jul 07, 2023

Por Kyle Chayka

É um exercício clássico nas aulas de arte do ensino médio: uma aluna está sentada em sua mesa, com um lápis de carvão em uma das mãos, apoiado sobre uma folha de papel, enquanto a outra mão está estendida à sua frente, com a palma para cima, os dedos relaxados de modo que eles se curvam para dentro. Então ela usa uma mão para desenhar a outra. É uma tarefa para iniciantes, mas a tarefa de representar mãos de forma convincente é um dos desafios mais notórios da arte figurativa. Lembro-me de ter sido incrivelmente frustrante acertar os ângulos e a proporção de cada dedo, determinar como o polegar se conecta à palma da mão, mostrar um dedo sobreposto ao outro. Muitas vezes, eu acabava com um dedo mindinho bizarramente longo ou um polegar projetando-se em um ângulo impossível, como um osso quebrado. “É assim que os alunos começam a aprender a desenhar: aprendendo a olhar de perto”, disse-me Kristi Soucie, minha professora de arte no ensino médio, em Connecticut, quando liguei para ela recentemente. “Todo mundo presume que sabe como é uma mão, mas até que você realmente olhe para ela, você não entende.”

A inteligência artificial está enfrentando um problema semelhante. Ferramentas recentemente acessíveis, como Midjourney, Stable Diffusion e DALL-E, são capazes de renderizar uma paisagem fotorrealista, copiar o rosto de uma celebridade, remixar uma imagem no estilo de qualquer artista e substituir perfeitamente os fundos da imagem. Em setembro passado, uma imagem gerada por IA ganhou o primeiro prêmio de arte digital na Feira Estadual do Colorado. Mas quando confrontadas com um pedido para desenhar mãos, as ferramentas cuspiram uma série de apêndices de pesadelo: mãos com uma dúzia de dedos, mãos com dois polegares, mãos com mais mãos brotando delas como um mutante botânico. Os dedos têm muitas articulações ou nenhuma. Eles se parecem com diagramas de um livro de medicina de um mundo estranho. A inépcia das máquinas nesta tarefa específica tornou-se uma piada recorrente sobre as deficiências da IA. Como disse uma pessoa no Twitter: “Nunca pergunte a uma mulher da sua idade ou a um modelo de IA por que escondem as mãos”.

Como outros relataram, o problema da mão tem a ver, em parte, com a capacidade dos geradores de extrapolar informações dos vastos conjuntos de dados de imagens nos quais foram treinados. Quando um usuário digita um prompt de texto em um gerador, ele utiliza inúmeras imagens relacionadas e replica os padrões que aprendeu. Mas, tal como um arqueólogo que tenta traduzir os hieróglifos egípcios da Pedra de Roseta, a máquina só pode deduzir a partir do seu material específico, e existem lacunas no seu conhecimento, especialmente quando se trata de compreender formas orgânicas complexas de forma holística. Conjuntos de dados falhos ou incompletos produzem resultados falhos. Como o linguista Noam Chomsky e os seus coautores argumentaram recentemente num recente artigo de opinião do Times, as máquinas e os humanos aprendem de forma diferente. “A mente humana não é, como o ChatGPT e seus semelhantes, um mecanismo estatístico pesado para correspondência de padrões, devorando centenas de terabytes de dados”, escreveram eles. Em vez disso, “opera com pequenas quantidades de informação; procura não inferir correlações brutas entre pontos de dados, mas criar explicações.”

Um gerador pode calcular que as mãos têm dedos, mas é mais difícil treiná-lo para saber que deveriam haver apenas cinco, ou que os dígitos têm comprimentos mais ou menos definidos em relação uns aos outros. Afinal, as mãos parecem muito diferentes de ângulos diferentes. Olhando para o meu próprio par enquanto digito isso no teclado do laptop, meus dedos estão encurtados e meio obscurecidos pelas palmas das mãos; um observador não seria capaz de determinar sua estrutura exata de raios X a partir de uma imagem estática. Peter Bentley, professor de ciência da computação na University College London, disse-me que as ferramentas de IA “aprenderam que as mãos têm elementos como dedos, unhas, palmas das mãos. Mas eles não entendem o que realmente é uma mão.” O mesmo problema às vezes ocorre quando a IA tenta renderizar características menores, como orelhas, que aparecem como redemoinhos carnudos sem a intrincada estrutura de cartilagem; ou dentes que ficam incorretamente posicionados na boca; ou pupilas, que se transformam em bolhas caprinas. A IA pode compreender padrões visuais, mas não a lógica biológica subjacente.