IA não só passa no teste de Turing, ela supera humanos

Um estudo da University of California San Diego apresentou evidências de que sistemas modernos de inteligência artificial (IA) conseguiram passar no clássico teste de Turing, criado em 1950 pelo matemático britânico Alan Turing. A pesquisa mostrou que participantes humanos tiveram dificuldade para diferenciar pessoas reais de modelos avançados de linguagem durante conversas por texto.

O trabalho foi publicado na revista científica Proceedings of the National Academy of Sciences e avaliou diferentes modelos de IA em experimentos controlados. Segundo os pesquisadores, esta foi a primeira vez que modelos de linguagem foram considerados humanos com frequência semelhante — e em alguns casos superior — à de participantes reais dentro da estrutura original proposta por Turing.

Como o experimento funcionou

No teste, cada participante conversava simultaneamente com duas entidades: um humano e um sistema de IA. O objetivo era identificar qual dos interlocutores era a pessoa real.

Os pesquisadores utilizaram dois grupos independentes: estudantes da UC San Diego e participantes recrutados pela plataforma Prolific. Ao todo, quase 500 pessoas participaram dos experimentos.

Os testes envolveram quatro modelos de linguagem. Entre eles estavam os sistemas mais avançados, como GPT-4.5 e LLaMa-3.1-405B, além de modelos considerados base de comparação, como GPT-4o e o chatbot clássico ELIZA, criado nos anos 1960.

GPT-4.5 superou participantes humanos no teste de Turing – Imagem: Koshiro K / Shutterstock

De acordo com o estudo, o GPT-4.5 foi identificado como humano em 73% das vezes, superando inclusive os próprios participantes humanos na taxa de escolha dos interrogadores. Já o LLaMa-3.1-405B foi considerado humano em 56% das interações, resultado considerado estatisticamente equivalente ao de pessoas reais.

Os modelos de comparação tiveram desempenho significativamente inferior. O ELIZA foi escolhido como humano em cerca de 23% das vezes, enquanto o GPT-4o alcançou aproximadamente 21%.

Personalidade influenciou resultado

Os pesquisadores afirmam que os resultados dependeram fortemente das instruções fornecidas aos modelos. Cada sistema recebeu um “prompt de persona”, orientando a IA a assumir um estilo de comunicação e características humanas específicas.

Segundo Cameron Jones, autor correspondente do estudo e atualmente professor assistente de Psicologia na Stony Brook University, os modelos conseguiram reproduzir elementos como tom de voz, humor, objetividade e até falhas típicas de humanos.

Quando essas instruções detalhadas não eram fornecidas, o desempenho caiu de forma considerável. O GPT-4.5 teve taxa de sucesso reduzida para 36%, enquanto o LLaMa-3.1-405B caiu para 38%.

Para Ben Bergen, professor de ciência cognitiva da UC San Diego e coautor da pesquisa, o teste passou a medir mais a capacidade de parecer humano do que inteligência propriamente dita.

Pesquisadores citam riscos de fraude e manipulação

Os autores também destacam possíveis impactos do avanço dessas tecnologias em ambientes online. Segundo Jones, modelos capazes de se passar por humanos em conversas prolongadas podem dificultar a identificação de bots por usuários comuns.

O pesquisador afirmou que as pessoas devem ter menos certeza de que estão interagindo com seres humanos ao conversar com desconhecidos na internet. Ele também apontou riscos ligados à manipulação e ao uso de sistemas automatizados para enganar usuários.

Bergen acrescentou que bots podem ser usados para persuadir pessoas a compartilhar dados pessoais, influenciar decisões políticas ou promover produtos.

Conversas duravam até 15 minutos

Para conduzir o experimento, os pesquisadores criaram uma interface semelhante a aplicativos de mensagens. Os participantes visualizavam duas conversas lado a lado e sabiam que apenas uma delas era conduzida por um humano.

Após cinco minutos — ou 15 minutos em uma versão de replicação do estudo — os participantes precisavam decidir qual interlocutor era a pessoa real.

Os estudantes da UC San Diego tiveram desempenho ligeiramente melhor na identificação dos humanos. Segundo os pesquisadores, isso pode estar relacionado ao compartilhamento de experiências em comum e referências locais do campus.

O post IA não só passa no teste de Turing, ela supera humanos apareceu primeiro em Olhar Digital.