ChatGPT foi um acidente, diz brasileiro ex-OpenAI

O ChatGPT foi um acidente. É o que disse Bruno Alano, cientista da computação brasileiro que trabalhou nos primórdios da OpenAI (entre 2016 e 2018), em entrevista exclusiva ao Olhar Digital.

Em 2016, ele se tornou o primeiro sul-americano a integrar a equipe de pesquisadores da desenvolvedora do ChatGPT, em São Francisco, nos EUA. Isso antes mesmo do chatbot que você provavelmente usa ou ao menos conhece existir.

Na OpenAI, o cientista da computação atuou no programa de pesquisa SOCML focado no desenvolvimento de redes recorrentes e modelos generativos de texto. Esses são os alicerces tecnológicos que mais tarde permitiram a criação do ChatGPT. 

Além de sua passagem pela desenvolvedora do chatbot, Alano é membro fundador da Associação Brasileira de Inteligência Artificial (ABRIA), liderou iniciativas de IA em plataformas de grande escala como o Jusbrasil e, atualmente, lidera o desenvolvimento de modelos proprietários de IA voltados para inteligência de crédito na Avra, startup cofundada por ele. E onde trabalha como CTO.

ChatGPT foi um acidente tanto como produto quanto como pesquisa, diz brasileiro que trabalhou na OpenAI

O Olhar Digital teve uma longa conversa com Alano. A entrevista abrangeu desde bastidores da OpenAI até impactos da inteligência artificial (IA) generativa no mercado de trabalho, passando por análises do passado do setor e expectativas para o futuro.

Confira abaixo os destaques da conversa (perguntas e respostas foram encurtadas para facilitar a leitura):

Olhar Digital: Na corrida da IA, a OpenAI, por exemplo, lançou diversas tecnologias voltadas para o público geral, enquanto a Anthropic sempre se manteve mais focada em empresas. A IA está cada vez mais importante para empresas? O público geral não é o core financeiro de desenvolvedoras?

Bruno Alano: A OpenAI e a Anthropic possuem origens e filosofias de atuação distintas. A OpenAI nasceu como um laboratório de pesquisa aplicada, e não sob a ótica de produto. Eu considero o ChatGPT mais como um acidente. Um produto por acidente. Não um produto intencional. Essa raiz molda uma estratégia horizontal e experimental: a empresa lança tecnologias para o público de massa, colhe feedbacks e depois tenta verticalizar em nichos. A ideia é se posicionar de forma centralizada, como um sistema operacional de IA.

Já a Anthropic tem uma visão mais pragmática e focada em vencer mercados específicos, principalmente os setores corporativo (enterprise) e de engenharia de software. Eles estão à frente da grande maioria (80%, eu diria) das inovações de produto dos últimos três anos, desenvolvendo interfaces agênticas e ferramentas de programação especializadas. É o oposto da OpenAI, que tem essa visão horizontal de “quero abraçar o mercado inteiro e não quero me especializar agora”.

Em paralelo, outros gigantes seguem caminhos próprios: o Google aposta na integração de todo o seu ecossistema de dados já existente, enquanto a tendência para a Apple é liderar em privacidade e processamento local nos dispositivos (on-device). Em suma, essas respostas comerciais diferentes continuam fortemente pautadas pelo viés e pela forma como cada uma dessas companhias foi fundada.

“Eu considero o ChatGPT mais como um acidente. Um produto por acidente. Não um produto intencional”, disse brasileiro que trabalhou na OpenAI – Imagem: BongkarnGraphic/Shutterstock

Olhar Digital: O ChatGPT foi um acidente em qual sentido?

Bruno Alano: Em todos os sentidos. Primeiro como produto e segundo como pesquisa. Sob a ótica científica, as métricas tradicionais de ciência de dados e distribuições probabilísticas não conseguem mensurar o valor prático de um modelo generativo. Então, uma IA pode parecer excelente em testes técnicos, mas ruim na prática por não gerar respostas criativas, por exemplo. O “acidente” na pesquisa ocorreu quando a ferramenta foi liberada e o público passou a aplicá-la para finalidades totalmente imprevistas. E dizer que estava funcionando. Isso revelou utilidade em áreas onde sequer existiam bases de dados ou parâmetros de avaliação (benchmarks) anteriores para validar sua eficiência.

Do ponto de vista de produto, o lançamento inicial consistia num protótipo bruto: uma caixa de texto simples na qual o usuário escrevia e a IA gerava conteúdo arbitrário, sem camadas maduras de governança ou ética. O ponto principal, o acidente que eu vejo, é… esse tipo de tecnologia já existia, já era possível, há mais tempo do que as versões do ChatGPT. A questão é que ninguém imaginava – nem eu, inclusive – que era um modelo “inteligente”. Ele estava apenas prevendo uma distribuição probabilística e eram palavras. Entre funcionar e gerar valor existe um gap muito grande.

Olhar Digital: A Nvidia se tornou a empresa mais valiosa do mundo após o boom do ChatGPT. Como você avalia o atual patamar do mercado da IA?

Bruno Alano: Ninguém imaginava que a gente estaria na escala que as coisas tomaram, na qual o tamanho da infraestrutura e o tempo de desenvolvimento tornaram-se um indicador do valor de mercado (valuation) de uma empresa. Como o setor opera sob a lógica de winners take most, os players travam uma disputa agressiva por frações de otimização nos parâmetros de avaliação (benchmarks). Eles investem centenas de milhões de dólares para erguer barreiras intransponíveis a novos concorrentes. Essa estratégia de longo prazo justifica as captações bilionárias do setor. E posiciona a Nvidia como a maior beneficiada desse movimento.

A infraestrutura de IA divide-se entre treinamento de modelos e inferência. E a Nvidia vem perdendo espaço significativo nesta última categoria, que corresponde ao uso cotidiano das ferramentas. Empresas como Groq e xAI, além de novas arquiteturas e soluções de otimização de memória do Google, têm avançado nesse segmento. A Apple também desponta como um forte concorrente futuro para a execução de IA nos dispositivos (on-device). Como a marca tem um conjunto de dispositivos homogêneo, se um modelo de IA roda num iPhone, tende a rodar em outros. O chipset é bem parecido entre eles. Assim, você consegue uma economia de escala significativa.

Por outro lado, o universo de treinamento de modelos continua amplamente concentrado, com cerca de 80% dos processos ocorrendo em chips da Nvidia devido à otimização da tecnologia PyTorch para o seu ecossistema. O restante se divide nas TPUs do Google. Diferente da inferência, o treinamento é um processo caro, demorado e não determinístico. Ou seja, não é porque a OpenAI gastou 100 milhões de dólares em custo de infraestrutura para chegar no ChatGPT que eu vou botar 100 milhões de dólares e chegar no mesmo resultado. Essa complexidade mantém o mercado sob forte dependência da Nvidia e impõe uma escassez severa de GPUs. As companhias precisam planejar e reservar a infraestrutura com meses de antecedência.

Quando o assunto é LLMs, o “top 5 já está bem definido”, segundo Bruno Alano, cientista da computação brasileiro ex-OpenAI – Imagem: Tada Images/Shutterstock

Olhar Digital: Você enxerga algum “vencedor parcial” na corrida das IAs?

Quando a gente olha só para o universo de modelos de linguagem, os LLMs, eu diria que o top 5 já está bem definido. Acho difícil ter players entrantes nesse mercado. Obviamente, vão ter soluções open source. Mas é um mercado muito difícil de competir. Como eu disse, é winners take most. E existe uma economia de escala significativa. Então, quanto mais pessoas estão usando minha plataforma, mais feedback eu tenho. Esses modelos de reinforcement learning aprendem com feedback. E aí, consequentemente, eu tenho mais capital para investir mais recurso. E, no final, é basicamente quantidade de dados e recursos investidos em computação. Então, não é um mercado que uma startup consegue entrar sem inovação disruptiva.

Eu diria que aqueles cinco ali – OpenAI, Anthropic, Google, Meta e, talvez, um quinto player a ser definido (ByteDance, talvez) – já estão dados. O que o mundo passa hoje é por diferentes tipos de modelo. Como LLMs introduziram IA para o mundo, para as pessoas entenderem o que é possível, o que a máquina consegue fazer, acho que cada vez mais estão surgindo modelos de domínio específico. A Avra entra nisso. Empresas vão usar modelos fundacionais, mas de domínio específico. A gente trabalha nesse universo de dados relacionais, que é usar modelos fundacionais para entender o seu negócio, a sua indústria. Tem modelos que hoje são estados da arte para previsões climáticas, por exemplo. Enfim, tem surgido várias empresas trabalhando com diferentes modalidades, diferentes tipos de dados que são mais ou menos relevantes. E acabam não sendo o mesmo mercado de provedores como OpenAI. Ainda tem muita coisa a evoluir nesse nicho [de modelos de domínio específico e modelos fundacionais].

Olhar Digital: Muito se falou sobre AGI um tempo atrás, mas agora essa conversa parece um pouco ultrapassada. O caminho está mais para “várias IAs” do que “uma IA geral”?

Sempre fui muito cético sobre AGI no geral. Pensando aqui, uma inteligência artificial geral, sem muito aquela parte de senciência, é possível. Talvez, daqui 50 ou 60 anos, isso possa aparecer. Só não acho que é com a arquitetura que temos hoje. Ela é ineficiente. Para você ensinar uma criança a identificar um elefante, por exemplo, basta você mostrar três exemplos que ela vai generalizar aquilo em várias situações. Para uma IA, essa generalização exige centenas de milhares de exemplos. A forma como esses modelos aprendem hoje em dia não vejo como AGI. Mesmo se você puder treinar com a estrutura que for, com toda a energia que existe hoje no mundo, não acho que vai culminar em ter uma AGI. É por conta da arquitetura de treino.

Acho que foi uma discussão muito fomentada com objetivo de marketing, de valuation e de criar essa pressa para receber fundings gigantescos. E, também, para justificar esse custo massivo em infraestrutura. Mais do que necessariamente algo pragmático em torno da crença de que se eu gastar 100 bilhões de dólares em IA hoje eu vou chegar numa AGI. Acho que é mais sobre ser o melhor modelo de linguagem que vai estar adotado de forma massificada.

Para áreas que envolvam “coisas intangíveis”, como design, a IA não deve ser grande ameaça, disse cientista da computação que trabalhou nos primórdios da OpenAI – Imagem: Collagery/Shutterstock

Olhar Digital: Como você analisa o impacto da IA no mercado de trabalho e o temor de muitos de perder o emprego para essa tecnologia?

Essa foi uma das razões pela qual eu fundei a Bria. Ter uma associação justamente pensando nesse impacto socioeconômico. Hoje, o que está muito evidente é o impacto em engenharia de software. Qualquer área na qual é muito fácil validar se aquele trabalho está correto ou não vai ser muito penalizada pela IA. Em código [programação], por exemplo, é muito fácil você saber se aquilo funciona ou não funciona. Você testa, vem o resultado e você sabe se precisa melhorar. Então, coisas iterativas nas quais você consegue fazer pequenos ajustes para avaliar se funciona, se performa mais ou não, estão bastante em risco.

Já para o que é intangível é mais complexo. Por exemplo: design. Não tem como você testar se aquele design está melhor ou pior que o outro sem ser num aspecto julgamental. Questões de estilo, domínio etc são mais difíceis para uma IA replicar. Agora, outras áreas – por exemplo: trabalho contábil. Você soma e já sabe em qual resultado precisa chegar. E aí, nesse caso, você consegue analisar se o número não está batendo para revisar, reiterar etc. E a IA é muito boa nisso. Ela é muito boa em tudo que você consegue ter uma base, um target, um objetivo. E você consegue fazer pequenos ajustes que melhoram ou pioram o resultado.

Plataformas como OpenClaw estão na moda e envolvem agentes de IA “conversando” com agentes de IA, mas a tendência para o futuro é outra, segundo brasileiro ex-OpenAI – Imagem: Stockinq/Shutterstock.com

Olhar Digital: Quais discussões provavelmente vamos ter daqui a cinco ou dez anos?

Daqui a cinco anos não vamos mais estar falando sobre modelos de linguagem em si. Vamos estar falando sobre IA como um todo. Modelos de geração de imagem, modelos de geração de áudio, modelos de classificação etc. Acho que tem várias áreas que vão ter evoluído. Hoje, essa corrida acaba muito centrada em LLMs, mas cada vez mais tem evoluído para outras frentes. Então, acho que vão ter novos players. Daqui cinco anos, sua pergunta pode ser “quais são os cinco melhores players [de IA] para a área x e quais são os cinco melhores para a área y?”.

A IA agêntica deve se consolidar. Mas não agentes complexos. Hoje, quando a gente olha OpenClaw e toda essa estrutura agêntica, ela envolve muitos agentes chamando agentes numa forma quase recursiva. Acho que a gente vai evoluir para modelos maiores e com mais janela de contexto, que conseguem rodar por bastante tempo. E parar de precisar ficar fazendo em loop essa interação.

No mundo corporativo, na indústria, provavelmente vai ter uma pulverização do uso de IA. Recentemente, saiu a pesquisa de Stanford sobre como as empresas estão usando IA no mundo. Hoje, o uso em core business é menos de 10%. Então, todo mundo está usando IA. Está usando para programar melhor, corrigir bugs, falar com cliente. Mas usando no core da empresa? Ainda é pouco. É bem sutil. E isso depende muito de educação do mercado. Então, acho que isso vai ser uma coisa que vai mudar bastante. E o uso deve se tornar mais massificado.

O post ChatGPT foi um acidente, diz brasileiro ex-OpenAI apareceu primeiro em Olhar Digital.