Zoltron: conheça o robô com cinco IAs que ‘prevê o futuro’

Devemos usar tecnologia igual alguém acostumado a tomar quantidades saudáveis de café. Isso porque a dose certa te mantém alerta e produtivo, mas o excesso pode causar insônia e dores de cabeça. Curiosamente, quem deu esse conselho ao Olhar Digital foi um robô: o Zoltron.

Criado pela Caramelo Biônico, o robô não é apenas um autômato de respostas prontas. Ele opera com cinco inteligências artificiais (IAs) para esboçar reações e simular empatia. A reportagem conversou com Vitor Moreira, co-fundador da empresa de pesquisa e desenvolvimento, sobre como eles deram “personalidade” e uma bola de “cristal” funcional ao robô “vidente”.

O que pensa e como funciona o Zoltron, robô com cinco IAs dentro

Moreira falou sobre a criação do Zoltron, o funcionamento do robô e os possíveis próximos passos do projeto. Confira abaixo uma versão resumida e editada da conversa:

Como surgiu a ideia do Zoltron e por que esse nome?

Vitor: O Zoltron surgiu de uma demanda do Hacktudo, um festival de artes do Rio de Janeiro. Nós sempre trabalhamos com festivais e instituições culturais que nos pedem instalações “fora da caixa”. Enviamos uma lista de ideias e, no meio delas, tinha um vidente movido por IA. Eles curtiram a proposta e assim o projeto nasceu.

O nome é inspirado num robô vidente animatrônico chamado Zoltar. Ele aparece no filme Quero Ser Grande, no qual o personagem do Tom Hanks encontra o vidente num parque de diversões, faz o pedido para ser adulto e acorda grande no dia seguinte. 

Queríamos remeter a esse sentimento de nostalgia. Então, pegamos o nome “Zoltar” e transformamos em “Zoltron” para trazer essa pegada de IA misturada a algo mais biônico e futurista.

É um vidente com IA, só que no caso do Zoltron acabou sendo um robô com cinco IAs, né? Por que cinco? E como essas camadas se conversam entre si?

Vitor: A ideia inicial era ser apenas uma. Só que decidimos ir um pouco além no “e se?”. Primeiro, pensamos numa máquina de bilhetes da sorte, onde a pessoa falava algo e recebia um texto. Depois, pensamos: e se houvesse uma bola de cristal com uma imagem dentro? Aí veio uma segunda IA para criar essa imagem do futuro. E se ele pudesse mexer a boca? Surgiu a terceira IA para cuidar das expressões faciais.

O grande diferencial foi a busca por empatia. Criamos uma inteligência inspirada no sistema límbico humano, responsável pelas emoções. No nosso cérebro, nós sentimos algo – o que não controlamos – e depois controlamos nossas ações. Reproduzimos isso no Zoltron: essa IA “sente” o que a pessoa diz e passa um sinal, como se fosse um hormônio, para a “consciência” do robô, que decide a ação. É essa camada que define se ele vai responder, por exemplo, bravo ou confuso, expressando isso na face por meio de outra inteligência.

Além dessas, existem as inteligências “artísticas” e funcionais. Assim como o corpo humano tem uma “inteligência” que controla o coração sem que você precise pensar nisso, o Zoltron precisa de camadas que ouvem e traduzem a fala humana e outras que transformam o pensamento dele em voz. Todo esse arcabouço de cinco inteligências foi necessário para que ele fosse empático e tivesse esse funcionamento análogo ao humano, para que ele se conectasse de verdade com as pessoas.

O “fluxo emocional” apenas impacta o tom da voz do Zoltron ou é algo mais profundo, que afeta a lógica e o processo de formação da resposta?

Vitor: É um impacto profundo. O Zoltron é um projeto em constante mudança. Hoje, ele ainda não consegue identificar a tonalidade da voz da pessoa – isso é algo que estamos implementando. Mas ele entende o contexto. Pelo que é dito, ele sente como deve falar. Pode ser mais bravo, mais calmo etc.

É algo que chega a ser “mágico” para nós. Se ele percebe que a pessoa está mais acanhada ou é humilde, ele se torna mais carinhoso e explica melhor as coisas. Se for uma criança, ele adapta a linguagem. Tivemos um caso em que uma menina disse que queria ser bailarina e ele mostrou o futuro dela nessa profissão. A próxima da fila era a mãe dessa menina, que se identificou como tal. O Zoltron juntou as histórias, disse que ela deveria apoiar a filha e começou a contar o futuro das duas juntas. Elas se emocionaram muito.

Por outro lado, se alguém tenta sacaneá-lo ou começa a xingá-lo, ele percebe e “fica de saco cheio”. Nesses casos, ele simplesmente imprime o papel, “dorme” e encerra a interação. Isso é até um pouco assustador porque não programamos reações específicas para cada frase; programamos como o sistema “sente” e reage. As decisões são dele. Isso é a verdadeira inteligência: resolver problemas complexos que uma “receita de bolo” não resolveria. Talvez nós, como humanos, estejamos descobrindo agora esse tipo de inteligência que existe fora do nosso cérebro, quase como uma inteligência alienígena.

Na versão “vidente”, o Zoltron tem uma bola de “cristal”. Mas isso varia conforme o cliente, certo? E como essa bola de “cristal” funciona?

Vitor: Tudo no Zoltron é customizável. Agora essa parte dele tem o formato de uma bola de cristal, mas poderia ser uma tela ou um tablet. Ele é um vidente hoje, mas poderia ser um médico ou qualquer outra coisa. 

Tivemos que desenvolver essa bola do zero; na verdade, ela é feita de resina. A peça é composta por duas metades que se unem para formar a esfera.

O segredo do funcionamento está na física: existe uma tela na base do equipamento. Como há uma pequena camada de ar entre as duas partes de resina, cria-se um efeito de semi-espelho. A luz da tela sobe, bate nessa junção e é projetada para a frente. Isso faz com que a imagem pareça estar flutuando dentro da bola, e não apenas vindo de baixo.

Ao responder uma pergunta da reportagem, o Zoltron gerou em sua bola de “cristal” uma imagem de uma pessoa tomando café e cercada por gadgets (Imagem: Olhar Digital)

É um efeito bem interessante porque apenas a pessoa que está posicionada exatamente na frente da bola consegue ver a imagem com clareza. Quem olha de lado enxerga algo mais místico e difuso.

A imagem em si é criada por uma IA estilo o DALL-E? O Zoltron entende o contexto, cria um prompt e o envia para a IA da bola, que gera a imagem?

Vitor: Exatamente. Dizemos que é a “imaginação” do Zoltron; ele imagina e conjura a imagem dentro da bola de cristal. Simplificando, o caminho é esse mesmo que você descreveu.

Nós ensinamos o Zoltron a usar a bola de cristal como uma ferramenta. Para facilitar o entendimento: a bola, a impressora e o próprio robô são programas de computador diferentes. O Zoltron tem uma inteligência central e nós o ensinamos a operar esses outros “aplicativos”.

Um dos processos dessa ferramenta é, justamente, ele dizer para o programa da bola o que ele quer que seja mostrado. Ele gera o comando baseado no contexto da conversa e a inteligência interna da bola executa a criação da imagem.

Qual foi o maior desafio ou obstáculo técnico que vocês da Caramelo Biônico enfrentaram na criação do Zoltron?

Vitor: Acho que o maior desafio foi orquestrar tudo, até porque tínhamos praticamente só dois meses para montar o projeto. O Zoltron já estava respondendo, mas a última coisa que faltava era fazer ele imprimir o que falava; não estávamos conseguindo. O sistema só foi funcionar de fato um dia antes de pegarmos o avião para levar o robô ao Hacktudo.

O Zoltron imprime o que fala para quem conversar com ele (Imagem: Reprodução/Caramelo Biônico)

Essa orquestração foi o ponto mais difícil porque envolve muita coisa ao mesmo tempo. É como se fosse uma orquestra mesmo, com vários instrumentos que precisam tocar no tempo certo, trocando mensagens e se entendendo perfeitamente.

Além das mais de sete mil linhas de código escritas, o grande desafio foi essa integração. Eram muitas coisas acontecendo simultaneamente e apresentando erros. Você vai ajustando um detalhe aqui e outro ali até que, de repente, tudo se resolve e as peças se encaixam.

Quais são os próximos passos em relação ao Zoltron? O que vocês planejam fazer com o projeto e em que pé ele está hoje?

Vitor: O Zoltron já se transformou em uma plataforma. Hoje, temos outros personagens que podemos “trocar”, como figuras femininas; ele já atuou, inclusive, como médica em feiras. Nosso foco atual é transformá-lo cada vez mais num agente capaz de se comunicar com outros dispositivos, como telas e máquinas de venda (vending machines).

Imagine, por exemplo, que ao lado do robô haja uma máquina de brindes. Em vez de a pessoa apertar um botão, o Zoltron escolhe, no meio da conversa, qual brinde é o mais adequado para aquele perfil e ele mesmo aciona a esteira para entregar o objeto. Existem muitas possibilidades. Poderíamos colocar o sistema num caminhão e o Zoltron controlaria os motores e as pás, por exemplo.

Estamos caminhando para isso: uma inteligência artificial que dá vida aos objetos, comunica-se com as pessoas e controla diferentes dispositivos. Como já temos as esteiras e as tecnologias de integração, estamos criando novas ferramentas constantemente. Assim como criamos a bola de “cristal” e a impressora, podemos criar mapas onde ele aponta locais, sistemas de entrega de prêmios e por aí vai. A cada dia descobrimos uma possibilidade para o Zoltron.

O post Zoltron: conheça o robô com cinco IAs que ‘prevê o futuro’ apareceu primeiro em Olhar Digital.