Gemini Omni: Google anuncia modelo para criar “qualquer coisa” com um único comando

O Google anunciou nesta terça-feira (19) o Gemini Omni, um modelo para criar “qualquer coisa a partir de qualquer prompt”. A apresentação aconteceu durante o evento Google I/O, uma das principais conferências da big tech no ano.

A tecnologia foi anunciada por Demis Hassabis, CEO da DeepMind (braço de pesquisa da empresa), que afirmou que o Omni combina as expertises dos modelos Gemini para um “novo nível de entendimento de mundo, multimodalidade e edição”.

Hassabis ainda comparou a novidade com o Nano Banana, Genie e Veo. Segundo ele, os modelos são capazes de gerar vídeos e simulações realistas, com noções de realidade e física, mas ainda com algumas limitações. O Omni é um passo além: ele pode representar ideias ainda mais complexas, como gravidade e energia cinética – que os três modelos anteriores não conseguiam entender.

O executivo atribuiu o avanço às novas capacidades de raciocínio profundo do Gemini. O resultado são vídeos, imagens ou gráficos ainda mais realistas.

Na demonstração ao vivo durante o evento, Hassabis pediu que o Gemini Omni fizesse uma animação stop motion, com estética de massinha, para explicar o funcionamento de proteínas.

Demonstração do Gemini Omni durante o evento Google I/O – Imagem: Google

Imagens realistas e tom conversacional

O Gemini Omni funciona através de linguagem conversacional. Ou seja, o usuário pode criar algo a partir de um prompt e pedir ajustes como se estivesse conversando com a IA.

O modelo também permite editar imagens que já existem, sem necessidade de criar algo do zero. Na demonstração, Hassabis pediu que o Omni distorcesse a realidade de um vídeo dele mesmo se olhando no espelho. Também é possível ajustar a estética e adicionar itens.

“Tudo se torna uma tela para criar novas realidades”, afirmou o CEO da DeepMind.

Gemini Omni Flash é o primeiro modelo da família Omni disponível ao público – Imagem: Google

Gemini Omni Flash

Durante o Google I/O, a big tech anunciou que o primeiro modelo da família Gemini Omni, o Gemini Omni Flash, já está disponível para o público. Ele funciona no aplicativo do Gemini, no YouTube Shorts e no modelo Flow.

Hassabis ainda revelou que a próxima versão, o Omni Pro, estará disponível em breve, mas sem dar detalhes.

O post Gemini Omni: Google anuncia modelo para criar “qualquer coisa” com um único comando apareceu primeiro em Olhar Digital.