A chinesa DeepSeek está trabalhando no desenvolvimento do que chamou de “próxima geração” dos modelos de inteligência artificial. Enquanto isso não se torna realidade, a startup vai apresentando algumas novidades.
A mais recente é o lançamento de uma versão “intermediária” da tecnologia. Segundo a empresa, o DeepSeek-V3.2-Exp é mais eficiente no processamento de longas sequências de texto do que as ferramentas anteriores.
Passo intermediário, diz startup chinesa
Segundo reportagem da Reuters, o novo modelo inclui um mecanismo chamado DeepSeek Sparse Attention. A empresa chinesa afirma que este recurso possibilita reduzir os custos de computação e aumentar o desempenho da IA.
A startup ainda afirmou que o DeepSeek-V3.2-Exp é “um passo intermediário em direção à arquitetura de próxima geração” que já está sendo desenvolvida. Este será provavelmente o lançamento mais importante da companhia desde que sacudiu o mercado no início deste ano.
Apesar de termos poucas informações disponíveis sobre as verdadeiras capacidades da nova geração de inteligência artificial do DeepSeek, a publicação ressalta que a nova ferramenta vai aumentar a pressão sobre as rivais do setor. Basta observar quais serão as reações da OpenAI, dona do ChatGPT, por exemplo.
Leia mais
DeepSeek revela quanto gastou para treinar seu modelo de IA
DeepSeek deve lançar agente de IA até o final do ano
EUA vs China: DeepSeek tem plano para acelerar na corrida tech
Lançamento do DeepSeek foi um marco
A IA do DeepSeek foi projetada para lidar com tarefas complexas de raciocínio e tem apresentado resultados surpreendentes.
O grande diferencial é o baixo custo da tecnologia, o que pode ameaçar a posição dominante dos principais players.
Para se ter uma ideia, o modelo chinês foi treinado ao custo de aproximadamente US$ 6 milhões, enquanto ferramentas como o Llama 3.1, da Meta, custaram mais de US$ 60 milhões para serem desenvolvidos.
A empresa chinesa adota estratégias como o chamado aprendizado por reforço, que permite que os modelos aprendam por tentativa e erro.
Além disso, ativa apenas uma fração dos parâmetros do modelo para tarefas específicas, economizando recursos computacionais.
E melhora a capacidade dos modelos de processar dados e identificar padrões complexos.
A startup ainda adota um modelo parcialmente aberto, permitindo que pesquisadores acessem seus algoritmos.
Isso democratiza o acesso à IA avançada e promove maior colaboração na comunidade global de pesquisa.
O post DeepSeek lança modelo ‘intermediário’ e promete ‘próxima geração’ da IA apareceu primeiro em Olhar Digital.