A Microsoft está redirecionando parte de sua estratégia em inteligência artificial (IA) sob a liderança de Mustafa Suleyman, atual CEO de IA da empresa. Após uma reestruturação anunciada em meados de março, o executivo transferiu algumas responsabilidades e passou a concentrar seus esforços no desenvolvimento de superinteligência.
Segundo Suleyman, essa mudança já vinha sendo planejada há meses e ganhou tração após a renegociação do contrato com a OpenAI. “Esse tem sido um plano de longa data”, afirmou. Para ele, o conceito de superinteligência está diretamente ligado à capacidade de modelos entregarem valor prático para empresas e usuários.
Embora termos como superinteligência e inteligência geral artificial (AGI) ainda tenham definições em aberto na indústria, o executivo afirma que o foco da Microsoft está em aplicações concretas. A meta é atender desenvolvedores, empresas e consumidores com modelos de linguagem capazes de gerar resultados em escala.
Novo modelo de transcrição
A Microsoft apresentou o MAI-Transcribe-1, um modelo de transcrição que, segundo a empresa, avança no reconhecimento de fala. De acordo com Suleyman, a tecnologia opera com cerca de metade do custo de GPU em comparação com outros modelos de ponta, o que representa economia operacional.
O modelo foi desenvolvido para lidar com condições adversas de áudio, como ruído de fundo, baixa qualidade e sobreposição de falas. Ele é capaz de transcrever reuniões, gerar legendas para vídeos e analisar interações em call centers em 25 idiomas.
O treinamento envolveu uma combinação de transcrições revisadas por humanos e conteúdos gerados por máquinas. Os dados incluem gravações em estúdios controlados, além de áudios captados em ambientes com ruído, como ruas movimentadas e cenários domésticos, além de dados públicos disponíveis na internet.
Estratégia e desenvolvimento
A reestruturação da Microsoft também unificou equipes voltadas para consumidores e empresas sob a marca Copilot. Com isso, parte das operações passou a ser liderada por Jacob Andreou, enquanto Suleyman direciona seu foco para o desenvolvimento de novos modelos de fronteira.
O MAI-Transcribe-1 passa a integrar o portfólio da empresa ao lado dos modelos MAI-Voice-1 e MAI-Image-2, disponíveis na plataforma Microsoft Foundry e no novo Microsoft AI Playground. Segundo a empresa, é a primeira vez que esses modelos estão amplamente disponíveis para uso comercial.
Suleyman atribui parte do desempenho do novo modelo a uma equipe reduzida, com cerca de dez pessoas, dedicada exclusivamente ao desenvolvimento. Segundo ele, o grupo opera com menos interferência burocrática, enquanto outras equipes dão suporte em tarefas como coleta de dados e gestão de fornecedores.
Leia mais:
O que é superinteligência artificial? Veja como ela pode mudar o futuro da humanidade
14 perguntas e respostas sobre Inteligência Artificial (IA)
O que é uma AGI (Inteligência Artificial Geral)?
Visão para o futuro
A estratégia da Microsoft também acompanha movimentos de outras empresas do setor, como Meta, Amazon e Google, que vêm testando estruturas organizacionais mais enxutas para acelerar o desenvolvimento de IA.
Suleyman afirma que o objetivo é criar sistemas de IA centrados no usuário. “Todos terão um assistente de IA no bolso, de classe mundial, responsável e alinhado aos seus interesses”, disse. A proposta, segundo ele, é oferecer ferramentas que atuem diretamente em benefício dos usuários.
O post Microsoft foca em superinteligência e lança novo modelo de voz apareceu primeiro em Olhar Digital.






