Saiba como a Apple treina seus modelos de inteligência artificial

15/08/2025
05:51

Há poucas semanas, a Apple divulgou novas versões de seus modelos de inteligência artificial, explicando como foram treinados, otimizados e avaliados.

Os detalhes estão no documento Apple Intelligence Foundation Language Models – Tech Report 2025, que descreve diversos aspectos técnicos dos novos modelos de IA, como arquitetura, fontes de dados, pré e pós-treinamento, desenvolvimento de ferramentas, otimizações e benchmarks, explica artigo publicado no site 9to5Mac.

Apple aprimora modelos de inteligência artificial para otimizar a qualidade das respostas. Crédito: Song_about_summer/Shutterstock

3 bilhões de parâmetros divididos em dois blocos

O modelo disponível para desenvolvedores possui cerca de 3 bilhões de parâmetros divididos em dois blocos. “O bloco 1 contém 62,5% do total de camadas de transformador, enquanto o bloco 2 contém as 37,5% restantes, mas as projeções de chave e valor foram removidas”, explica o documento.

Isso significa, de acordo com o 9to5Mac, que o modelo exige menos memória cache, assim como o tempo para gerar a resposta também foi reduzido. Por isso, a Apple afirma que o desempenho geral do modelo e a qualidade das respostas foi otimizado.

Modelo de inteligência artificial na nuvem tem arquitetura diferenciada

Na nuvem, a Apple adotou uma arquitetura chamada Parallel-Track Mixture-of-Experts (PT-MoE). Nela, sub-redes especializadas são ativadas apenas quando o tema de solicitação exige. Por exemplo, se o assunto for música, apenas as redes ligadas a esse tópico entram em ação. Isso torna as respostas mais rápidas e precisas.

Arquitetura chamada Parallel-Track Mixture-of-Experts torna as respostas na nuvem mais rápidas e precisas. Crédito: VisderArt/Shutterstock

O segredo está no novo “Transformador de Trilha Paralela”, que processa as solicitações em trilhas independentes e sincronizadas, evitando gargalos e melhorando a eficiência. Como cada solicitação é processada de forma independente e paralela, o resultado é um modelo de inteligência artificial mais ágil, escalável e econômico em recursos, mas que mantém alto nível de inteligência.

Suporte a outros idiomas também aumentou

Uma das dificuldades enfrentadas pela Apple para implementar seus modelos de inteligência artificial é o suporte limitado a outros idiomas. Mas a empresa, pelo menos, está tentando mudar esse jogo e agora suporta outras línguas além do inglês.

No documento divulgado, a empresa afirma ter aumentado a quantidade de dados em outras línguas de 8% para 30%, incluindo textos reais e gerados artificialmente. Além disso, o número de tokens (número, símbolos e trechos de textos) utilizados para a IA aprender passou de 100 mil para 150 mil.

Modelo de IA da Apple agora suporta outras línguas além do inglês. Crédito: SomYuZu/Shutterstock

Com isso, o modelo de inteligência artificial da Apple consegue compreender mais palavras, abreviações, gírias e combinações de letras e símbolos, tornando as respostas mais precisas e próximas à forma que eles escrevem ou falam.

Essas alterações, de acordo com a Apple, melhoraram desempenho do modelo em outros idiomas. Nos testes realizados, as respostas ficaram mais confiáveis e soaram mais naturais, levando em consideração o contexto local.

Apple enfrenta dilema: renegar privacidade para avançar em IA?

GPT-5: novo ‘cérebro’ do ChatGPT vai chegar à Apple Intelligence em breve

Mas de onde a Apple obteve seus dados? De acordo com o 9to5Mac, eles foram obtidos da seguinte forma:

Dados públicos disponíveis na web;

Dados licenciados de editoras;

Dados sintéticos gerados por modelos menores e personalizados;

Coleta de dados visuais, incluindo OCR e notas manuscritas.

Se a Apple parecia ter embarcado tarde no trem da inteligência artificial, o relatório apresentado pela empresa mostra o investimento em melhorias significativas para tornar seus modelos mais confiáveis.

O post Saiba como a Apple treina seus modelos de inteligência artificial apareceu primeiro em Olhar Digital.