Há poucas semanas, a Apple divulgou novas versões de seus modelos de inteligência artificial, explicando como foram treinados, otimizados e avaliados.
Os detalhes estão no documento Apple Intelligence Foundation Language Models – Tech Report 2025, que descreve diversos aspectos técnicos dos novos modelos de IA, como arquitetura, fontes de dados, pré e pós-treinamento, desenvolvimento de ferramentas, otimizações e benchmarks, explica artigo publicado no site 9to5Mac.
3 bilhões de parâmetros divididos em dois blocos
O modelo disponível para desenvolvedores possui cerca de 3 bilhões de parâmetros divididos em dois blocos. “O bloco 1 contém 62,5% do total de camadas de transformador, enquanto o bloco 2 contém as 37,5% restantes, mas as projeções de chave e valor foram removidas”, explica o documento.
Isso significa, de acordo com o 9to5Mac, que o modelo exige menos memória cache, assim como o tempo para gerar a resposta também foi reduzido. Por isso, a Apple afirma que o desempenho geral do modelo e a qualidade das respostas foi otimizado.
Modelo de inteligência artificial na nuvem tem arquitetura diferenciada
Na nuvem, a Apple adotou uma arquitetura chamada Parallel-Track Mixture-of-Experts (PT-MoE). Nela, sub-redes especializadas são ativadas apenas quando o tema de solicitação exige. Por exemplo, se o assunto for música, apenas as redes ligadas a esse tópico entram em ação. Isso torna as respostas mais rápidas e precisas.
O segredo está no novo “Transformador de Trilha Paralela”, que processa as solicitações em trilhas independentes e sincronizadas, evitando gargalos e melhorando a eficiência. Como cada solicitação é processada de forma independente e paralela, o resultado é um modelo de inteligência artificial mais ágil, escalável e econômico em recursos, mas que mantém alto nível de inteligência.
Suporte a outros idiomas também aumentou
Uma das dificuldades enfrentadas pela Apple para implementar seus modelos de inteligência artificial é o suporte limitado a outros idiomas. Mas a empresa, pelo menos, está tentando mudar esse jogo e agora suporta outras línguas além do inglês.
No documento divulgado, a empresa afirma ter aumentado a quantidade de dados em outras línguas de 8% para 30%, incluindo textos reais e gerados artificialmente. Além disso, o número de tokens (número, símbolos e trechos de textos) utilizados para a IA aprender passou de 100 mil para 150 mil.
Com isso, o modelo de inteligência artificial da Apple consegue compreender mais palavras, abreviações, gírias e combinações de letras e símbolos, tornando as respostas mais precisas e próximas à forma que eles escrevem ou falam.
Essas alterações, de acordo com a Apple, melhoraram desempenho do modelo em outros idiomas. Nos testes realizados, as respostas ficaram mais confiáveis e soaram mais naturais, levando em consideração o contexto local.
Leia mais:
Apple testa nova Siri que controla apps com comandos de voz
Apple enfrenta dilema: renegar privacidade para avançar em IA?
GPT-5: novo ‘cérebro’ do ChatGPT vai chegar à Apple Intelligence em breve
Mas de onde a Apple obteve seus dados? De acordo com o 9to5Mac, eles foram obtidos da seguinte forma:
Dados públicos disponíveis na web;
Dados licenciados de editoras;
Dados sintéticos gerados por modelos menores e personalizados;
Coleta de dados visuais, incluindo OCR e notas manuscritas.
Se a Apple parecia ter embarcado tarde no trem da inteligência artificial, o relatório apresentado pela empresa mostra o investimento em melhorias significativas para tornar seus modelos mais confiáveis.
O post Saiba como a Apple treina seus modelos de inteligência artificial apareceu primeiro em Olhar Digital.