AWS avança em infraestrutura e serviços de IA para um mundo de “bilhões de agentes”
Durante o AWS Re:Inventempresa revela novos chipsserviços e modelos para sustentar a próxima fase da inteligência artificial em larga escala

O mundo corporativo caminha para uma nova transformação em que “bilhões de agentes” de inteligência artificial (IA) passarão a interagir simultaneamente dentro de empresas de todos os segmentos. Foi com essa mensagem que Matt GarmanCEO da AWSabriu o primeiro dia do Re:Invent 2025principal evento global para parceiros e clientes da empresa de nuvemque acontece nesta semana em Las Vegasnos Estados Unidos.
Segundo eleessa transformação agêntica deve acelerar a transição da IA de um fenômeno técnico para um mecanismo capaz de gerar retorno realredefinindo processosprodutividade e competitividade global. “Agentes estão começando a escalar o impacto das pessoasem alguns casos em até dez vezes. Agoratodos terão mais tempo para inventar”disse.
Leia mais: “Temos talentos únicos”defende VP Latam da AWS sobre adoção de IA na região
Ele reconheceuno entantoo desafio do ROI para organizações do mundo inteiro. Segundo o CEOmuitos dos retornos prometidos aos investimentos em IA ainda não foram capturados por companhias. Isso é o que corrobora estudos como aquele lançado pelo MIT em agostoque aponta que 95% dos projetos de IA generativa não trazem retorno para as companhias.
Para Garmanos agentes são o caminho para acelerar a curva. “O verdadeiro valor da IA não foi alcançadomas isso vai se transformar rápido”anotou.
A AWS busca estar no centro da infraestrutura necessária para suportar essa nova era da IA. Durante sua falao CEO enfatizou que a empresa tem papel central do desempenhoescalabilidade e custo operacional na corrida por modelos maiores e aplicações mais complexas – com novos produtos e serviços que vão desde a camada de hardware até as aplicações. “Nada é pequeno demais para não estar no nosso foco agora”afirmou.
Infraestrutura e hardware ganham protagonismo
A AWS abriu o conjunto de anúncios reforçando a parceria histórica com a Nvidia. A empresa apresentou a nova família de instâncias EC2 baseadas na GPU Nvidia P6E-GB300construída com otimizações conjuntas de hardwaresoftware e operação para cargas de IA em larga escala.
Outro anúncio foi o serviço AWS AI Factoriesque leva a infraestrutura de IA de grande porte diretamente para data centers de clientes que precisam atender requisitos rígidos como soberania de dados e operação local. A iniciativa nasce da experiência da AWS em projetos de treinamento e inferência realizados com empresas como Anthropic e OpenAI.
A linha de chips proprietários da AWS também cresceu com o anúncio da disponibilidade geral de ultraservidores Trainium 3. A nova geração do chipdesenhado para cargas de treinamento e inferência de grande escalainaugura o uso de litografia de três nanômetros na nuvem da AWS e promete 40% mais eficiência e o dobro de capacidade de computação.
Os chips estarão por tráspor exemplodo Project Reinieriniciativa que soma mais de 30 data centers e 1,1 GW de energia para o treinamento dos próximos modelos Claudeda Anthropic.
A empresa ainda antecipou detalhes do Trainium 4. A próxima geração de seu chip de IA promete um salto significativo em relação ao antecessorcom seis vezes mais desempenho em FP4quatro vezes mais largura de banda de memória e eficiência energética também duplicada.
AWS expande oferta de modelos
Na camada de modelosa AWS anunciou adições ao Amazon Bedrockplataforma que reúne modelos de diferentes provedores e ferramentas para customizarintegrarproteger e operar agentes de IA em escala. Segundo a companhiao Bedrock já soma mais de 100 mil usuários globalmenteincluindo mais de 50 que operam 1 trilhão de tokens por semana.
A empresa confirmou a entrada de 18 novos modelos no Bedrockentre eles Google GemmaMinimax e Nvidia Memotron. Novas versões da Mistralincluindo Mistral Large 3 e a família Ministral 3voltada a aplicações multimodais compactastambém entrarão na plataforma.
No conjunto de modelos proprietáriosa AWS apresentou a família Nova 2formada pelas versões LiteProSonic e Omni. O Nova 2 Lite atende tarefas multimodais do dia a dia com foco em eficiência; o Nova 2 Pro é voltado a aplicações que exigem alta precisãocomo migração de software e análises complexas; o Nova 2 Sonic foca em capacidades de conversação em tempo real; e o Nova 2 Omni reúne textoimagemvídeo e áudio em um único modelo para fluxos criativos e operacionais que demandam múltiplos formatos.
Modelos e agentes de fronteira
Para organizações com necessidades avançadas de IAa Amazon revelou uma nova oferta voltada para os chamados “modelos de fronteira”o Nova Forge. A plataforma possibilita combinar dados da organização com modelos pré-existentes no Bedrock para gerar um novo modelo avançado.
A proposta mira empresas que desejam alto grau de customização de modelosmas não dispõem da escala necessária para treiná-los do zero. Com a soluçãotorna-se possível adaptar modelos robustos às necessidades específicas do negócio sem que eles percam as capacidades fundamentais aprendidas na etapa original de pré-treinamento.
A promessa é que empresas poderão produzir modelos que compreendem seus domíniosmas ainda preservem funções essenciais como sumarizaçãoraciocínio e interpretação multimodal. RedditSony e Booking.com já estão entre os usuários iniciais do serviço.
No front de agenteshá novas adições ao Agent Coreplataforma para criação e operação de agentes lançada em julho. Uma das novas capacidades é o Policydescrito como um “firewall para agentes”que define limites operacionais de forma naturalconvertendo regras em políticas executáveis pelo sistema. Também foi anunciado o Evaluationsmódulo de avaliação contínua que mede a qualidade de agentes a partir de interações reais e alerta quando o comportamento se desvia do esperado.
Ainda na linha de agentesa Amazon revelou um novo grupo de “agentes de fronteira” proprietários. Diferentemente dos tradicionaisos novos agentes de última geração são capazes de operar autonomamenteescalar para milhares de tarefas simultâneas e executar fluxos de trabalho por horas ou dias sem intervenção humana.
Veja também: IA acelera diagnóstico de câncer na maior rede privada de hospitais do México
O primeiro deles é o Kiro Autonomous Agent. O agente é capaz de se conectar a ferramentas como GitHubJira e Slackmantém contexto entre sessões e executa tarefas de backlog de ponta a ponta. Segundo a AWSa ferramenta é capaz de aprender padrões dos times de TIcomportamentos de código e arquitetura para replicar práticas internas em novos projetos.
Já o Security Agent pode revisar documentos técnicosidentificar vulnerabilidades e sugerir correções. A plataforma automatiza processos de pentest e busca reduzir a defasagem entre velocidade de entrega e as demandas de segurança no desenvolvimento.
Por fimno front operacionalo DevOps Agent é voltado para monitoramento de recursostelemetria e identificação de causas-raiz de incidentes. A solução se integra a ferramentas de observabilidade como Dynatrace e a pipelines de CI/CD. Ao detectar falhaso agente sugere ajustes e recomenda guardrails para evitar recorrências. A AWS descreve a ferramenta como “um engenheiro de plantão permanente”.
*O jornalista viajou a Las Vegas a convite da AWS.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!


