A NVIDIA posiciona a Vera como a "CPU para a era dos agentes". Ao contrário dos processadores de servidor de uso geral, ela é otimizada para sistemas de IA autônomos que precisam tomar decisões rápidas e sequenciais — aprendizado por reforço, transações de banco de dados e processamento de dados em tempo real .
Este chip representa o primeiro núcleo de CPU para data center totalmente customizado da NVIDIA, conhecido como "Olympus". Ele usa um frontend de busca e decodificação de instruções com largura 10 e um preditor de ramificação neural — basicamente, usando IA para acelerar cargas de trabalho de IA . É construído sobre o conjunto de instruções Arm v9.2 e expõe 176 threads por meio de particionamento de recursos físicos, em vez do multithreading simultâneo convencional
.
| Especificação | Detalhe |
|---|---|
| Núcleos | 88 núcleos Olympus customizados (compatível com Armv9.2) |
| Largura de banda da memória | Até 1,2 TB/s via LPDDR5X |
| Interconexão NVLink-C2C | 1,8 TB/s de largura de banda para GPUs Rubin |
| Status de produção | Produção em massa a partir de maio de 2026 |
O discurso interno da NVIDIA é ousado. A empresa afirma que a Vera oferece conclusão de tarefas 1,8x mais rápida em comparação com CPUs x86, desempenho single-threaded 50% mais rápido e o dobro da eficiência em relação aos processadores de rack tradicionais .
Testes independentes pintam um quadro mais matizado, mas ainda assim impressionante. Em 26 de maio de 2026, o site de benchmarking Phoronix publicou os primeiros números de terceiros. Em uma média geométrica de diversas cargas de trabalho — incluindo compilação de código, Python, Java e processamento de banco de dados — a Vera de 88 núcleos pontuou 1,55x mais rápido que o carro-chefe da Intel, o Xeon 6980P, e cerca de 10% à frente do AMD EPYC 9575F. Ela também superou a própria CPU Grace anterior da NVIDIA em 1,6x e sustentou 90% do pico de largura de banda da memória nos benchmarks STREAM TRIAD .
O Phoronix registrou uma compilação do kernel Linux em 20 segundos na Vera, aproximadamente duas vezes mais rápido por núcleo do que um chip x86 de 128 núcleos .
Este é o primeiro servidor construído especificamente para a CPU Vera. A HPE o revelou na COMPUTEX 2026, posicionando-o para IA agêntica, aprendizado por reforço e processamento de dados em escala de fábrica de IA . Estará disponível no outono brasileiro de 2026 como parte do portfólio NVIDIA AI Computing
.
Para as implementações de maior densidade, a HPE também oferece um blade de computação com refrigeração líquida, o HPE Cray Supercomputing GX240, que acomoda até 16 CPUs Vera por blade e escala para 640 CPUs e 56.320 núcleos por rack .
A Redpanda é a camada de dados de streaming na colaboração com a NYSE. A plataforma é compatível com cargas de trabalho do Apache Kafka, e o fundador e CEO da Redpanda, Alex Gallego, afirma que os testes da própria empresa mostram que a Vera oferece "até 5,5x menos latência" em comparação com outros sistemas que eles avaliaram . Para uma bolsa de valores que lida com mais de um trilhão de mensagens por dia, esse tipo de redução de latência não é algo puramente acadêmico — ela impacta diretamente a qualidade da execução de negociações e a resiliência do sistema
.
A NYSE é o cliente financeiro de maior perfil explorando a Vera, mas a lista de adotantes iniciais parece um time dos sonhos da IA e da computação em nuvem.
A Oracle é a primeira provedora de nuvem que deve implantar a Vera em hiperescala, com planos de lançar centenas de milhares de CPUs a partir de 2026 .
A Vera não é uma história isolada. Ela é a metade CPU da plataforma maior Vera Rubin da NVIDIA — emparelhada com a GPU Rubin de próxima geração — projetada para alimentar fábricas de IA e supercomputadores . O sistema de rack Vera Rubin NVL144 é classificado para 3,6 exaflops de inferência FP4 e 1,2 exaflops de treinamento FP8, cerca de 3,3x o desempenho do atual GB300 NVL72
.
Para os mercados financeiros, a implicação é clara: bolsas e empresas de trading ficaram presas à arquitetura x86 por décadas. A Vera representa um caminho confiável para uma infraestrutura baseada em Arm e otimizada para IA, que combina largura de banda de memória extrema, densidade massiva de núcleos e integração nativa com plataformas de streaming em tempo real. A exploração da NYSE — embora ainda em estágio inicial — sinaliza que a infraestrutura dos mercados de capitais está convergindo com a computação de alto desempenho e IA, não apenas no software, mas no nível do silício.
Comments
0 comments