Segundo o relato do consultor, publicado pela Axios em 28 de maio, a empresa anônima distribuiu licenças do Claude para milhares de funcionários sem nenhuma rede de proteção . Não havia tetos de gasto por usuário, nem painéis de monitoramento de custos em tempo real, nem alertas automatizados. Os funcionários receberam, essencialmente, um cheque em branco para usar uma das plataformas de IA mais avançadas e caras do mundo
.
Não surpreende que os custos tenham explodido. Engenheiros executaram agentes de codificação autônomos e complexos; equipes dispararam comandos de contexto extenso que consomem muito poder computacional; e fluxos de trabalho automatizados queimaram volumes imensos de tokens em segundo plano, tudo contribuindo para a conta mensal de meio bilhão de dólares . A farra só foi detectada por um consultor, que afirmou ter identificado o desperdício e "limpado tudo para eles"
.
A identidade da empresa continua um mistério. A escala do estouro de orçamento restringe os suspeitos a um punhado das maiores corporações do mundo. Relatórios do setor especularam sobre candidatos como a Amazon — que também é a maior investidora da Anthropic — ou outra gigante de tecnologia de porte semelhante, mas ninguém confirmou ou negou o envolvimento .
O deslize de US$ 500 milhões é a expressão mais extrema de um problema cultural e operacional que vem se alastrando pela indústria de tecnologia: o tokenmaxxing. O termo descreve a prática de maximizar o consumo de tokens de IA não porque uma tarefa exige objetivamente, mas porque o alto volume de uso foi distorcido a ponto de se tornar um sinônimo de status, produtividade e até segurança no emprego dentro de algumas organizações .
Muitas empresas presumiram, implicitamente, que um maior uso de tokens equivalia a uma maior produtividade. Esse incentivo tóxico foi amplificado por painéis e rankings internos que monitoravam com orgulho o consumo de tokens, recompensando efetivamente os funcionários por gastar mais — e não por gerar mais valor. Como observou o Everest Group em uma análise de maio de 2026, "a adoção de IA está sendo medida de forma mais agressiva do que a realização de valor da IA", transformando o consumo de tokens de um custo de insumo em uma "medalha de eficácia" .
Na empresa anônima, onde cada funcionário tinha acesso ilimitado, essa cultura entrou em combustão. Não havia mecanismo para distinguir o consumo produtivo do desperdício, e o resultado foi uma taxa de queima que consumiu, em apenas 30 dias, capital suficiente para financiar todo o orçamento de pesquisa e desenvolvimento de uma empresa menor por uma década . O incidente destaca uma lição dolorosa que a Fortune capturou em uma manchete do mesmo período: "O tokenmaxxing acabou" porque as empresas "não tiveram o ROI em IA que esperavam"
.
A falha central foi um erro de categoria. O cliente tratou o Claude como um produto SaaS convencional, com precificação previsível por licença adquirida, em vez do serviço baseado em uso real e medido por tokens que ele realmente é . Em uma licença de software tradicional, o custo é fixo. Em uma plataforma de IA de ponta, cada consulta de um funcionário, upload de arquivo, sessão de geração de código e fluxo de trabalho autônomo gera um custo variável diretamente — e sem limites, esse custo não tem um teto máximo
.
A Anthropic, como muitos fornecedores de IA, vinha migrando seus preços corporativos para modelos baseados em uso. Uma reportagem do The Register de abril de 2026 detalhou como a Anthropic começou a transferir clientes empresariais legados de planos de tarifa fixa para faturamento medido, alterando sua documentação para refletir que o modelo antigo não teria mais suporte . Essa evolução de preços, embora financeiramente lógica para a fornecedora, colocou o fardo do controle de custos diretamente sobre clientes que muitas vezes não estavam preparados para isso.
A indústria agora corre para aplicar os princípios de FinOps — historicamente usados para gerenciar custos de nuvem — ao consumo de tokens de IA. O incidente acelerou os apelos por um novo manual de governança, que inclui:
O mês de US$ 500 milhões da empresa anônima é um dado espetacular dentro de uma história muito maior e mais preocupante. O gasto empresarial com IA está disparando em todos os setores, enquanto as empresas correm para adotar a tecnologia, mas o retorno financeiro está se mostrando ilusório .
Considere o contexto: a Uber revelou em 2026 que já havia esgotado todo o seu "orçamento de tokens" anual de IA nos primeiros quatro meses do ano, impulsionado em parte pelo uso intenso do Claude Code . O CEO da Salesforce, Marc Benioff, reconheceu publicamente que a conta da sua empresa na Anthropic seria assustadora
. E uma reportagem do Financial Times, amplificada por veículos como TechRadar e Futurism, documentou que empresas como Amazon, Meta e Microsoft começaram a restringir painéis de funcionários ou a empurrá-los ativamente para longe de ferramentas de IA de terceiros, à medida que os custos e o "ruído" do uso inflado cresciam
.
Os dados confirmam a tendência. A plataforma de gestão de gastos corporativos Ramp relatou que os custos com IA disparam 50% ou mais a cada quatro meses, aproximadamente, para os maiores gastadores . Esse gasto é frequentemente retirado de orçamentos operacionais, em vez de fundos dedicados à inovação, colocando uma pressão aguda sobre os Diretores Financeiros (CFOs), que agora exigem um ROI claro da IA — uma justificativa que, para muitos, ainda não se materializou
.
A conta de US$ 500 milhões do Claude é uma história sobre o que acontece quando a implantação ultrapassa a governança. Para as organizações que ainda estão implementando IA, as lições são claras e práticas:
Embora a identidade da empresa misteriosa possa nunca ser confirmada publicamente, o incidente já se tornou uma referência para toda a indústria — um cenário de pior caso que líderes financeiros e de engenharia citarão quando argumentarem que é melhor desacelerar uma implantação e construir controles adequados do que aprender essa lição da pior maneira possível.
Comments
0 comments