Utgiftstak tillämpas på två oberoende nivåer. Ett kontonivåtak begränsar den totala förbrukningen över alla gateways för företag som använder Unified Billing. Per-gateway-regler ger en mer finkornig kontroll. Vilket tak som än nås först blockerar efterföljande anrop . Begränsningarna fungerar både för Unified Billing-anrop – där Cloudflare laddar krediter med en transaktionsavgift på 5 % – och för "bring-your-own-key"-upplägg (BYOK), förutsatt att modellens prissättning är känd
.
Ett 429-avvisande är ett trubbigt instrument. Cloudflares dynamiska routing (i beta) erbjuder ett smartare alternativ genom att tillåta återfall till billigare modeller när en budget är slut. Routing-flöden kan inkludera Budget Limit-noder som upprätthåller kostnadskvoter och, istället för att avbryta anropet, automatiskt växlar till en alternativ modell . Samma system stödjer Rate Limit-noder, procentbaserad A/B-trafikdelning och villkorlig förgrening baserat på anropsmetadata som användarplan eller team, allt utan att röra applikationskoden
.
Den kanske mest betydelsefulla nyheten är en sluten beta för identitetsdrivna budgetar som integreras med Cloudflare Access och en organisations befintliga identitetsleverantör (IdP). Detta löser det återkommande problemet med delade API-nycklar, där, som Cloudflare själva uttrycker det, "ingen vet vem som spenderade vad" . Tillskrivning per person och kontroll direkt kopplad till företagsidentiteten ger CIO:er och ekonomiteam den enhetskostnad för AI som redan finns för varje annan affärspost
.
Denna uppsättning funktioner är ett direkt svar på specifika marknadsmisslyckanden som Cloudflare observerat bland sina kunder :
Genom att knyta utgiftstak till faktiska dollar och verkliga personer satsar Cloudflare på att AI-kostnadshantering ska bli lika rutinmässig som att spåra vilken annan molninfrastrukturkostnad som helst.
Comments
0 comments