使費上限會喺兩個獨立嘅層面執行。一個係「帳戶級別」嘅使費上限,針對所有用緊 Unified Billing 嘅組織,限制晒所有 Gateway 嘅總開支。另一個係「每個 Gateway」嘅規則,提供更精細嘅控制。兩個上限係獨立執行嘅,是但一個上限爆咗先,都會攔截之後嘅請求 。呢啲上限適用於 Unified Billing 嘅請求——Cloudflare 會喺入錢嗰陣收 5% 手續費——同埋「自備金鑰」(BYOK)嘅設定,只要個模型嘅定價係已知嘅就得
。
就咁用 HTTP 429 拒絕請求,其實係好粗暴嘅做法。Cloudflare 嘅動態路由功能(測試版)就提供咗一個更聰明嘅替代方案,當預算爆咗嗰陣,佢可以自動跳去用平啲嘅模型,唔會就咁放棄個請求。路由流程可以加入預算限制節點嚟執行成本配額,而唔係直接丟棄請求,改為自動切換到另一個替代模型 。同一個系統仲支援速率限制節點、按百分比嘅 A/B 流量分流,同埋根據請求嘅 Metadata(例如用家計劃或團隊)進行條件分支,全部都可以唔使掂到應用程式嘅代碼
。
可能最值得關注嘅宣佈,係一個整合咗 Cloudflare Access 同公司現有身份供應商(IdP)嘅「身份驅動預算」封閉測試版。呢個功能解決咗共享 API 密鑰嘅老問題,正如 Cloudflare 嘅網誌所講:「根本無人知道邊個洗咗啲錢」。將開支歸屬同執行直接同公司身份綁定,等 CIO(資訊總監)同財務團隊終於可以好似管理其他商業開支咁,為 AI 建立單位經濟效益
。
透過將使費上限同真金白銀、真人掛勾,Cloudflare 今次係落重注,認為管理 AI 成本將來會變到好似追蹤任何其他雲端基礎設施開支咁,成為例行公事。
Comments
0 comments