在 Hermes 的架構中,自訂端點是儲存在 config.yaml 中的設定,允許使用者連接自己架設的 API 閘道或非官方支援的供應商 。備援鏈(fallback chain)同樣記錄在
config.yaml 的 fallback_providers 段落中 。
這裡有一個值得注意的問題:如果主要模型和這個自訂端點都依賴同一個上游服務、同一組 API 金鑰、或同一個資源池(pool),那麼當上游被限制速率時,即使「切換」到備援,實際上仍是走同一條路,自然也會一起卡住。 現有資訊不足以斷定你的環境確實是這個情況,但這是機率極高的可能性,值得優先檢查 。
速率限制並不只有「請求太多」一種面貌。根據 OpenClaw 及相關文件,HTTP 429 可能來自以下幾種情境:
與其盯著那行警告乾著急,不如從以下幾個方向有系統地排查:
查看 ~/.hermes/config.yaml 中的以下段落:
如果你的環境是透過 OpenClaw Gateway 或其他 API 閘道運作:
如果你使用自訂端點或閘道(尤其是 systemd/launchd 管理的服務):
如果你發現主要模型和備援模型確實共用同一個資源池,可以:
有些使用者會看到「Rate Limit」就直覺認為只是暫時等待就好,但有時候問題根源其實是閘道內部的冷卻機制,並非上游的真實配額限制 。OpenClaw 的一個已知 Issue(#32828)就記錄了這種「假性速率限制」——API 實際上完全正常,但閘道仍然回報 rate limit 警告
。
如果你在閘道外測試 API 完全正常,但在 Hermes 中持續看到這個警告,可能需要檢查閘道的設定或重新啟動相關服務。
| 現象 | 原因 | 解法 |
|---|---|---|
| 每次發訊息都跳出 fallback 警告 | 主要模型持續被限速,per-turn 備援不斷觸發 | 解決上游限速問題,或更換主要模型 |
| 切換到備援後感覺還是卡 | 備援與主要模型共用上游或資源池 | 設定真正獨立的備援供應商 |
| 對話變長後才出現 | 長上下文請求觸發額外配額限制 | 精簡上下文或分段對話 |
| API 測試正常但介面仍報錯 | 閘道內部冷卻機制誤報 | 重啟閘道,檢查 config 設定 |
那行「switching to fallback」不是問題本身,而是一個症狀。真正的病灶在於你目前的主要模型正處於無法服務的狀態。處理掉主要模型的限制,這行警告自然就消失了。
如果你需要,可以直接讓我看你目前的 config.yaml 內容,我就能明確指出哪個主要模型在失敗、sg-* 這個備援具體指向哪裡,以及為什麼每次對話都會回到原點。
Comments
0 comments