Derfor bliver du ved med at se "Rate limited — switching to fallback provider"
Advarslen er ikke en bug, men Hermes' indbyggede fallback mekanisme, der aktiveres når den primære model rammer rate limit — og fordi mekanismen er per besked, vender den tilbage til primær modellen ved hver ny tur [8]. Den hyppigste synder er HTTP 429 fejl fra upstream udbyderen, som ofte skyldes opbrugt token kvot...
⚠️ Rate limited — switching to fallback providerAI-generated editorial hero image for ⚠️ Rate limited — switching to fallback provider... 🔄 Primary model failed — switching to fallback: sg claude opus 4.7 via custom Sao cứ bị.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: ⚠️ Rate limited — switching to fallback provider... 🔄 Primary model failed — switching to fallback: sg claude opus 4.7 via custom Sao cứ bị. Article summary: Đây không hẳn là “bug fallback”, mà là model chính của Sếp đang bị rate limit nên Hermes tự nhảy sang fallback sg claude opus 4.7 via custom đúng như thiết kế.[8] Vì fallback của Hermes là per turn, nên mỗi tin nhắn mới . Topic tags: general web, openai, llm, ai, workflow. Reference image context from search candidates: Reference image 1: visual subject "# Fallback Providers. ## Primary Model Fallback. When your main LLM provider encounters errors — rate limits, server overload, auth failures, connection drops — Hermes can automat" source context "Fallback Providers | Hermes Agent - nous research" Reference image 2: visual subject "March 18, 2026 - (rate_limit
openai.com
Ser du gang på gang beskeden: ⚠️ Rate limited — switching to fallback provider... 🔄 Primary model failed — switching to fallback: sg claude opus 4.7 via custom? Du er ikke alene, og den gode nyhed er: det er ikke en fejl i systemet. Faktisk gør din Hermes-agent præcis det, den er designet til .
Hvad betyder advarslen egentlig?
Når din primære sprogmodel (LLM) rammer en mur af fejl — typisk rate limits, serveroverbelastning eller autentificeringsproblemer — har Hermes en elegant redningsplan. Den skifter automatisk til en backup-model, så din samtale ikke går tabt .
Fallback er per samtale-tur: Hver gang du sender en ny besked, prøver Hermes først den primære model igen. Er den stadig blokeret, skifter den på ny til fallback-modellen. Derfor ser du advarslen gentage sig .
Konteksten bevares: Hele din samtalehistorik følger med over i fallback-modellen. Du mister ingenting .
Hvorfor bliver det ved med at dukke op?
Den direkte årsag er simpel: din primære model er stadig under pres fra udbyderens begrænsninger. Hver ny besked starter forfra — primær model fejler → fallback aktiveres → gentag .
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
What is the short answer to "Derfor bliver du ved med at se "Rate limited — switching to fallback provider""?
Advarslen er ikke en bug, men Hermes' indbyggede fallback mekanisme, der aktiveres når den primære model rammer rate limit — og fordi mekanismen er per besked, vender den tilbage til primær modellen ved hver ny tur [8].
What are the key points to validate first?
Advarslen er ikke en bug, men Hermes' indbyggede fallback mekanisme, der aktiveres når den primære model rammer rate limit — og fordi mekanismen er per besked, vender den tilbage til primær modellen ved hver ny tur [8]. Den hyppigste synder er HTTP 429 fejl fra upstream udbyderen, som ofte skyldes opbrugt token kvote eller for store context forespørgsler [2].
What should I do next in practice?
Hvis både primær og fallback er konfigureret via den samme custom endpoint eller gateway, kan en overbelastet pool få fejlen til at gentage sig igen og igen [6][8].
Typisk stammer problemet fra en HTTP 429-fejl ("Too Many Requests"), som kan have flere årsager :
Opbrugt token-kvote: Du har sendt for mange forespørgsler inden for en kort periode.
For stor kontekst: OpenClaw's dokumentation advarer specifikt om, at 429 kan skyldes "Extra usage is required for long context requests". Hvis din prompt eller samtale er meget lang, kan det udløse strengere kvotebegrænsninger.
Falsk rate limit: I sjældne tilfælde kan OpenClaw fejlagtigt rapportere en rate limit, selvom den underliggende API fungerer fint .
Det kritiske punkt: Custom endpoint
Når du ser "sg claude opus 4.7 via custom", betyder det, at din fallback-model kører gennem en særligt konfigureret udbyder eller endpoint — sandsynligvis defineret i din config.yaml-fil .
Her er fælden: Hvis både din primære model og fallback-modellen kører gennem den samme gateway, det samme backend-pool eller den samme API-nøgle, vil en overbelastning ramme begge veje. Du oplever så et skift af modelnavn, men i praksis er du stadig fanget i den samme flaskehals .
Sådan diagnosticerer du problemet
Før du begynder at ændre konfigurationer, bør du undersøge præcis, hvad der foregår:
1. Kør en gateway probe
Hvis du bruger OpenClaw som gateway, giver kommandoen her et øjebliksbillede af forbindelsen :
bash
openclaw gateway probe
Se efter
Reachable: yes
og eventuelle fejlkoder. En komplet status får du med:
bash
openclaw gateway status --deep
2. Tjek din config.yaml
Åbn ~/.hermes/config.yaml og undersøg :
Hvilken primær model og udbyder er konfigureret?
Hvilke modeller står under fallback_providers:?
Bruger primær og fallback den samme custom endpoint?
Hvis problemet især opstår i lange samtaler eller med store filer som kontekst, er det sandsynligvis en long-context rate limit. Prøv at starte en ny session med kortere prompts for at se, om problemet forsvinder .
Sådan løser du det permanent
Løsning 1: Adskil primær og fallback
Sørg for at din fallback-model bruger en anden udbyder eller et separat endpoint, så en rate limit det ene sted ikke blokerer begge. Brug for eksempel OpenRouter som fallback, hvis din primære er Anthropic direkte .
Løsning 2: Undersøg din API-nøgle
Log ind på din udbyders konsol (f.eks. Anthropic, OpenAI).
Tjek dit forbrug og eventuelle kvotelofter.
Hvis du bruger OpenClaw gateway, skal API-nøglen ligge på den maskine, der kører gatewayen — typisk i ~/.openclaw/.env.
Genstart gateway-tjenesten efter ændringer .
Løsning 3: Håndter long-context problemer
Hvis du rammer long-context rate limits, kan du :
Reducere mængden af kontekst i dine prompts.
Opgradere dit API-abonnement til en højere kvote.
Konfigurere en model med større kontekstvindue.
Løsning 4: Aktivér fallback-kæden korrekt
Brug Hermes' indbyggede kommando til at konfigurere fallback :
bash
hermes fallback add
Dette guider dig gennem valg af udbyder og model og gemmer konfigurationen korrekt i config.yaml.
Konklusion
At se advarslen gentage sig er frustrerende, men det er Hermes, der arbejder for dig — ikke en bug, der arbejder imod dig. Mekanismen er per-design per-tur, og den eneste vej til en permanent løsning er at fjerne flaskehalsen i din primære model eller adskille primær og fallback på infrastruktur-niveau .
Start med at køre en gateway probe, tjek din config.yaml, og undersøg om primær og fallback deler underliggende infrastruktur. I de fleste tilfælde er det netop dér, nøglen til en stabil oplevelse ligger.
Comments
0 comments