Ada beberapa punca yang perlu diperiksa:
Amaran menunjukkan fallback melalui sg claude opus 4.7 via custom
Maka kedua-duanya akan terjejas serentak apabila had kadar dikenakan. Anda akan lihat pertukaran berlaku, tetapi prestasi tetap "tersekat" kerana kedua-dua laluan mengalami masalah kuota yang serupa.
Dokumentasi Hermes mengesahkan bahawa endpoint tersuai disimpan dalam config.yaml, dan rantai fallback juga terkandung dalam fail yang sama di bawah entri fallback_providers.
Jika ralat spesifik adalah HTTP 429: rate_limit_error: Extra usage is required for long context requests, ini menandakan permintaan anda terlalu besar (konteks panjang) dan pembekal memerlukan kuota tambahan untuk memprosesnya.
Ada kes di mana OpenClaw memaparkan mesej "API rate limit reached" sedangkan API sebenar berfungsi dengan baik — ini adalah bug yang dilaporkan dalam mekanisme cooldown gateway, bukan had kadar sebenar daripada pembekal.
Buka fail ~/.hermes/config.yaml dan periksa entri fallback_providers. Pastikan model sandaran menggunakan laluan pembekal yang berbeza sepenuhnya daripada model utama — bukan sekadar model berbeza tetapi melalui gateway atau pool yang sama.
Contoh konfigurasi yang betul:
fallback_providers:
- provider: openrouter
model: anthropic/claude-sonnet-4Setiap entri memerlukan kedua-dua provider dan model. Jika ada yang hilang, fallback akan dilumpuhkan.
Jalankan arahan openclaw gateway probe
Reachable: yesCapability: limited - missing scope: operator.readretry-after, RESOURCE_EXHAUSTED, atau menyebut 'organization quota', ini mengesahkan masalah di peringkat pembekal model Pastikan kekunci API anda:
Jika ralat khusus berkaitan long context:
Jalan pintas: Semasa menunggu had kadar pulih, anda boleh menukar model utama terus kepada model yang tidak mengalami masalah kuota. Gunakan arahan hermes model/model dalam sesi perbualan untuk bertukar antara pembekal yang telah dikonfigurasikan.
Penyelesaian jangka panjang:
Intinya: amaran ini berulang kerana Hermes melaksanakan tugasnya dengan betul — bertukar ke sandaran apabila utama gagal, tetapi kembali ke utama setiap kali ada mesej baru. Untuk menghentikannya secara kekal, anda perlu menyelesaikan punca di peringkat model utama atau gateway, bukan sekadar mengabaikan mesej amaran tersebut.
Comments
0 comments