Rate limits
Как работают лимиты и как с ними жить
KodikRouter применяет несколько уровней лимитов, чтобы защитить провайдеров и вашу биллинг-квоту. По умолчанию tier Starter даёт 500 RPM на ключ.
Уровни лимитов
API-ключ60 secrate_limit_rpm ключаНастраивается при создании ключа
Ключ × модель60 secpolicy per modelИспользуется для дорогих моделей (Opus, o1)
Организация60 secorg policyСуммарный RPM по всем ключам
Кредитыper requestcredit_limit ключаДневной/месячный бюджет в рублях
Заголовки в ответе
Каждый ответ (даже 200 OK) содержит состояние текущего окна:
http
Обработка 429
При превышении лимита возвращается 429 Too Many Requests с заголовком Retry-After (секунд до сброса). Уважайте его и добавьте джиттер.
typescript
Как жить с лимитами
- Разбивайте нагрузку по нескольким ключам (backend по регионам / клиентам).
- Кешируйте повторяющиеся prompts на своей стороне.
- Включайте
route: "fallback"— если модель упёрлась в лимит, запрос уйдёт на следующую в цепочке. - Мониторьте
X-RateLimit-Remainingи расставляйте приоритеты между очередями.
Нужны выше лимиты?
Enterprise-тариф даёт индивидуальные RPM и приоритетную маршрутизацию.Свяжитесь с нами.
