Ограничения скорости
Чтобы предотвратить злоупотребление и управлять нагрузкой на наш API, мы установили ограничения на то, насколько организация может использовать API Claude.
У нас есть два типа ограничений:
- Ограничения использования устанавливают максимальную ежемесячную стоимость, которую организация может понести за использование API.
- Ограничения скорости ограничивают количество запросов к API, которые организация может сделать в течение определенного периода времени.
О наших ограничениях
- Ограничения предназначены для предотвращения злоупотребления API, при этом минимизируя влияние на распространенные модели использования клиентами.
- Ограничения определяются уровнем использования, где каждый уровень связан с различным набором ограничений использования и скорости.
- Ваша организация будет автоматически повышать уровни по мере достижения определенных порогов при использовании API. Ограничения устанавливаются на уровне организации. Вы можете увидеть ограничения вашей организации в разделе Планы и Биллинг в Консоли.
- Вы можете достичь ограничений скорости за более короткие интервалы времени. Например, скорость 60 запросов в минуту (RPM) может быть ограничена как 1 запрос в секунду. Короткие всплески запросов с высоким объемом могут превысить ограничение скорости и привести к ошибкам ограничения скорости.
- Указанные ниже ограничения являются нашими стандартными ограничениями и применяются к плану API “Build”. Если вы ищете более высокие, пользовательские ограничения, свяжитесь с отделом продаж, нажав “Выбрать план” в консоли, чтобы перейти на наш пользовательский план “Scale”.
- Все модели Claude в настоящее время имеют одинаковые ограничения использования и скорости.
Ограничения использования
Каждый уровень использования имеет ограничение на то, сколько вы можете использовать API каждый календарный месяц. Как только вы достигнете лимита использования вашего уровня, пока вы не будете соответствовать следующему уровню, вам придется ждать до следующего месяца, чтобы снова иметь возможность использовать API.
Чтобы претендовать на следующий уровень, вы должны соответствовать требованию к депозиту и обязательному периоду ожидания. Более высокие уровни требуют более длительных периодов ожидания. Обратите внимание, чтобы минимизировать риск переплаты вашего счета, вы не можете внести депозит больше, чем ваш месячный лимит использования.
Уровень использования | Требования для перехода на уровень | Максимальное использование в месяц | |
---|---|---|---|
Покупка кредита | Ожидание после первой покупки | ||
Бесплатный | N/A | 0 дней | $10 |
Build Tier 1 | $5 | 0 дней | $100 |
Build Tier 2 | $40 | 7 дней | $500 |
Build Tier 3 | $200 | 7 дней | $1,000 |
Build Tier 4 | $400 | 14 дней | $5,000 |
Scale | N/A | N/A | N/A |
Ограничения скорости
Наши текущие ограничения скорости измеряются в запросах в минуту, токенах в минуту и токенах в день для каждого класса модели. Если вы превысите любое из ограничений скорости, вы получите ошибку 429. Нажмите на уровень ограничения скорости, чтобы просмотреть соответствующие ограничения скорости.
Уровень модели | Запросов в минуту (RPM) | Токенов в минуту (TPM) | Токенов в день (TPD) |
---|---|---|---|
Claude 3 Haiku | 5 | 25,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
Заголовки ответа
Ответ API включает заголовки, которые показывают вам применяемое ограничение скорости, текущее использование и когда ограничение будет сброшено.
Возвращаются следующие заголовки:
Заголовок | Описание |
---|---|
anthropic-ratelimit-requests-limit | Максимальное количество запросов, разрешенных в пределах окна ограничения скорости. |
anthropic-ratelimit-requests-remaining | Количество оставшихся запросов в текущем окне ограничения скорости. |
anthropic-ratelimit-requests-reset | Время, когда окно ограничения скорости запросов будет сброшено, предоставляется в формате RFC 3339. |
anthropic-ratelimit-tokens-limit | Максимальное количество токенов, разрешенных в пределах окна ограничения скорости. |
anthropic-ratelimit-tokens-remaining | Количество оставшихся токенов, округленное до ближайшей тысячи, в текущем окне ограничения скорости. |
anthropic-ratelimit-tokens-reset | Время, когда окно ограничения скорости токенов будет сброшено, предоставляется в формате RFC 3339. |
Заголовки ограничения скорости токенов отображают значения для ограничения (ежедневного или в минуту) с наименьшим количеством оставшихся токенов. Например, если вы превысили дневной лимит токенов, но не отправляли токены в течение последней минуты, заголовки будут содержать значения дневного ограничения скорости токенов.