У нас есть два типа ограничений:

  1. Ограничения использования устанавливают максимальную ежемесячную стоимость, которую организация может понести за использование API.
  2. Ограничения скорости ограничивают количество запросов к API, которые организация может сделать в течение определенного периода времени.

О наших ограничениях

  • Ограничения предназначены для предотвращения злоупотребления API, при этом минимизируя влияние на распространенные модели использования клиентами.
  • Ограничения определяются уровнем использования, где каждый уровень связан с различным набором ограничений использования и скорости.
  • Ваша организация будет автоматически повышать уровни по мере достижения определенных порогов при использовании API. Ограничения устанавливаются на уровне организации. Вы можете увидеть ограничения вашей организации в разделе Планы и Биллинг в Консоли.
  • Вы можете достичь ограничений скорости за более короткие интервалы времени. Например, скорость 60 запросов в минуту (RPM) может быть ограничена как 1 запрос в секунду. Короткие всплески запросов с высоким объемом могут превысить ограничение скорости и привести к ошибкам ограничения скорости.
  • Указанные ниже ограничения являются нашими стандартными ограничениями и применяются к плану API “Build”. Если вы ищете более высокие, пользовательские ограничения, свяжитесь с отделом продаж, нажав “Выбрать план” в консоли, чтобы перейти на наш пользовательский план “Scale”.
  • Все модели Claude в настоящее время имеют одинаковые ограничения использования и скорости.

Ограничения использования

Каждый уровень использования имеет ограничение на то, сколько вы можете использовать API каждый календарный месяц. Как только вы достигнете лимита использования вашего уровня, пока вы не будете соответствовать следующему уровню, вам придется ждать до следующего месяца, чтобы снова иметь возможность использовать API.

Чтобы претендовать на следующий уровень, вы должны соответствовать требованию к депозиту и обязательному периоду ожидания. Более высокие уровни требуют более длительных периодов ожидания. Обратите внимание, чтобы минимизировать риск переплаты вашего счета, вы не можете внести депозит больше, чем ваш месячный лимит использования.

Уровень использованияТребования для перехода на уровеньМаксимальное использование в месяц
Покупка кредитаОжидание после первой покупки
БесплатныйN/A0 дней$10
Build Tier 1$50 дней$100
Build Tier 2$407 дней$500
Build Tier 3$2007 дней$1,000
Build Tier 4$40014 дней$5,000
ScaleN/AN/AN/A

Ограничения скорости

Наши текущие ограничения скорости измеряются в запросах в минуту, токенах в минуту и токенах в день для каждого класса модели. Если вы превысите любое из ограничений скорости, вы получите ошибку 429. Нажмите на уровень ограничения скорости, чтобы просмотреть соответствующие ограничения скорости.

Уровень моделиЗапросов в минуту (RPM)Токенов в минуту (TPM)Токенов в день (TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

Заголовки ответа

Ответ API включает заголовки, которые показывают вам применяемое ограничение скорости, текущее использование и когда ограничение будет сброшено.

Возвращаются следующие заголовки:

ЗаголовокОписание
anthropic-ratelimit-requests-limitМаксимальное количество запросов, разрешенных в пределах окна ограничения скорости.
anthropic-ratelimit-requests-remainingКоличество оставшихся запросов в текущем окне ограничения скорости.
anthropic-ratelimit-requests-resetВремя, когда окно ограничения скорости запросов будет сброшено, предоставляется в формате RFC 3339.
anthropic-ratelimit-tokens-limitМаксимальное количество токенов, разрешенных в пределах окна ограничения скорости.
anthropic-ratelimit-tokens-remainingКоличество оставшихся токенов, округленное до ближайшей тысячи, в текущем окне ограничения скорости.
anthropic-ratelimit-tokens-resetВремя, когда окно ограничения скорости токенов будет сброшено, предоставляется в формате RFC 3339.

Заголовки ограничения скорости токенов отображают значения для ограничения (ежедневного или в минуту) с наименьшим количеством оставшихся токенов. Например, если вы превысили дневной лимит токенов, но не отправляли токены в течение последней минуты, заголовки будут содержать значения дневного ограничения скорости токенов.