Ограничения
Чтобы предотвратить злоупотребления и управлять нагрузкой на наш API, мы внедрили ограничения на использование API Claude для организаций.
У нас есть два типа ограничений:
- Ограничения расходов устанавливают максимальную месячную стоимость, которую организация может потратить на использование API.
- Ограничения частоты запросов устанавливают максимальное количество API-запросов, которые организация может сделать за определенный период времени.
Мы применяем настроенные службой ограничения на уровне организации, но вы также можете установить настраиваемые пользователем ограничения для рабочих пространств вашей организации.
О наших ограничениях
- Ограничения разработаны для предотвращения злоупотребления API при минимальном влиянии на типичные схемы использования клиентами.
- Ограничения определяются уровнем использования, где каждый уровень связан с различным набором ограничений расходов и частоты запросов.
- Ваша организация будет автоматически повышать уровни по мере достижения определенных порогов при использовании API.
- Ограничения устанавливаются на уровне организации. Вы можете увидеть ограничения вашей организации на странице Ограничений в Консоли Anthropic.
- Вы можете достичь ограничений частоты запросов за более короткие интервалы времени. Например, частота 60 запросов в минуту (RPM) может применяться как 1 запрос в секунду. Короткие всплески запросов с высоким объемом могут превысить ограничение частоты и привести к ошибкам превышения лимита.
- Приведенные ниже ограничения являются нашими стандартными ограничениями. Если вам нужны более высокие, индивидуальные ограничения, свяжитесь с отделом продаж через Консоль Anthropic.
- Мы используем алгоритм токенного ведра для ограничения частоты запросов. Это означает, что ваша емкость постоянно пополняется до максимального предела, а не сбрасывается в фиксированные интервалы.
- Все описанные здесь ограничения представляют собой максимально допустимое использование, а не гарантированные минимумы. Эти ограничения предназначены для предотвращения чрезмерного использования и обеспечения справедливого распределения ресурсов между пользователями.
Ограничения расходов
Каждый уровень использования имеет ограничение на сумму, которую вы можете потратить на API каждый календарный месяц. Как только вы достигнете ограничения расходов вашего уровня, до тех пор, пока вы не получите право на следующий уровень, вам придется ждать следующего месяца, чтобы снова использовать API.
Чтобы получить право на следующий уровень, вы должны выполнить требование по депозиту и обязательный период ожидания. Более высокие уровни требуют более длительных периодов ожидания. Обратите внимание, чтобы минимизировать риск избыточного пополнения вашего счета, вы не можете внести депозит больше вашего месячного ограничения расходов.
Требования для повышения уровня
Уровень использования | Покупка кредитов | Ожидание после первой покупки | Максимальное использование в месяц |
---|---|---|---|
Уровень 1 | $5 | 0 дней | $100 |
Уровень 2 | $40 | 7 дней | $500 |
Уровень 3 | $200 | 7 дней | $1,000 |
Уровень 4 | $400 | 14 дней | $5,000 |
Ежемесячное выставление счетов | Н/Д | Н/Д | Н/Д |
Обновленные ограничения частоты запросов
Наши ограничения частоты запросов для API Messages измеряются в запросах в минуту (RPM), входных токенах в минуту (ITPM) и выходных токенах в минуту (OTPM) для каждого класса моделей. Если вы превысите любое из ограничений частоты, вы получите ошибку 429.
Ограничения ITPM оцениваются на основе длины промпта в начале каждого запроса, и оценка корректируется в конце запроса, чтобы отразить фактическое количество использованных входных токенов.
Обратите внимание, что все типы входных токенов (input_tokens
, cache_creation_input_tokens
и cache_read_input_tokens
) учитываются в ограничениях ITPM одинаково, даже если они тарифицируются по разным ставкам.
Ограничения OTPM оцениваются на основе max_tokens
в начале каждого запроса, и оценка корректируется в конце запроса, чтобы отразить фактическое количество использованных выходных токенов.
Если вы достигаете ограничений OTPM раньше, чем ожидалось, попробуйте уменьшить max_tokens
, чтобы лучше приблизить размер ваших завершений.
Нажмите на уровень ограничения частоты в таблице, чтобы просмотреть соответствующие ограничения. Ограничения частоты отслеживаются для каждой модели; поэтому модели в пределах одного уровня не имеют общего ограничения частоты.
[Продолжение таблиц и содержимого сохранено в том же формате, как в оригинале, с переводом всех заголовков и текста на русский язык, сохранением всех числовых значений и технических терминов]
[Продолжение перевода сохраняет структуру оригинала, включая все таблицы, вкладки и форматирование]
Was this page helpful?