두 가지 유형의 제한이 있습니다:

  1. 사용량 제한은 조직이 API 사용에 대해 부담할 수 있는 월별 최대 비용을 설정합니다.
  2. 요청 제한은 조직이 정의된 기간 동안 수행할 수 있는 API 요청 수를 제한합니다.

제한 사항

  • 제한은 API 남용을 방지하면서 일반적인 고객 사용 패턴에 미치는 영향을 최소화하도록 설계되었습니다.
  • 제한은 사용 계층별로 정의되며, 각 계층은 서로 다른 사용량 및 요청 제한 세트와 연결됩니다.
  • API를 사용하는 동안 특정 임계값에 도달하면 조직이 자동으로 계층이 증가합니다.
    제한은 조직 수준에서 설정됩니다. ConsolePlans and Billing에서 조직의 제한을 확인할 수 있습니다.
  • 더 짧은 시간 간격 동안 요청 제한에 도달할 수 있습니다. 예를 들어, 분당 60개의 요청(RPM) 속도는 초당 1개의 요청으로 적용될 수 있습니다. 높은 볼륨의 요청이 짧은 시간에 집중되면 요청 제한을 초과하여 요청 제한 오류가 발생할 수 있습니다.
  • 아래에 설명된 제한은 표준 제한이며 “Build” API 플랜에 적용됩니다. 더 높은 맞춤형 제한을 원하시면 콘솔에서 “Select Plan”을 클릭하여 맞춤형 “Scale” 플랜으로 이동하여 영업팀에 문의하십시오.
  • 현재 모든 Claude 모델은 동일한 사용량 및 요청 제한을 가지고 있습니다.

사용량 제한

각 사용 계층에는 매월 API를 사용할 수 있는 한도가 있습니다. 계층의 사용 한도에 도달하면 다음 계층에 적합할 때까지 다음 달까지 기다려야 API를 다시 사용할 수 있습니다.

다음 계층으로 넘어가려면 보증금 요건과 의무 대기 기간을 충족해야 합니다. 상위 계층은 더 긴 대기 기간이 필요합니다. 계정에 과도한 자금을 투입하는 위험을 최소화하기 위해 월 사용 한도보다 많은 금액을 예치할 수 없습니다.

사용 계층계층 상승 요건월 최대 사용량
크레딧 구매첫 구매 후 대기
무료해당 없음0일$10
Build Tier 1$50일$100
Build Tier 2$407일$500
Build Tier 3$2007일$1,000
Build Tier 4$40014일$5,000
Scale해당 없음해당 없음해당 없음

요청 제한

현재 요청 제한은 각 모델 클래스에 대해 분당 요청 수, 분당 토큰 수 및 일일 토큰 수로 측정됩니다. 요청 제한을 초과하면 429 오류가 발생합니다. 관련 요청 제한을 보려면 요청 제한 계층을 클릭하세요.

모델 계층분당 요청 수(RPM)분당 토큰 수(TPM)일일 토큰 수(TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

응답 헤더

API 응답에는 적용된 요청 제한, 현재 사용량 및 제한이 재설정되는 시기를 보여주는 헤더가 포함되어 있습니다.

다음 헤더가 반환됩니다:

헤더설명
anthropic-ratelimit-requests-limit요청 제한 창 내에서 허용되는 최대 요청 수입니다.
anthropic-ratelimit-requests-remaining현재 요청 제한 창 내에 남아 있는 요청 수입니다.
anthropic-ratelimit-requests-reset요청 제한 창이 재설정되는 시간으로, RFC 3339 형식으로 제공됩니다.
anthropic-ratelimit-tokens-limit요청 제한 창 내에서 허용되는 최대 토큰 수입니다.
anthropic-ratelimit-tokens-remaining현재 요청 제한 창 내에 남아 있는 토큰 수로, 가장 가까운 천 단위로 반올림됩니다.
anthropic-ratelimit-tokens-reset토큰 요청 제한 창이 재설정되는 시간으로, RFC 3339 형식으로 제공됩니다.

토큰 요청 제한 헤더는 남은 토큰이 더 적은 제한(일일 또는 분당)에 대한 값을 표시합니다. 예를 들어, 일일 토큰 제한을 초과했지만 지난 1분 동안 토큰을 보내지 않은 경우 헤더에는 일일 토큰 요청 제한 값이 포함됩니다.