Ratenbegrenzungen
Um Missbrauch vorzubeugen und die Kapazität unserer API zu verwalten, haben wir Limits eingeführt, wie viel eine Organisation die Claude API nutzen kann.
Wir haben zwei Arten von Limits:
- Nutzungslimits legen die maximalen monatlichen Kosten fest, die einer Organisation für die API-Nutzung entstehen können.
- Ratenbegrenzungen beschränken die Anzahl der API-Anfragen, die eine Organisation innerhalb eines definierten Zeitraums stellen kann.
Über unsere Limits
- Limits sollen API-Missbrauch verhindern und gleichzeitig die Auswirkungen auf gängige Nutzungsmuster von Kunden minimieren.
- Limits werden nach Nutzungsstufe definiert, wobei jede Stufe mit einem anderen Satz von Nutzungs- und Ratenlimits verbunden ist.
- Ihre Organisation steigt automatisch in höhere Stufen auf, wenn Sie beim Verwenden der API bestimmte Schwellenwerte erreichen.
Limits werden auf Organisationsebene festgelegt. Sie können die Limits Ihrer Organisation in Pläne und Abrechnung in der Anthropic Console einsehen. - Möglicherweise stoßen Sie in kürzeren Zeitintervallen an Ratenlimits. Beispielsweise kann eine Rate von 60 Anfragen pro Minute (RPM) als 1 Anfrage pro Sekunde durchgesetzt werden. Kurze Anfragestöße mit hohem Volumen können das Ratenlimit überschreiten und zu Ratenlimitfehlern führen.
- Die unten aufgeführten Limits sind unsere Standardlimits und gelten für den “Build” API-Plan. Wenn Sie höhere, benutzerdefinierte Limits wünschen, kontaktieren Sie den Vertrieb, indem Sie in der Anthropic Console auf “Plan auswählen” klicken, um zum benutzerdefinierten “Scale”-Plan zu wechseln.
- Wir verwenden den Token Bucket Algorithmus zur Ratenbegrenzung.
Nutzungslimits
Jede Nutzungsstufe hat ein Limit, wie viel Sie die API jeden Kalendermonat nutzen können. Sobald Sie das Nutzungslimit Ihrer Stufe erreicht haben, müssen Sie bis zur nächsten Stufe bis zum nächsten Monat warten, um die API wieder nutzen zu können.
Um sich für die nächste Stufe zu qualifizieren, müssen Sie eine Einzahlungsanforderung und eine obligatorische Wartezeit erfüllen. Höhere Stufen erfordern längere Wartezeiten. Beachten Sie, dass Sie zur Minimierung des Risikos einer Überfinanzierung Ihres Kontos nicht mehr als Ihr monatliches Nutzungslimit einzahlen können.
Anforderungen für den Stufenaufstieg
Nutzungsstufe | Guthabenkauf | Wartezeit nach Erstkauf | Max. Nutzung pro Monat |
---|---|---|---|
Free | N/A | 0 Tage | $10 |
Build Stufe 1 | $5 | 0 Tage | $100 |
Build Stufe 2 | $40 | 7 Tage | $500 |
Build Stufe 3 | $200 | 7 Tage | $1,000 |
Build Stufe 4 | $400 | 14 Tage | $5,000 |
Scale | N/A | N/A | N/A |
Ratenbegrenzungen
Unsere Ratenbegrenzungen werden derzeit in Anfragen pro Minute, Token pro Minute und Token pro Tag für jede Modellklasse gemessen. Wenn Sie eines der Ratenlimits überschreiten, erhalten Sie einen 429-Fehler. Klicken Sie auf die Ratenlimit-Stufe, um die relevanten Ratenlimits anzuzeigen.
Modellstufe | Anfragen pro Minute (RPM) | Token pro Minute (TPM) | Token pro Tag (TPD) |
---|---|---|---|
Claude 3.5 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Haiku | 5 | 25,000 | 300,000 |
Antwort-Header
Die API-Antwort enthält Header, die Ihnen das durchgesetzte Ratenlimit, die aktuelle Nutzung und den Zeitpunkt der Zurücksetzung des Limits anzeigen.
Folgende Header werden zurückgegeben:
Header | Beschreibung |
---|---|
anthropic-ratelimit-requests-limit | Die maximal zulässige Anzahl von Anfragen innerhalb eines Ratenlimit-Zeitraums. |
anthropic-ratelimit-requests-remaining | Die Anzahl der verbleibenden Anfragen, bevor eine Ratenbegrenzung erfolgt. |
anthropic-ratelimit-requests-reset | Der Zeitpunkt, zu dem das Anfrage-Ratenlimit zurückgesetzt wird, angegeben im RFC 3339-Format. |
anthropic-ratelimit-tokens-limit | Die maximal zulässige Anzahl von Token innerhalb eines Ratenlimit-Zeitraums. |
anthropic-ratelimit-tokens-remaining | Die Anzahl der verbleibenden Token (auf das nächste Tausend gerundet), bevor eine Ratenbegrenzung erfolgt. |
anthropic-ratelimit-tokens-reset | Der Zeitpunkt, zu dem das Token-Ratenlimit zurückgesetzt wird, angegeben im RFC 3339-Format. |
retry-after | Die Anzahl der Sekunden, bis Sie die Anfrage erneut stellen können. |
Die Token-Ratenlimit-Header zeigen die Werte für das Limit (täglich oder pro Minute) mit den wenigsten verbleibenden Token an. Wenn Sie beispielsweise das tägliche Token-Limit überschritten haben, aber in der letzten Minute keine Token gesendet haben, enthalten die Header die täglichen Token-Ratenlimit-Werte.