Ratenbegrenzungen
Um Missbrauch vorzubeugen und die Kapazität unserer API zu verwalten, haben wir Limits eingeführt, wie viel eine Organisation die Claude API nutzen kann.
Wir haben zwei Arten von Limits:
- Nutzungslimits legen die maximalen monatlichen Kosten fest, die einer Organisation für die API-Nutzung entstehen können.
- Ratenbegrenzungen beschränken die Anzahl der API-Anfragen, die eine Organisation innerhalb eines definierten Zeitraums stellen kann.
Über unsere Limits
- Limits sind so konzipiert, dass sie API-Missbrauch verhindern und gleichzeitig die Auswirkungen auf gängige Nutzungsmuster von Kunden minimieren.
- Limits werden nach Nutzungsstufe definiert, wobei jede Stufe mit einem anderen Satz von Nutzungs- und Ratenlimits verbunden ist.
- Ihre Organisation steigt automatisch in höhere Stufen auf, wenn Sie bei der Nutzung der API bestimmte Schwellenwerte erreichen.
Limits werden auf Organisationsebene festgelegt. Sie können die Limits Ihrer Organisation in Pläne und Abrechnung in der Konsole einsehen. - Möglicherweise stoßen Sie in kürzeren Zeitintervallen an Ratenbegrenzungen. Beispielsweise kann eine Rate von 60 Anfragen pro Minute (RPM) als 1 Anfrage pro Sekunde durchgesetzt werden. Kurze Anfragestöße mit hohem Volumen können das Ratenlimit überschreiten und zu Fehlern bei der Ratenbegrenzung führen.
- Die unten aufgeführten Limits sind unsere Standardlimits und gelten für den “Build” API-Plan. Wenn Sie höhere, benutzerdefinierte Limits wünschen, kontaktieren Sie den Vertrieb, indem Sie in der Konsole auf “Plan auswählen” klicken, um zum benutzerdefinierten “Scale”-Plan zu wechseln.
- Alle Claude-Modelle haben derzeit die gleichen Nutzungs- und Ratenlimits.
Nutzungslimits
Jede Nutzungsstufe hat ein Limit, wie viel Sie die API jeden Kalendermonat nutzen können. Sobald Sie das Nutzungslimit Ihrer Stufe erreicht haben, müssen Sie bis zur Qualifikation für die nächste Stufe bis zum nächsten Monat warten, um die API wieder nutzen zu können.
Um sich für die nächste Stufe zu qualifizieren, müssen Sie eine Einzahlungsanforderung und eine obligatorische Wartezeit erfüllen. Höhere Stufen erfordern längere Wartezeiten. Beachten Sie, dass Sie zur Minimierung des Risikos einer Überfinanzierung Ihres Kontos nicht mehr als Ihr monatliches Nutzungslimit einzahlen können.
Nutzungsstufe | Anforderungen für Aufstieg zur Stufe | Max. Nutzung pro Monat | |
---|---|---|---|
Kreditkauf | Warten nach erstem Kauf | ||
Kostenlos | N/A | 0 Tage | $10 |
Build Stufe 1 | $5 | 0 Tage | $100 |
Build Stufe 2 | $40 | 7 Tage | $500 |
Build Stufe 3 | $200 | 7 Tage | $1,000 |
Build Stufe 4 | $400 | 14 Tage | $5,000 |
Scale | N/A | N/A | N/A |
Ratenbegrenzungen
Unsere Ratenbegrenzungen werden derzeit in Anfragen pro Minute, Token pro Minute und Token pro Tag für jede Modellklasse gemessen. Wenn Sie eine der Ratenbegrenzungen überschreiten, erhalten Sie einen 429-Fehler. Klicken Sie auf die Ratenbegrenzungsstufe, um die relevanten Ratenbegrenzungen anzuzeigen.
Modellstufe | Anfragen pro Minute (RPM) | Token pro Minute (TPM) | Token pro Tag (TPD) |
---|---|---|---|
Claude 3 Haiku | 5 | 25,000 | 300,000 |
Claude 3 Sonnet | 5 | 20,000 | 300,000 |
Claude 3 Opus | 5 | 10,000 | 300,000 |
Antwort-Header
Die API-Antwort enthält Header, die Ihnen die durchgesetzte Ratenbegrenzung, die aktuelle Nutzung und den Zeitpunkt der Zurücksetzung des Limits anzeigen.
Folgende Header werden zurückgegeben:
Header | Beschreibung |
---|---|
anthropic-ratelimit-requests-limit | Die maximal zulässige Anzahl von Anfragen innerhalb des Ratenbegrenzungsfensters. |
anthropic-ratelimit-requests-remaining | Die Anzahl der verbleibenden Anfragen innerhalb des aktuellen Ratenbegrenzungsfensters. |
anthropic-ratelimit-requests-reset | Der Zeitpunkt, zu dem das Anfrage-Ratenbegrenzungsfenster zurückgesetzt wird, im RFC 3339-Format. |
anthropic-ratelimit-tokens-limit | Die maximal zulässige Anzahl von Token innerhalb des Ratenbegrenzungsfensters. |
anthropic-ratelimit-tokens-remaining | Die Anzahl der verbleibenden Token, gerundet auf das nächste Tausend, innerhalb des aktuellen Ratenbegrenzungsfensters. |
anthropic-ratelimit-tokens-reset | Der Zeitpunkt, zu dem das Token-Ratenbegrenzungsfenster zurückgesetzt wird, im RFC 3339-Format. |
Die Token-Ratenbegrenzungs-Header zeigen die Werte für das Limit (täglich oder pro Minute) mit den wenigsten verbleibenden Token an. Wenn Sie beispielsweise das tägliche Token-Limit überschritten haben, aber in der letzten Minute keine Token gesendet haben, enthalten die Header die Werte für das tägliche Token-Ratenlimit.