Wir haben zwei Arten von Limits:

  1. Nutzungslimits legen die maximalen monatlichen Kosten fest, die einer Organisation für die API-Nutzung entstehen können.
  2. Ratenbegrenzungen beschränken die Anzahl der API-Anfragen, die eine Organisation innerhalb eines definierten Zeitraums stellen kann.

Über unsere Limits

  • Limits sollen API-Missbrauch verhindern und gleichzeitig die Auswirkungen auf gängige Nutzungsmuster von Kunden minimieren.
  • Limits werden nach Nutzungsstufe definiert, wobei jede Stufe mit einem anderen Satz von Nutzungs- und Ratenlimits verbunden ist.
  • Ihre Organisation steigt automatisch in höhere Stufen auf, wenn Sie beim Verwenden der API bestimmte Schwellenwerte erreichen.
    Limits werden auf Organisationsebene festgelegt. Sie können die Limits Ihrer Organisation in Pläne und Abrechnung in der Anthropic Console einsehen.
  • Möglicherweise stoßen Sie in kürzeren Zeitintervallen an Ratenlimits. Beispielsweise kann eine Rate von 60 Anfragen pro Minute (RPM) als 1 Anfrage pro Sekunde durchgesetzt werden. Kurze Anfragestöße mit hohem Volumen können das Ratenlimit überschreiten und zu Ratenlimitfehlern führen.
  • Die unten aufgeführten Limits sind unsere Standardlimits und gelten für den “Build” API-Plan. Wenn Sie höhere, benutzerdefinierte Limits wünschen, kontaktieren Sie den Vertrieb, indem Sie in der Anthropic Console auf “Plan auswählen” klicken, um zum benutzerdefinierten “Scale”-Plan zu wechseln.
  • Wir verwenden den Token Bucket Algorithmus zur Ratenbegrenzung.

Nutzungslimits

Jede Nutzungsstufe hat ein Limit, wie viel Sie die API jeden Kalendermonat nutzen können. Sobald Sie das Nutzungslimit Ihrer Stufe erreicht haben, müssen Sie bis zur nächsten Stufe bis zum nächsten Monat warten, um die API wieder nutzen zu können.

Um sich für die nächste Stufe zu qualifizieren, müssen Sie eine Einzahlungsanforderung und eine obligatorische Wartezeit erfüllen. Höhere Stufen erfordern längere Wartezeiten. Beachten Sie, dass Sie zur Minimierung des Risikos einer Überfinanzierung Ihres Kontos nicht mehr als Ihr monatliches Nutzungslimit einzahlen können.

Anforderungen für den Stufenaufstieg

NutzungsstufeGuthabenkaufWartezeit nach ErstkaufMax. Nutzung pro Monat
FreeN/A0 Tage$10
Build Stufe 1$50 Tage$100
Build Stufe 2$407 Tage$500
Build Stufe 3$2007 Tage$1,000
Build Stufe 4$40014 Tage$5,000
ScaleN/AN/AN/A

Ratenbegrenzungen

Unsere Ratenbegrenzungen werden derzeit in Anfragen pro Minute, Token pro Minute und Token pro Tag für jede Modellklasse gemessen. Wenn Sie eines der Ratenlimits überschreiten, erhalten Sie einen 429-Fehler. Klicken Sie auf die Ratenlimit-Stufe, um die relevanten Ratenlimits anzuzeigen.

ModellstufeAnfragen pro Minute (RPM)Token pro Minute (TPM)Token pro Tag (TPD)
Claude 3.5 Sonnet520,000300,000
Claude 3 Opus510,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Haiku525,000300,000

Antwort-Header

Die API-Antwort enthält Header, die Ihnen das durchgesetzte Ratenlimit, die aktuelle Nutzung und den Zeitpunkt der Zurücksetzung des Limits anzeigen.

Folgende Header werden zurückgegeben:

HeaderBeschreibung
anthropic-ratelimit-requests-limitDie maximal zulässige Anzahl von Anfragen innerhalb eines Ratenlimit-Zeitraums.
anthropic-ratelimit-requests-remainingDie Anzahl der verbleibenden Anfragen, bevor eine Ratenbegrenzung erfolgt.
anthropic-ratelimit-requests-resetDer Zeitpunkt, zu dem das Anfrage-Ratenlimit zurückgesetzt wird, angegeben im RFC 3339-Format.
anthropic-ratelimit-tokens-limitDie maximal zulässige Anzahl von Token innerhalb eines Ratenlimit-Zeitraums.
anthropic-ratelimit-tokens-remainingDie Anzahl der verbleibenden Token (auf das nächste Tausend gerundet), bevor eine Ratenbegrenzung erfolgt.
anthropic-ratelimit-tokens-resetDer Zeitpunkt, zu dem das Token-Ratenlimit zurückgesetzt wird, angegeben im RFC 3339-Format.
retry-afterDie Anzahl der Sekunden, bis Sie die Anfrage erneut stellen können.

Die Token-Ratenlimit-Header zeigen die Werte für das Limit (täglich oder pro Minute) mit den wenigsten verbleibenden Token an. Wenn Sie beispielsweise das tägliche Token-Limit überschritten haben, aber in der letzten Minute keine Token gesendet haben, enthalten die Header die täglichen Token-Ratenlimit-Werte.