Wir haben zwei Arten von Limits:

  1. Nutzungslimits legen die maximalen monatlichen Kosten fest, die einer Organisation für die API-Nutzung entstehen können.
  2. Ratenbegrenzungen beschränken die Anzahl der API-Anfragen, die eine Organisation innerhalb eines definierten Zeitraums stellen kann.

Über unsere Limits

  • Limits sind so konzipiert, dass sie API-Missbrauch verhindern und gleichzeitig die Auswirkungen auf gängige Nutzungsmuster von Kunden minimieren.
  • Limits werden nach Nutzungsstufe definiert, wobei jede Stufe mit einem anderen Satz von Nutzungs- und Ratenlimits verbunden ist.
  • Ihre Organisation steigt automatisch in höhere Stufen auf, wenn Sie bei der Nutzung der API bestimmte Schwellenwerte erreichen.
    Limits werden auf Organisationsebene festgelegt. Sie können die Limits Ihrer Organisation in Pläne und Abrechnung in der Konsole einsehen.
  • Möglicherweise stoßen Sie in kürzeren Zeitintervallen an Ratenbegrenzungen. Beispielsweise kann eine Rate von 60 Anfragen pro Minute (RPM) als 1 Anfrage pro Sekunde durchgesetzt werden. Kurze Anfragestöße mit hohem Volumen können das Ratenlimit überschreiten und zu Fehlern bei der Ratenbegrenzung führen.
  • Die unten aufgeführten Limits sind unsere Standardlimits und gelten für den “Build” API-Plan. Wenn Sie höhere, benutzerdefinierte Limits wünschen, kontaktieren Sie den Vertrieb, indem Sie in der Konsole auf “Plan auswählen” klicken, um zum benutzerdefinierten “Scale”-Plan zu wechseln.
  • Alle Claude-Modelle haben derzeit die gleichen Nutzungs- und Ratenlimits.

Nutzungslimits

Jede Nutzungsstufe hat ein Limit, wie viel Sie die API jeden Kalendermonat nutzen können. Sobald Sie das Nutzungslimit Ihrer Stufe erreicht haben, müssen Sie bis zur Qualifikation für die nächste Stufe bis zum nächsten Monat warten, um die API wieder nutzen zu können.

Um sich für die nächste Stufe zu qualifizieren, müssen Sie eine Einzahlungsanforderung und eine obligatorische Wartezeit erfüllen. Höhere Stufen erfordern längere Wartezeiten. Beachten Sie, dass Sie zur Minimierung des Risikos einer Überfinanzierung Ihres Kontos nicht mehr als Ihr monatliches Nutzungslimit einzahlen können.

NutzungsstufeAnforderungen für Aufstieg zur StufeMax. Nutzung pro Monat
KreditkaufWarten nach erstem Kauf
KostenlosN/A0 Tage$10
Build Stufe 1$50 Tage$100
Build Stufe 2$407 Tage$500
Build Stufe 3$2007 Tage$1,000
Build Stufe 4$40014 Tage$5,000
ScaleN/AN/AN/A

Ratenbegrenzungen

Unsere Ratenbegrenzungen werden derzeit in Anfragen pro Minute, Token pro Minute und Token pro Tag für jede Modellklasse gemessen. Wenn Sie eine der Ratenbegrenzungen überschreiten, erhalten Sie einen 429-Fehler. Klicken Sie auf die Ratenbegrenzungsstufe, um die relevanten Ratenbegrenzungen anzuzeigen.

ModellstufeAnfragen pro Minute (RPM)Token pro Minute (TPM)Token pro Tag (TPD)
Claude 3 Haiku525,000300,000
Claude 3 Sonnet520,000300,000
Claude 3 Opus510,000300,000

Antwort-Header

Die API-Antwort enthält Header, die Ihnen die durchgesetzte Ratenbegrenzung, die aktuelle Nutzung und den Zeitpunkt der Zurücksetzung des Limits anzeigen.

Folgende Header werden zurückgegeben:

HeaderBeschreibung
anthropic-ratelimit-requests-limitDie maximal zulässige Anzahl von Anfragen innerhalb des Ratenbegrenzungsfensters.
anthropic-ratelimit-requests-remainingDie Anzahl der verbleibenden Anfragen innerhalb des aktuellen Ratenbegrenzungsfensters.
anthropic-ratelimit-requests-resetDer Zeitpunkt, zu dem das Anfrage-Ratenbegrenzungsfenster zurückgesetzt wird, im RFC 3339-Format.
anthropic-ratelimit-tokens-limitDie maximal zulässige Anzahl von Token innerhalb des Ratenbegrenzungsfensters.
anthropic-ratelimit-tokens-remainingDie Anzahl der verbleibenden Token, gerundet auf das nächste Tausend, innerhalb des aktuellen Ratenbegrenzungsfensters.
anthropic-ratelimit-tokens-resetDer Zeitpunkt, zu dem das Token-Ratenbegrenzungsfenster zurückgesetzt wird, im RFC 3339-Format.

Die Token-Ratenbegrenzungs-Header zeigen die Werte für das Limit (täglich oder pro Minute) mit den wenigsten verbleibenden Token an. Wenn Sie beispielsweise das tägliche Token-Limit überschritten haben, aber in der letzten Minute keine Token gesendet haben, enthalten die Header die Werte für das tägliche Token-Ratenlimit.