Service-Stufen
Verschiedene Service-Stufen ermöglichen es Ihnen, Verfügbarkeit, Leistung und vorhersagbare Kosten basierend auf den Bedürfnissen Ihrer Anwendung auszubalancieren.
Wir bieten drei Service-Stufen an:
- Priority Tier: Am besten für Workflows, die in der Produktion eingesetzt werden, wo Zeit, Verfügbarkeit und vorhersagbare Preise wichtig sind
- Standard: Standard-Stufe sowohl für Pilotprojekte als auch für die Skalierung alltäglicher Anwendungsfälle
- Batch: Am besten für asynchrone Workflows, die warten können oder davon profitieren, außerhalb Ihrer normalen Kapazität zu sein
Standard Tier
Die Standard-Stufe ist die Standard-Service-Stufe für alle API-Anfragen. Anfragen in dieser Stufe werden zusammen mit allen anderen Anfragen priorisiert und beobachten bestmögliche Verfügbarkeit.
Priority Tier
Anfragen in dieser Stufe werden über alle anderen Anfragen an Anthropic priorisiert. Diese Priorisierung hilft dabei, “Server überlastet” Fehler zu minimieren, auch während Spitzenzeiten.
Für weitere Informationen siehe Erste Schritte mit Priority Tier
Wie Anfragen Stufen zugewiesen werden
Bei der Bearbeitung einer Anfrage entscheidet Anthropic, eine Anfrage dem Priority Tier in den folgenden Szenarien zuzuweisen:
- Ihre Organisation hat ausreichende Priority Tier Kapazität Input Token pro Minute
- Ihre Organisation hat ausreichende Priority Tier Kapazität Output Token pro Minute
Anthropic zählt die Nutzung gegen Priority Tier Kapazität wie folgt:
Input Token
- Cache-Lesevorgänge als 0,1 Token pro Token, der aus dem Cache gelesen wird
- Cache-Schreibvorgänge als 1,25 Token pro Token, der in den Cache mit einer 5-Minuten-TTL geschrieben wird
- Cache-Schreibvorgänge als 2,00 Token pro Token, der in den Cache mit einer 1-Stunden-TTL geschrieben wird
- Alle anderen Input-Token sind 1 Token pro Token
Output Token
- 1 Token pro Token
Andernfalls werden Anfragen auf Standard-Stufe verarbeitet.
Anfragen, die dem Priority Tier zugewiesen werden, ziehen sowohl aus der Priority Tier Kapazität als auch aus den regulären Ratenlimits. Wenn die Bearbeitung der Anfrage die Ratenlimits überschreiten würde, wird die Anfrage abgelehnt.
Verwendung von Service-Stufen
Sie können steuern, welche Service-Stufen für eine Anfrage verwendet werden können, indem Sie den service_tier
Parameter setzen:
Der service_tier
Parameter akzeptiert die folgenden Werte:
"auto"
(Standard) - Verwendet die Priority Tier Kapazität, falls verfügbar, fällt auf Ihre andere Kapazität zurück, falls nicht"standard_only"
- Nur Standard-Tier-Kapazität verwenden, nützlich wenn Sie Ihre Priority Tier Kapazität nicht verwenden möchten
Das Antwort-usage
Objekt enthält auch die Service-Stufe, die der Anfrage zugewiesen wurde:
Dies ermöglicht es Ihnen zu bestimmen, welche Service-Stufe der Anfrage zugewiesen wurde.
Bei der Anfrage von service_tier="auto"
mit einem Modell mit einer Priority Tier Verpflichtung bieten diese Antwort-Header Einblicke:
Sie können das Vorhandensein dieser Header verwenden, um zu erkennen, ob Ihre Anfrage für Priority Tier berechtigt war, auch wenn sie über dem Limit lag.
Erste Schritte mit Priority Tier
Sie möchten sich möglicherweise zu Priority Tier Kapazität verpflichten, wenn Sie interessiert sind an:
- Höhere Verfügbarkeit: Ziel von 99,5% Betriebszeit mit priorisierten Rechenressourcen
- Kostenkontrolle: Vorhersagbare Ausgaben und Rabatte für längere Verpflichtungen
- Flexibler Überlauf: Fällt automatisch auf Standard-Stufe zurück, wenn Sie Ihre zugesagte Kapazität überschreiten
Die Verpflichtung zu Priority Tier beinhaltet die Entscheidung über:
- Eine Anzahl von Input-Token pro Minute
- Eine Anzahl von Output-Token pro Minute
- Eine Verpflichtungsdauer (1, 3, 6 oder 12 Monate)
- Eine spezifische Modellversion
Das Verhältnis von Input- zu Output-Token, die Sie kaufen, ist wichtig. Die Dimensionierung Ihrer Priority Tier Kapazität, um sie an Ihre tatsächlichen Verkehrsmuster anzupassen, hilft Ihnen, die Nutzung Ihrer gekauften Token zu maximieren.
Unterstützte Modelle
Priority Tier wird unterstützt von:
- Claude Opus 4
- Claude Sonnet 4
- Claude Sonnet 3.7
- Claude Sonnet 3.5 (beide Versionen)
- Claude Haiku 3.5
Schauen Sie sich die Modellübersichtsseite für weitere Details zu unseren Modellen an.
Wie man Zugang zu Priority Tier erhält
Um mit der Nutzung von Priority Tier zu beginnen:
- Kontaktieren Sie den Vertrieb um die Bereitstellung abzuschließen
- (Optional) Aktualisieren Sie Ihre API-Anfragen, um optional den
service_tier
Parameter aufauto
zu setzen - Überwachen Sie Ihre Nutzung durch Antwort-Header und die Anthropic Console