Preise
Erfahren Sie mehr über Anthropics Preisstruktur für Modelle und Funktionen
Diese Seite bietet detaillierte Preisinformationen für Anthropics Modelle und Funktionen. Alle Preise sind in USD angegeben.
Für die aktuellsten Preisinformationen besuchen Sie bitte anthropic.com/pricing.
Modellpreise
Die folgende Tabelle zeigt die Preise für alle Claude-Modelle in verschiedenen Nutzungsstufen:
Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
---|---|---|---|---|---|
Claude Opus 4.1 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.7 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.5 (deprecated) | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
Claude Opus 3 (deprecated) | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Million Token. Die Spalte “Base Input Tokens” zeigt die Standard-Eingabepreise, “Cache Writes” und “Cache Hits” sind spezifisch für Prompt-Caching, und “Output Tokens” zeigt die Ausgabepreise. Prompt-Caching bietet sowohl 5-Minuten- (Standard) als auch 1-Stunden-Cache-Dauern, um die Kosten für verschiedene Anwendungsfälle zu optimieren.
Die obige Tabelle spiegelt die folgenden Preismultiplikatoren für Prompt-Caching wider:
- 5-Minuten-Cache-Write-Token kosten das 1,25-fache des Basis-Eingabe-Token-Preises
- 1-Stunden-Cache-Write-Token kosten das 2-fache des Basis-Eingabe-Token-Preises
- Cache-Read-Token kosten das 0,1-fache des Basis-Eingabe-Token-Preises
Funktionsspezifische Preise
Batch-Verarbeitung
Die Batch-API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem 50%-Rabatt sowohl auf Eingabe- als auch auf Ausgabe-Token.
Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Für weitere Informationen zur Batch-Verarbeitung siehe unsere Batch-Verarbeitungsdokumentation.
Long Context-Preise
Bei der Verwendung von Claude Sonnet 4 mit dem aktivierten 1M-Token-Kontextfenster werden Anfragen, die 200K Eingabe-Token überschreiten, automatisch zu Premium-Long-Context-Tarifen berechnet:
Das 1M-Token-Kontextfenster befindet sich derzeit in der Beta-Phase für Organisationen in Nutzungsstufe 4 und Organisationen mit benutzerdefinierten Ratenlimits. Das 1M-Token-Kontextfenster ist nur für Claude Sonnet 4 verfügbar.
≤ 200K Eingabe-Token | > 200K Eingabe-Token |
---|---|
Eingabe: $3 / MTok | Eingabe: $6 / MTok |
Ausgabe: $15 / MTok | Ausgabe: $22.50 / MTok |
Long Context-Preise stapeln sich mit anderen Preismodifikatoren:
- Der Batch-API 50%-Rabatt gilt für Long Context-Preise
- Prompt-Caching-Multiplikatoren gelten zusätzlich zu Long Context-Preisen
Auch bei aktiviertem Beta-Flag werden Anfragen mit weniger als 200K Eingabe-Token zu Standardtarifen berechnet. Wenn Ihre Anfrage 200K Eingabe-Token überschreitet, fallen für alle Token Premium-Preise an.
Die 200K-Schwelle basiert ausschließlich auf Eingabe-Token (einschließlich Cache-Reads/Writes). Die Anzahl der Ausgabe-Token beeinflusst nicht die Auswahl der Preisstufe, obwohl Ausgabe-Token zum höheren Tarif berechnet werden, wenn die Eingabeschwelle überschritten wird.
Um zu überprüfen, ob Ihre API-Anfrage zu 1M-Kontextfenster-Tarifen berechnet wurde, untersuchen Sie das usage
-Objekt in der API-Antwort:
Berechnen Sie die gesamten Eingabe-Token durch Summierung von:
input_tokens
cache_creation_input_tokens
(bei Verwendung von Prompt-Caching)cache_read_input_tokens
(bei Verwendung von Prompt-Caching)
Wenn die Summe 200.000 Token überschreitet, wurde die gesamte Anfrage zu 1M-Kontext-Tarifen abgerechnet.
Für weitere Informationen über das usage
-Objekt siehe die API-Antwortdokumentation.
Tool Use-Preise
Tool use requests are priced based on:
- The total number of input tokens sent to the model (including in the
tools
parameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
- The
tools
parameter in API requests (tool names, descriptions, and schemas) tool_use
content blocks in API requests and responsestool_result
content blocks in API requests
When you use tools
, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools
are provided, then a tool choice of none
uses 0 additional system prompt tokens.
Model | Tool choice | Tool use system prompt token count |
---|---|---|
Claude Opus 4.1 | auto , none any , tool | 346 tokens 313 tokens |
Claude Opus 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.7 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (Oct) (deprecated) | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (June) (deprecated) | auto , none any , tool | 294 tokens 261 tokens |
Claude Haiku 3.5 | auto , none any , tool | 264 tokens 340 tokens |
Claude Opus 3 (deprecated) | auto , none any , tool | 530 tokens 281 tokens |
Claude Sonnet 3 | auto , none any , tool | 159 tokens 235 tokens |
Claude Haiku 3 | auto , none any , tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Für aktuelle modellspezifische Preise siehe unseren Abschnitt Modellpreise oben.
Für weitere Informationen über Tool Use-Implementierung und bewährte Praktiken siehe unsere Tool Use-Dokumentation.
Spezifische Tool-Preise
Bash-Tool
The bash tool adds 245 input tokens to your API calls.
Additional tokens are consumed by:
- Command outputs (stdout/stderr)
- Error messages
- Large file contents
Siehe Tool Use-Preise für vollständige Preisdetails.
Code-Ausführungs-Tool
The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.
Pricing: $0.05 per session-hour.
Texteditor-Tool
The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using.
In addition to the base tokens, the following additional input tokens are needed for the text editor tool:
Tool | Additional input tokens |
---|---|
text_editor_20250429 (Claude 4) | 700 tokens |
text_editor_20250124 (Claude Sonnet 3.7) | 700 tokens |
text_editor_20241022 (Claude Sonnet 3.5 (deprecated)) | 700 tokens |
Siehe Tool Use-Preise für vollständige Preisdetails.
Web-Such-Tool
Web search usage is charged in addition to token usage:
Web search is available on the Anthropic API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.
Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.
Computer Use-Tool
Computer use follows the standard tool use pricing. When using the computer use tool:
System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt
Computer use tool token usage:
Model | Input tokens per tool definition |
---|---|
Claude 4 / Sonnet 3.7 | 735 tokens |
Claude Sonnet 3.5 (deprecated) | 683 tokens |
Additional token consumption:
- Screenshot images (see Vision pricing)
- Tool execution results returned to Claude
If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.
Agent-Anwendungsfall-Preisbeispiele
Das Verständnis der Preise für Agent-Anwendungen ist entscheidend beim Entwickeln mit Claude. Diese realen Beispiele können Ihnen helfen, Kosten für verschiedene Agent-Muster zu schätzen.
Kundensupport-Agent-Beispiel
Beim Aufbau eines Kundensupport-Agenten könnten sich die Kosten folgendermaßen aufschlüsseln:
Beispielberechnung für die Bearbeitung von 10.000 Support-Tickets:
- Durchschnittlich ~3.700 Token pro Gespräch
- Verwendung von Claude Sonnet 4 zu 15/MTok Ausgabe
- Gesamtkosten: ~$22,20 pro 10.000 Tickets
Für eine detaillierte Durchführung dieser Berechnung siehe unseren Kundensupport-Agent-Leitfaden.
Allgemeine Agent-Workflow-Preise
Für komplexere Agent-Architekturen mit mehreren Schritten:
-
Anfängliche Anfrageverarbeitung
- Typische Eingabe: 500-1.000 Token
- Verarbeitungskosten: ~$0,003 pro Anfrage
-
Speicher- und Kontext-Abruf
- Abgerufener Kontext: 2.000-5.000 Token
- Kosten pro Abruf: ~$0,015 pro Operation
-
Aktionsplanung und -ausführung
- Planungs-Token: 1.000-2.000
- Ausführungsfeedback: 500-1.000
- Kombinierte Kosten: ~$0,045 pro Aktion
Für einen umfassenden Leitfaden zu Agent-Preismustern siehe unseren Agent-Anwendungsfälle-Leitfaden.
Kostenoptimierungsstrategien
Beim Entwickeln von Agenten mit Claude:
- Verwenden Sie geeignete Modelle: Wählen Sie Haiku für einfache Aufgaben, Sonnet für komplexe Überlegungen
- Implementieren Sie Prompt-Caching: Reduzieren Sie Kosten für wiederholten Kontext
- Batch-Operationen: Verwenden Sie die Batch-API für nicht zeitkritische Aufgaben
- Überwachen Sie Nutzungsmuster: Verfolgen Sie Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren
Für hochvolumige Agent-Anwendungen erwägen Sie, unser Enterprise-Vertriebsteam für benutzerdefinierte Preisvereinbarungen zu kontaktieren.
Zusätzliche Preisüberlegungen
Ratenlimits
Ratenlimits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen Sie stellen können:
- Stufe 1: Einstiegsnutzung mit grundlegenden Limits
- Stufe 2: Erhöhte Limits für wachsende Anwendungen
- Stufe 3: Höhere Limits für etablierte Anwendungen
- Stufe 4: Maximale Standardlimits
- Enterprise: Benutzerdefinierte Limits verfügbar
Für detaillierte Ratenlimit-Informationen siehe unsere Ratenlimits-Dokumentation.
Für höhere Ratenlimits oder benutzerdefinierte Preisvereinbarungen kontaktieren Sie unser Vertriebsteam.
Mengenrabatte
Mengenrabatte können für Nutzer mit hohem Volumen verfügbar sein. Diese werden von Fall zu Fall verhandelt.
- Standardstufen verwenden die oben gezeigten Preise
- Enterprise-Kunden können den Vertrieb kontaktieren für benutzerdefinierte Preise
- Akademische und Forschungsrabatte können verfügbar sein
Enterprise-Preise
Für Enterprise-Kunden mit spezifischen Bedürfnissen:
- Benutzerdefinierte Ratenlimits
- Mengenrabatte
- Dedizierter Support
- Benutzerdefinierte Bedingungen
Kontaktieren Sie unser Vertriebsteam unter sales@anthropic.com oder über die Anthropic Console, um Enterprise-Preisoptionen zu besprechen.
Abrechnung und Zahlung
- Die Abrechnung erfolgt monatlich basierend auf der tatsächlichen Nutzung
- Zahlungen werden in USD verarbeitet
- Kreditkarten- und Rechnungsoptionen verfügbar
- Nutzungsverfolgung verfügbar in der Anthropic Console
Häufig gestellte Fragen
Wie wird die Token-Nutzung berechnet?
Token sind Textteile, die Modelle verarbeiten. Als grobe Schätzung entspricht 1 Token etwa 4 Zeichen oder 0,75 Wörtern auf Englisch. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp.
Gibt es kostenlose Stufen oder Testversionen?
Neue Nutzer erhalten eine kleine Menge kostenloser Credits zum Testen der API. Kontaktieren Sie den Vertrieb für Informationen über erweiterte Testversionen für Enterprise-Evaluierungen.
Wie stapeln sich Rabatte?
Batch-API- und Prompt-Caching-Rabatte können kombiniert werden. Zum Beispiel bietet die Verwendung beider Funktionen zusammen erhebliche Kosteneinsparungen im Vergleich zu Standard-API-Aufrufen.
Welche Zahlungsmethoden werden akzeptiert?
Wir akzeptieren gängige Kreditkarten für Standardkonten. Enterprise-Kunden können Rechnungsstellung und andere Zahlungsmethoden vereinbaren.
Für weitere Fragen zu Preisen kontaktieren Sie support@anthropic.com.