Preise

Diese Seite bietet detaillierte Preisinformationen für Anthropics Modelle und Funktionen. Alle Preise sind in USD angegeben.

Für die aktuellsten Preisinformationen besuchen Sie bitte anthropic.com/pricing.

Modellpreise

Die folgende Tabelle zeigt die Preise für alle Claude-Modelle in verschiedenen Nutzungsstufen:

Model	Base Input Tokens	5m Cache Writes	1h Cache Writes	Cache Hits & Refreshes	Output Tokens
Claude Opus 4.1	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Opus 4	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Sonnet 4	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 3.7	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Sonnet 3.5 (deprecated)	$3 / MTok	$3.75 / MTok	$6 / MTok	$0.30 / MTok	$15 / MTok
Claude Haiku 3.5	$0.80 / MTok	$1 / MTok	$1.6 / MTok	$0.08 / MTok	$4 / MTok
Claude Opus 3 (deprecated)	$15 / MTok	$18.75 / MTok	$30 / MTok	$1.50 / MTok	$75 / MTok
Claude Haiku 3	$0.25 / MTok	$0.30 / MTok	$0.50 / MTok	$0.03 / MTok	$1.25 / MTok

MTok = Million Token. Die Spalte “Base Input Tokens” zeigt die Standard-Eingabepreise, “Cache Writes” und “Cache Hits” sind spezifisch für Prompt-Caching, und “Output Tokens” zeigt die Ausgabepreise. Prompt-Caching bietet sowohl 5-Minuten- (Standard) als auch 1-Stunden-Cache-Dauern, um die Kosten für verschiedene Anwendungsfälle zu optimieren.

Die obige Tabelle spiegelt die folgenden Preismultiplikatoren für Prompt-Caching wider:

5-Minuten-Cache-Write-Token kosten das 1,25-fache des Basis-Eingabe-Token-Preises
1-Stunden-Cache-Write-Token kosten das 2-fache des Basis-Eingabe-Token-Preises
Cache-Read-Token kosten das 0,1-fache des Basis-Eingabe-Token-Preises

Funktionsspezifische Preise

Batch-Verarbeitung

Die Batch-API ermöglicht die asynchrone Verarbeitung großer Mengen von Anfragen mit einem 50%-Rabatt sowohl auf Eingabe- als auch auf Ausgabe-Token.

Model	Batch input	Batch output
Claude Opus 4.1	$7.50 / MTok	$37.50 / MTok
Claude Opus 4	$7.50 / MTok	$37.50 / MTok
Claude Sonnet 4	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 3.7	$1.50 / MTok	$7.50 / MTok
Claude Sonnet 3.5 (deprecated)	$1.50 / MTok	$7.50 / MTok
Claude Haiku 3.5	$0.40 / MTok	$2 / MTok
Claude Opus 3 (deprecated)	$7.50 / MTok	$37.50 / MTok
Claude Haiku 3	$0.125 / MTok	$0.625 / MTok

Für weitere Informationen zur Batch-Verarbeitung siehe unsere Batch-Verarbeitungsdokumentation.

Long Context-Preise

Bei der Verwendung von Claude Sonnet 4 mit dem aktivierten 1M-Token-Kontextfenster werden Anfragen, die 200K Eingabe-Token überschreiten, automatisch zu Premium-Long-Context-Tarifen berechnet:

Das 1M-Token-Kontextfenster befindet sich derzeit in der Beta-Phase für Organisationen in Nutzungsstufe 4 und Organisationen mit benutzerdefinierten Ratenlimits. Das 1M-Token-Kontextfenster ist nur für Claude Sonnet 4 verfügbar.

≤ 200K Eingabe-Token	> 200K Eingabe-Token
Eingabe: $3 / MTok	Eingabe: $6 / MTok
Ausgabe: $15 / MTok	Ausgabe: $22.50 / MTok

Long Context-Preise stapeln sich mit anderen Preismodifikatoren:

Der Batch-API 50%-Rabatt gilt für Long Context-Preise
Prompt-Caching-Multiplikatoren gelten zusätzlich zu Long Context-Preisen

Auch bei aktiviertem Beta-Flag werden Anfragen mit weniger als 200K Eingabe-Token zu Standardtarifen berechnet. Wenn Ihre Anfrage 200K Eingabe-Token überschreitet, fallen für alle Token Premium-Preise an.

Die 200K-Schwelle basiert ausschließlich auf Eingabe-Token (einschließlich Cache-Reads/Writes). Die Anzahl der Ausgabe-Token beeinflusst nicht die Auswahl der Preisstufe, obwohl Ausgabe-Token zum höheren Tarif berechnet werden, wenn die Eingabeschwelle überschritten wird.

Um zu überprüfen, ob Ihre API-Anfrage zu 1M-Kontextfenster-Tarifen berechnet wurde, untersuchen Sie das usage-Objekt in der API-Antwort:

{
  "usage": {
    "input_tokens": 250000,
    "cache_creation_input_tokens": 0,
    "cache_read_input_tokens": 0,
    "output_tokens": 500
  }
}

Berechnen Sie die gesamten Eingabe-Token durch Summierung von:

input_tokens
cache_creation_input_tokens (bei Verwendung von Prompt-Caching)
cache_read_input_tokens (bei Verwendung von Prompt-Caching)

Wenn die Summe 200.000 Token überschreitet, wurde die gesamte Anfrage zu 1M-Kontext-Tarifen abgerechnet.

Für weitere Informationen über das usage-Objekt siehe die API-Antwortdokumentation.

Tool Use-Preise

Tool use requests are priced based on:

The total number of input tokens sent to the model (including in the tools parameter)
The number of output tokens generated
For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

The tools parameter in API requests (tool names, descriptions, and schemas)
tool_use content blocks in API requests and responses
tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

Model	Tool choice	Tool use system prompt token count
Claude Opus 4.1	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Opus 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 4	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.7	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.5 (Oct) (deprecated)	`auto`, `none` `any`, `tool`	346 tokens 313 tokens
Claude Sonnet 3.5 (June) (deprecated)	`auto`, `none` `any`, `tool`	294 tokens 261 tokens
Claude Haiku 3.5	`auto`, `none` `any`, `tool`	264 tokens 340 tokens
Claude Opus 3 (deprecated)	`auto`, `none` `any`, `tool`	530 tokens 281 tokens
Claude Sonnet 3	`auto`, `none` `any`, `tool`	159 tokens 235 tokens
Claude Haiku 3	`auto`, `none` `any`, `tool`	264 tokens 340 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Für aktuelle modellspezifische Preise siehe unseren Abschnitt Modellpreise oben.

Für weitere Informationen über Tool Use-Implementierung und bewährte Praktiken siehe unsere Tool Use-Dokumentation.

Spezifische Tool-Preise

Bash-Tool

The bash tool adds 245 input tokens to your API calls.

Additional tokens are consumed by:

Command outputs (stdout/stderr)
Error messages
Large file contents

Siehe Tool Use-Preise für vollständige Preisdetails.

Code-Ausführungs-Tool

The code execution tool usage is tracked separately from token usage. Execution time is a minimum of 5 minutes. If files are included in the request, execution time is billed even if the tool is not used due to files being preloaded onto the container.

Pricing: $0.05 per session-hour.

Texteditor-Tool

The text editor tool uses the same pricing structure as other tools used with Claude. It follows the standard input and output token pricing based on the Claude model you’re using.

In addition to the base tokens, the following additional input tokens are needed for the text editor tool:

Tool	Additional input tokens
`text_editor_20250429` (Claude 4)	700 tokens
`text_editor_20250124` (Claude Sonnet 3.7)	700 tokens
`text_editor_20241022` (Claude Sonnet 3.5 (deprecated))	700 tokens

Siehe Tool Use-Preise für vollständige Preisdetails.

Web-Such-Tool

Web search usage is charged in addition to token usage:

"usage": {
  "input_tokens": 105,
  "output_tokens": 6039,
  "cache_read_input_tokens": 7123,
  "cache_creation_input_tokens": 7345,
  "server_tool_use": {
    "web_search_requests": 1
  }
}

Web search is available on the Anthropic API for $10 per 1,000 searches, plus standard token costs for search-generated content. Web search results retrieved throughout a conversation are counted as input tokens, in search iterations executed during a single turn and in subsequent conversation turns.

Each web search counts as one use, regardless of the number of results returned. If an error occurs during web search, the web search will not be billed.

Computer Use-Tool

Computer use follows the standard tool use pricing. When using the computer use tool:

System prompt overhead: The computer use beta adds 466-499 tokens to the system prompt

Computer use tool token usage:

Model	Input tokens per tool definition
Claude 4 / Sonnet 3.7	735 tokens
Claude Sonnet 3.5 (deprecated)	683 tokens

Additional token consumption:

Screenshot images (see Vision pricing)
Tool execution results returned to Claude

If you’re also using bash or text editor tools alongside computer use, those tools have their own token costs as documented in their respective pages.

Agent-Anwendungsfall-Preisbeispiele

Das Verständnis der Preise für Agent-Anwendungen ist entscheidend beim Entwickeln mit Claude. Diese realen Beispiele können Ihnen helfen, Kosten für verschiedene Agent-Muster zu schätzen.

Kundensupport-Agent-Beispiel

Beim Aufbau eines Kundensupport-Agenten könnten sich die Kosten folgendermaßen aufschlüsseln:

Beispielberechnung für die Bearbeitung von 10.000 Support-Tickets:

Durchschnittlich ~3.700 Token pro Gespräch
Verwendung von Claude Sonnet 4 zu $3/MTok Eingabe,$ 15/MTok Ausgabe
Gesamtkosten: ~$22,20 pro 10.000 Tickets

Für eine detaillierte Durchführung dieser Berechnung siehe unseren Kundensupport-Agent-Leitfaden.

Allgemeine Agent-Workflow-Preise

Für komplexere Agent-Architekturen mit mehreren Schritten:

Anfängliche Anfrageverarbeitung
- Typische Eingabe: 500-1.000 Token
- Verarbeitungskosten: ~$0,003 pro Anfrage
Speicher- und Kontext-Abruf
- Abgerufener Kontext: 2.000-5.000 Token
- Kosten pro Abruf: ~$0,015 pro Operation
Aktionsplanung und -ausführung
- Planungs-Token: 1.000-2.000
- Ausführungsfeedback: 500-1.000
- Kombinierte Kosten: ~$0,045 pro Aktion

Für einen umfassenden Leitfaden zu Agent-Preismustern siehe unseren Agent-Anwendungsfälle-Leitfaden.

Kostenoptimierungsstrategien

Beim Entwickeln von Agenten mit Claude:

Verwenden Sie geeignete Modelle: Wählen Sie Haiku für einfache Aufgaben, Sonnet für komplexe Überlegungen
Implementieren Sie Prompt-Caching: Reduzieren Sie Kosten für wiederholten Kontext
Batch-Operationen: Verwenden Sie die Batch-API für nicht zeitkritische Aufgaben
Überwachen Sie Nutzungsmuster: Verfolgen Sie Token-Verbrauch, um Optimierungsmöglichkeiten zu identifizieren

Für hochvolumige Agent-Anwendungen erwägen Sie, unser Enterprise-Vertriebsteam für benutzerdefinierte Preisvereinbarungen zu kontaktieren.

Zusätzliche Preisüberlegungen

Ratenlimits

Ratenlimits variieren je nach Nutzungsstufe und beeinflussen, wie viele Anfragen Sie stellen können:

Stufe 1: Einstiegsnutzung mit grundlegenden Limits
Stufe 2: Erhöhte Limits für wachsende Anwendungen
Stufe 3: Höhere Limits für etablierte Anwendungen
Stufe 4: Maximale Standardlimits
Enterprise: Benutzerdefinierte Limits verfügbar

Für detaillierte Ratenlimit-Informationen siehe unsere Ratenlimits-Dokumentation.

Für höhere Ratenlimits oder benutzerdefinierte Preisvereinbarungen kontaktieren Sie unser Vertriebsteam.

Mengenrabatte

Mengenrabatte können für Nutzer mit hohem Volumen verfügbar sein. Diese werden von Fall zu Fall verhandelt.

Standardstufen verwenden die oben gezeigten Preise
Enterprise-Kunden können den Vertrieb kontaktieren für benutzerdefinierte Preise
Akademische und Forschungsrabatte können verfügbar sein

Enterprise-Preise

Für Enterprise-Kunden mit spezifischen Bedürfnissen:

Benutzerdefinierte Ratenlimits
Mengenrabatte
Dedizierter Support
Benutzerdefinierte Bedingungen

Kontaktieren Sie unser Vertriebsteam unter sales@anthropic.com oder über die Anthropic Console, um Enterprise-Preisoptionen zu besprechen.

Abrechnung und Zahlung

Die Abrechnung erfolgt monatlich basierend auf der tatsächlichen Nutzung
Zahlungen werden in USD verarbeitet
Kreditkarten- und Rechnungsoptionen verfügbar
Nutzungsverfolgung verfügbar in der Anthropic Console

Häufig gestellte Fragen

Wie wird die Token-Nutzung berechnet?

Token sind Textteile, die Modelle verarbeiten. Als grobe Schätzung entspricht 1 Token etwa 4 Zeichen oder 0,75 Wörtern auf Englisch. Die genaue Anzahl variiert je nach Sprache und Inhaltstyp.

Gibt es kostenlose Stufen oder Testversionen?

Neue Nutzer erhalten eine kleine Menge kostenloser Credits zum Testen der API. Kontaktieren Sie den Vertrieb für Informationen über erweiterte Testversionen für Enterprise-Evaluierungen.

Wie stapeln sich Rabatte?

Batch-API- und Prompt-Caching-Rabatte können kombiniert werden. Zum Beispiel bietet die Verwendung beider Funktionen zusammen erhebliche Kosteneinsparungen im Vergleich zu Standard-API-Aufrufen.

Welche Zahlungsmethoden werden akzeptiert?

Wir akzeptieren gängige Kreditkarten für Standardkonten. Enterprise-Kunden können Rechnungsstellung und andere Zahlungsmethoden vereinbaren.

Für weitere Fragen zu Preisen kontaktieren Sie support@anthropic.com.

Modell-Veraltungen Mit Claude entwickeln

On this page

Modellpreise
Funktionsspezifische Preise
Batch-Verarbeitung
Long Context-Preise
Tool Use-Preise
Spezifische Tool-Preise
Bash-Tool
Code-Ausführungs-Tool
Texteditor-Tool
Web-Such-Tool
Computer Use-Tool
Agent-Anwendungsfall-Preisbeispiele
Kundensupport-Agent-Beispiel
Allgemeine Agent-Workflow-Preise
Kostenoptimierungsstrategien
Zusätzliche Preisüberlegungen
Ratenlimits
Mengenrabatte
Enterprise-Preise
Abrechnung und Zahlung
Häufig gestellte Fragen

Erste Schritte

Modelle & Preise

Mehr über Claude erfahren

Funktionen

Werkzeuge

Model Context Protocol (MCP)

Anwendungsfälle

Prompt Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

Rechtszentrum

Modellpreise

Funktionsspezifische Preise

Batch-Verarbeitung

Long Context-Preise

Tool Use-Preise

Spezifische Tool-Preise

Bash-Tool

Code-Ausführungs-Tool

Texteditor-Tool

Web-Such-Tool

Computer Use-Tool

Agent-Anwendungsfall-Preisbeispiele

Kundensupport-Agent-Beispiel

Allgemeine Agent-Workflow-Preise

Kostenoptimierungsstrategien

Zusätzliche Preisüberlegungen

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen

Erste Schritte

Modelle & Preise

Mehr über Claude erfahren

Funktionen

Werkzeuge

Model Context Protocol (MCP)

Anwendungsfälle

Prompt Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

Rechtszentrum

​Modellpreise

​Funktionsspezifische Preise

​Batch-Verarbeitung

​Long Context-Preise

​Tool Use-Preise

​Spezifische Tool-Preise

​Bash-Tool

​Code-Ausführungs-Tool

​Texteditor-Tool

​Web-Such-Tool

​Computer Use-Tool

​Agent-Anwendungsfall-Preisbeispiele

​Kundensupport-Agent-Beispiel

​Allgemeine Agent-Workflow-Preise

​Kostenoptimierungsstrategien

​Zusätzliche Preisüberlegungen

​Ratenlimits

​Mengenrabatte

​Enterprise-Preise

​Abrechnung und Zahlung

​Häufig gestellte Fragen

Modellpreise

Funktionsspezifische Preise

Batch-Verarbeitung

Long Context-Preise

Tool Use-Preise

Spezifische Tool-Preise

Bash-Tool

Code-Ausführungs-Tool

Texteditor-Tool

Web-Such-Tool

Computer Use-Tool

Agent-Anwendungsfall-Preisbeispiele

Kundensupport-Agent-Beispiel

Allgemeine Agent-Workflow-Preise

Kostenoptimierungsstrategien

Zusätzliche Preisüberlegungen

Ratenlimits

Mengenrabatte

Enterprise-Preise

Abrechnung und Zahlung

Häufig gestellte Fragen