Kosten effektiv verwalten

Claude Code verbraucht Token für jede Interaktion. Die durchschnittlichen Kosten betragen 6 $pro Entwickler pro Tag, wobei die täglichen Kosten für 90% der Nutzer unter 12$ bleiben.

Für die Teamnutzung berechnet Claude Code nach API-Token-Verbrauch. Im Durchschnitt kostet Claude Code ~100-200 $/Entwickler pro Monat mit Sonnet 4, obwohl es große Abweichungen gibt, je nachdem, wie viele Instanzen Nutzer ausführen und ob sie es in der Automatisierung verwenden.

Verfolgen Sie Ihre Kosten

Verwenden Sie /cost, um die aktuelle Sitzungsnutzung zu sehen
Anthropic Console-Nutzer:
- Überprüfen Sie die historische Nutzung in der Anthropic Console (erfordert Admin- oder Billing-Rolle)
- Setzen Sie Arbeitsbereich-Ausgabenlimits für den Claude Code-Arbeitsbereich (erfordert Admin-Rolle)
Pro- und Max-Plan-Nutzer: Die Nutzung ist in Ihrem Abonnement enthalten

Kostenmanagement für Teams

Bei der Verwendung der Anthropic API können Sie die Gesamtausgaben für den Claude Code-Arbeitsbereich begrenzen. Zur Konfiguration folgen Sie diesen Anweisungen. Administratoren können Kosten- und Nutzungsberichte einsehen, indem sie diesen Anweisungen folgen.

Bei Bedrock und Vertex sendet Claude Code keine Metriken aus Ihrer Cloud. Um Kostenmetriken zu erhalten, berichteten mehrere große Unternehmen über die Verwendung von LiteLLM, einem Open-Source-Tool, das Unternehmen dabei hilft, Ausgaben nach Schlüssel zu verfolgen. Dieses Projekt ist nicht mit Anthropic verbunden und wir haben seine Sicherheit nicht geprüft.

Empfehlungen für Ratenlimits

Bei der Einrichtung von Claude Code für Teams sollten Sie diese Token Pro Minute (TPM) pro Nutzer-Empfehlungen basierend auf Ihrer Organisationsgröße berücksichtigen:

Teamgröße	TPM pro Nutzer
1-5 Nutzer	200k-300k
5-20 Nutzer	100k-150k
20-50 Nutzer	50k-75k
50-100 Nutzer	25k-35k
100-500 Nutzer	15k-20k
500+ Nutzer	10k-15k

Wenn Sie beispielsweise 200 Nutzer haben, könnten Sie 20k TPM für jeden Nutzer anfordern, oder 4 Millionen TPM insgesamt (200*20.000 = 4 Millionen).

Die TPM pro Nutzer nimmt ab, wenn die Teamgröße wächst, da wir erwarten, dass weniger Nutzer Claude Code gleichzeitig in größeren Organisationen verwenden. Diese Ratenlimits gelten auf Organisationsebene, nicht pro einzelnem Nutzer, was bedeutet, dass einzelne Nutzer vorübergehend mehr als ihren berechneten Anteil verbrauchen können, wenn andere den Service nicht aktiv nutzen.

Wenn Sie Szenarien mit ungewöhnlich hoher gleichzeitiger Nutzung erwarten (wie Live-Schulungssitzungen mit großen Gruppen), benötigen Sie möglicherweise höhere TPM-Zuweisungen pro Nutzer.

Token-Nutzung reduzieren

Kompakte Unterhaltungen:
- Claude verwendet standardmäßig Auto-Kompakt, wenn der Kontext 95% der Kapazität überschreitet
- Auto-Kompakt umschalten: Führen Sie /config aus und navigieren Sie zu “Auto-compact enabled”
- Verwenden Sie /compact manuell, wenn der Kontext groß wird
- Benutzerdefinierte Anweisungen hinzufügen: /compact Focus on code samples and API usage
- Kompaktierung anpassen, indem Sie zu CLAUDE.md hinzufügen:
  # Summary instructions When you are using compact, please focus on test output and code changes
Spezifische Abfragen schreiben: Vermeiden Sie vage Anfragen, die unnötiges Scannen auslösen
Komplexe Aufgaben aufteilen: Teilen Sie große Aufgaben in fokussierte Interaktionen auf
Verlauf zwischen Aufgaben löschen: Verwenden Sie /clear, um den Kontext zurückzusetzen

Die Kosten können erheblich variieren basierend auf:

Größe der analysierten Codebasis
Komplexität der Abfragen
Anzahl der durchsuchten oder modifizierten Dateien
Länge des Unterhaltungsverlaufs
Häufigkeit der Kompaktierung von Unterhaltungen
Hintergrundprozesse (Haiku-Generierung, Unterhaltungszusammenfassung)

Hintergrund-Token-Nutzung

Claude Code verwendet Token für einige Hintergrundfunktionen auch im Leerlauf:

Haiku-Generierung: Kleine kreative Nachrichten, die beim Tippen erscheinen (etwa 1 Cent pro Tag)
Unterhaltungszusammenfassung: Hintergrund-Jobs, die vorherige Unterhaltungen für die claude --resume-Funktion zusammenfassen
Befehlsverarbeitung: Einige Befehle wie /cost können Anfragen generieren, um den Status zu überprüfen

Diese Hintergrundprozesse verbrauchen eine kleine Menge Token (typischerweise unter 0,04 $ pro Sitzung) auch ohne aktive Interaktion.

Für Team-Deployments empfehlen wir, mit einer kleinen Pilotgruppe zu beginnen, um Nutzungsmuster zu etablieren, bevor eine breitere Einführung erfolgt.

Erste Schritte

Mit Claude Code entwickeln

Claude Code SDK

Bereitstellung

Verwaltung

Konfiguration

Referenz

Ressourcen

Kosten effektiv verwalten

Verfolgen Sie Ihre Kosten

Kostenmanagement für Teams

Empfehlungen für Ratenlimits

Token-Nutzung reduzieren

Hintergrund-Token-Nutzung

Erste Schritte

Mit Claude Code entwickeln

Claude Code SDK

Bereitstellung

Verwaltung

Konfiguration

Referenz

Ressourcen

​Verfolgen Sie Ihre Kosten

​Kostenmanagement für Teams

​Empfehlungen für Ratenlimits

​Token-Nutzung reduzieren

​Hintergrund-Token-Nutzung

Verfolgen Sie Ihre Kosten

Kostenmanagement für Teams

Empfehlungen für Ratenlimits

Token-Nutzung reduzieren

Hintergrund-Token-Nutzung