Kosten effektiv verwalten
Erfahren Sie, wie Sie die Token-Nutzung und Kosten bei der Verwendung von Claude Code verfolgen und optimieren können.
Claude Code verbraucht Tokens für jede Interaktion. Die durchschnittlichen Kosten betragen 6 bleiben.
Für die Teamnutzung berechnet Claude Code nach API-Token-Verbrauch. Im Durchschnitt kostet Claude Code ~50-60$/Entwickler pro Monat mit Sonnet 4, obwohl es große Unterschiede gibt, je nachdem, wie viele Instanzen Benutzer ausführen und ob sie es in der Automatisierung verwenden.
Verfolgen Sie Ihre Kosten
- Verwenden Sie
/cost
, um die aktuelle Sitzungsnutzung zu sehen - Anthropic Console-Benutzer:
- Überprüfen Sie die historische Nutzung in der Anthropic Console (erfordert Admin- oder Abrechnungsrolle)
- Setzen Sie Arbeitsbereich-Ausgabenlimits für den Claude Code-Arbeitsbereich (erfordert Admin-Rolle)
- Pro- und Max-Plan-Benutzer: Die Nutzung ist in Ihrem Abonnement enthalten
Kostenmanagement für Teams
Bei der Verwendung der Anthropic API können Sie die Gesamtausgaben für den Claude Code-Arbeitsbereich begrenzen. Zur Konfiguration folgen Sie diesen Anweisungen. Administratoren können Kosten- und Nutzungsberichte einsehen, indem sie diesen Anweisungen folgen.
Bei Bedrock und Vertex sendet Claude Code keine Metriken aus Ihrer Cloud. Um Kostenmetriken zu erhalten, berichteten mehrere große Unternehmen über die Verwendung von LiteLLM, einem Open-Source-Tool, das Unternehmen dabei hilft, Ausgaben nach Schlüssel zu verfolgen. Dieses Projekt ist nicht mit Anthropic verbunden und wir haben seine Sicherheit nicht geprüft.
Token-Nutzung reduzieren
-
Kompakte Unterhaltungen:
-
Claude verwendet standardmäßig Auto-Kompakt, wenn der Kontext 95% der Kapazität überschreitet
-
Auto-Kompakt umschalten: Führen Sie
/config
aus und navigieren Sie zu “Auto-compact enabled” -
Verwenden Sie
/compact
manuell, wenn der Kontext groß wird -
Benutzerdefinierte Anweisungen hinzufügen:
/compact Focus on code samples and API usage
-
Kompaktierung anpassen, indem Sie zu CLAUDE.md hinzufügen:
-
-
Spezifische Abfragen schreiben: Vermeiden Sie vage Anfragen, die unnötiges Scannen auslösen
-
Komplexe Aufgaben aufteilen: Teilen Sie große Aufgaben in fokussierte Interaktionen auf
-
Verlauf zwischen Aufgaben löschen: Verwenden Sie
/clear
, um den Kontext zurückzusetzen
Die Kosten können erheblich variieren basierend auf:
- Größe der analysierten Codebasis
- Komplexität der Abfragen
- Anzahl der durchsuchten oder geänderten Dateien
- Länge des Unterhaltungsverlaufs
- Häufigkeit der Kompaktierung von Unterhaltungen
- Hintergrundprozesse (Haiku-Generierung, Unterhaltungszusammenfassung)
Hintergrund-Token-Nutzung
Claude Code verwendet Tokens für einige Hintergrundfunktionen auch im Leerlauf:
- Haiku-Generierung: Kleine kreative Nachrichten, die beim Tippen erscheinen (etwa 1 Cent pro Tag)
- Unterhaltungszusammenfassung: Hintergrundjobs, die vorherige Unterhaltungen für die
claude --resume
-Funktion zusammenfassen - Befehlsverarbeitung: Einige Befehle wie
/cost
können Anfragen generieren, um den Status zu überprüfen
Diese Hintergrundprozesse verbrauchen eine kleine Menge an Tokens (typischerweise unter 0,04 $ pro Sitzung) auch ohne aktive Interaktion.
Für Team-Bereitstellungen empfehlen wir, mit einer kleinen Pilotgruppe zu beginnen, um Nutzungsmuster zu etablieren, bevor eine breitere Einführung erfolgt.