Token-Zählung

Die Token-Zählung ermöglicht es Ihnen, die Anzahl der Tokens in einer Nachricht zu bestimmen, bevor Sie sie an Claude senden, was Ihnen hilft, fundierte Entscheidungen über Ihre Prompts und Nutzung zu treffen. Mit der Token-Zählung können Sie

Rate-Limits und Kosten proaktiv verwalten
Intelligente Entscheidungen zum Modell-Routing treffen
Prompts optimieren, um eine bestimmte Länge zu erreichen

Wie man Nachrichten-Tokens zählt

Der Token-Zählungs-Endpunkt akzeptiert die gleiche strukturierte Liste von Eingaben wie beim Erstellen einer Nachricht, einschließlich Unterstützung für System-Prompts, Tools, Bilder und PDFs. Die Antwort enthält die Gesamtzahl der Eingabe-Tokens.

Die Token-Anzahl sollte als Schätzung betrachtet werden. In einigen Fällen kann die tatsächliche Anzahl der Eingabe-Tokens, die beim Erstellen einer Nachricht verwendet werden, geringfügig abweichen.

Unterstützte Modelle

Der Token-Zählungs-Endpunkt unterstützt die folgenden Modelle:

Claude Opus 4
Claude Sonnet 4
Claude Sonnet 3.7
Claude Sonnet 3.5
Claude Haiku 3.5
Claude Haiku 3
Claude Opus 3

Tokens in einfachen Nachrichten zählen

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-20250514",
    system="You are a scientist",
    messages=[{
        "role": "user",
        "content": "Hello, Claude"
    }],
)

print(response.json())

JSON

{ "input_tokens": 14 }

Tokens in Nachrichten mit Tools zählen

Server-Tool-Token-Zählungen gelten nur für den ersten Sampling-Aufruf.

import anthropic

client = anthropic.Anthropic()

response = client.messages.count_tokens(
    model="claude-opus-4-20250514",
    tools=[
        {
            "name": "get_weather",
            "description": "Get the current weather in a given location",
            "input_schema": {
                "type": "object",
                "properties": {
                    "location": {
                        "type": "string",
                        "description": "The city and state, e.g. San Francisco, CA",
                    }
                },
                "required": ["location"],
            },
        }
    ],
    messages=[{"role": "user", "content": "What's the weather like in San Francisco?"}]
)

print(response.json())

JSON

{ "input_tokens": 403 }

Tokens in Nachrichten mit Bildern zählen

#!/bin/sh

IMAGE_URL="https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
IMAGE_MEDIA_TYPE="image/jpeg"
IMAGE_BASE64=$(curl "$IMAGE_URL" | base64)

curl https://api.anthropic.com/v1/messages/count_tokens \
     --header "x-api-key: $ANTHROPIC_API_KEY" \
     --header "anthropic-version: 2023-06-01" \
     --header "content-type: application/json" \
     --data \
'{
    "model": "claude-opus-4-20250514",
    "messages": [
        {"role": "user", "content": [
            {"type": "image", "source": {
                "type": "base64",
                "media_type": "'$IMAGE_MEDIA_TYPE'",
                "data": "'$IMAGE_BASE64'"
            }},
            {"type": "text", "text": "Describe this image"}
        ]}
    ]
}'

JSON

{ "input_tokens": 1551 }

Tokens in Nachrichten mit erweitertem Denken zählen

Siehe hier für weitere Details darüber, wie das Kontextfenster mit erweitertem Denken berechnet wird

Denkblöcke aus vorherigen Assistenten-Antworten werden ignoriert und zählen nicht zu Ihren Eingabe-Tokens
Aktuelles Assistenten-Denken zählt zu Ihren Eingabe-Tokens

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-opus-4-20250514",
      "thinking": {
        "type": "enabled",
        "budget_tokens": 16000
      },
      "messages": [
        {
          "role": "user",
          "content": "Are there an infinite number of prime numbers such that n mod 4 == 3?"
        },
        {
          "role": "assistant",
          "content": [
            {
              "type": "thinking",
              "thinking": "This is a nice number theory question. Lets think about it step by step...",
              "signature": "EuYBCkQYAiJAgCs1le6/Pol5Z4/JMomVOouGrWdhYNsH3ukzUECbB6iWrSQtsQuRHJID6lWV..."
            },
            {
              "type": "text",
              "text": "Yes, there are infinitely many prime numbers p such that p mod 4 = 3..."
            }
          ]
        },
        {
          "role": "user",
          "content": "Can you write a formal proof?"
        }
      ]
    }'

JSON

{ "input_tokens": 88 }

Tokens in Nachrichten mit PDFs zählen

Die Token-Zählung unterstützt PDFs mit den gleichen Einschränkungen wie die Messages API.

curl https://api.anthropic.com/v1/messages/count_tokens \
    --header "x-api-key: $ANTHROPIC_API_KEY" \
    --header "content-type: application/json" \
    --header "anthropic-version: 2023-06-01" \
    --data '{
      "model": "claude-opus-4-20250514",
      "messages": [{
        "role": "user",
        "content": [
          {
            "type": "document",
            "source": {
              "type": "base64",
              "media_type": "application/pdf",
              "data": "'$(base64 -i document.pdf)'"
            }
          },
          {
            "type": "text",
            "text": "Please summarize this document."
          }
        ]
      }]
    }'

JSON

{ "input_tokens": 2188 }

Preisgestaltung und Rate-Limits

Die Token-Zählung ist kostenlos nutzbar, unterliegt jedoch Anfragen-pro-Minute-Rate-Limits basierend auf Ihrer Nutzungsstufe. Wenn Sie höhere Limits benötigen, kontaktieren Sie den Vertrieb über die Anthropic Console.

Nutzungsstufe	Anfragen pro Minute (RPM)
1	100
2	2.000
3	4.000
4	8.000

Token-Zählung und Nachrichtenerstellung haben separate und unabhängige Rate-Limits — die Nutzung des einen zählt nicht gegen die Limits des anderen.

FAQ

Verwendet die Token-Zählung Prompt-Caching?

Erste Schritte

Modelle & Preise

Mehr über Claude erfahren

Funktionen

Werkzeuge

Model Context Protocol (MCP)

Anwendungsfälle

Prompt Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

Rechtszentrum

Wie man Nachrichten-Tokens zählt

Unterstützte Modelle

Tokens in einfachen Nachrichten zählen

Tokens in Nachrichten mit Tools zählen

Tokens in Nachrichten mit Bildern zählen

Tokens in Nachrichten mit erweitertem Denken zählen

Tokens in Nachrichten mit PDFs zählen

Preisgestaltung und Rate-Limits

FAQ

Erste Schritte

Modelle & Preise

Mehr über Claude erfahren

Funktionen

Werkzeuge

Model Context Protocol (MCP)

Anwendungsfälle

Prompt Engineering

Testen & bewerten

Schutzmaßnahmen verstärken

Rechtszentrum

​Wie man Nachrichten-Tokens zählt

​Unterstützte Modelle

​Tokens in einfachen Nachrichten zählen

​Tokens in Nachrichten mit Tools zählen

​Tokens in Nachrichten mit Bildern zählen

​Tokens in Nachrichten mit erweitertem Denken zählen

​Tokens in Nachrichten mit PDFs zählen

​Preisgestaltung und Rate-Limits

​FAQ

Wie man Nachrichten-Tokens zählt

Unterstützte Modelle

Tokens in einfachen Nachrichten zählen

Tokens in Nachrichten mit Tools zählen

Tokens in Nachrichten mit Bildern zählen

Tokens in Nachrichten mit erweitertem Denken zählen

Tokens in Nachrichten mit PDFs zählen

Preisgestaltung und Rate-Limits

FAQ