Die Vertex API für den Zugriff auf Claude ist nahezu identisch mit der Messages API und unterstützt alle dieselben Optionen, mit zwei wichtigen Unterschieden:

  • In Vertex wird model nicht im Request-Body übergeben. Stattdessen wird es in der Google Cloud Endpoint-URL spezifiziert.
  • In Vertex wird anthropic_version im Request-Body übergeben (anstatt als Header) und muss auf den Wert vertex-2023-10-16 gesetzt werden.

Vertex wird auch von Anthropics offiziellen Client-SDKs unterstützt. Diese Anleitung führt Sie durch den Prozess einer Anfrage an Claude auf Vertex AI in Python oder TypeScript.

Beachten Sie, dass diese Anleitung davon ausgeht, dass Sie bereits ein GCP-Projekt haben, das Vertex AI nutzen kann. Siehe Verwendung der Claude 3 Modelle von Anthropic für weitere Informationen zum erforderlichen Setup sowie eine vollständige Anleitung.

Installation eines SDK für den Zugriff auf Vertex AI

Installieren Sie zunächst Anthropics Client-SDK für Ihre bevorzugte Programmiersprache.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Zugriff auf Vertex AI

Modellverfügbarkeit

Beachten Sie, dass die Verfügbarkeit von Anthropic-Modellen je nach Region variiert. Suchen Sie nach “Claude” im Vertex AI Model Garden oder gehen Sie zu Claude 3 verwenden für die neuesten Informationen.

API-Modellnamen

ModellVertex AI API Modellname
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Public Preview)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Anfragen stellen

Vor dem Ausführen von Anfragen müssen Sie möglicherweise gcloud auth application-default login ausführen, um sich bei GCP zu authentifizieren.

Die folgenden Beispiele zeigen, wie Sie Text von Claude auf Vertex AI generieren:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Wo das Modell läuft
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Siehe unsere Client-SDKs und die offiziellen Vertex AI Docs für weitere Details.

Aktivitätsprotokollierung

Vertex bietet einen Request-Response-Protokollierungsservice, der es Kunden ermöglicht, die Prompts und Vervollständigungen im Zusammenhang mit Ihrer Nutzung zu protokollieren.

Anthropic empfiehlt, dass Sie Ihre Aktivität mindestens auf einer 30-tägigen rollierenden Basis protokollieren, um Ihre Aktivität zu verstehen und potenzielle Missbräuche zu untersuchen.

Das Einschalten dieses Services gibt Google oder Anthropic keinen Zugriff auf Ihre Inhalte.

Feature-Unterstützung

Sie können alle derzeit auf Vertex unterstützten Features hier finden.