L’API Vertex per accedere a Claude è quasi identica alla API Messages e supporta tutte le stesse opzioni, con due differenze chiave:

  • In Vertex, model non viene passato nel corpo della richiesta. Invece, viene specificato nell’URL dell’endpoint di Google Cloud.
  • In Vertex, anthropic_version viene passato nel corpo della richiesta (anziché come header), e deve essere impostato al valore vertex-2023-10-16.

Vertex è supportato anche dagli SDK client ufficiali di Anthropic. Questa guida ti accompagnerà attraverso il processo di invio di una richiesta a Claude su Vertex AI in Python o TypeScript.

Nota che questa guida presuppone che tu abbia già un progetto GCP in grado di utilizzare Vertex AI. Consulta utilizzo dei modelli Claude 3 di Anthropic per maggiori informazioni sulla configurazione richiesta, oltre a una guida completa.

Installare un SDK per accedere a Vertex AI

Prima di tutto, installa l’SDK client di Anthropic per il linguaggio di tua scelta.

pip install -U google-cloud-aiplatform "anthropic[vertex]"

Accesso a Vertex AI

Disponibilità dei modelli

Nota che la disponibilità dei modelli Anthropic varia in base alla regione. Cerca “Claude” nel Vertex AI Model Garden o vai su Usa Claude 3 per le informazioni più aggiornate.

Nomi dei modelli API

ModelloNome del modello Vertex AI API
Claude Opus 4claude-opus-4@20250514
Claude Sonnet 4claude-sonnet-4@20250514
Claude Sonnet 3.7claude-3-7-sonnet@20250219
Claude Haiku 3.5claude-3-5-haiku@20241022
Claude Sonnet 3.5claude-3-5-sonnet-v2@20241022
Claude Opus 3 (Anteprima Pubblica)claude-3-opus@20240229
Claude Sonnet 3claude-3-sonnet@20240229
Claude Haiku 3claude-3-haiku@20240307

Effettuare richieste

Prima di eseguire le richieste potrebbe essere necessario eseguire gcloud auth application-default login per autenticarsi con GCP.

I seguenti esempi mostrano come generare testo da Claude su Vertex AI:

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
# Dove è in esecuzione il modello
region = "us-east5"

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4@20250514",
    max_tokens=100,
    messages=[
        {
            "role": "user",
            "content": "Hey Claude!",
        }
    ],
)
print(message)

Consulta i nostri SDK client e la documentazione ufficiale di Vertex AI per maggiori dettagli.

Registrazione delle attività

Vertex fornisce un servizio di registrazione richiesta-risposta che consente ai clienti di registrare i prompt e i completamenti associati al proprio utilizzo.

Anthropic consiglia di registrare la propria attività su base continuativa di almeno 30 giorni per comprendere la propria attività e investigare su potenziali utilizzi impropri.

L’attivazione di questo servizio non dà a Google o Anthropic alcun accesso ai tuoi contenuti.