Configuración del modelo

Por defecto, Claude Code utiliza claude-opus-4-20250514. Puedes anular esto utilizando las siguientes variables de entorno:

# Anthropic API
ANTHROPIC_MODEL='claude-opus-4-20250514'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku-20241022'

# Amazon Bedrock (con ID de modelo)
ANTHROPIC_MODEL='us.anthropic.claude-opus-4-20250514-v1:0'
ANTHROPIC_SMALL_FAST_MODEL='us.anthropic.claude-3-5-haiku-20241022-v1:0'

# Amazon Bedrock (con ARN de perfil de inferencia)
ANTHROPIC_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id'
ANTHROPIC_SMALL_FAST_MODEL='arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-small-model-id'

# Google Vertex AI
ANTHROPIC_MODEL='claude-3-7-sonnet@20250219'
ANTHROPIC_SMALL_FAST_MODEL='claude-3-5-haiku@20241022'

También puedes establecer estas variables utilizando la configuración global:

# Configurar para Anthropic API
claude config set --global env '{"ANTHROPIC_MODEL": "claude-opus-4-20250514"}'

# Configurar para Bedrock (con ID de modelo)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "us.anthropic.claude-opus-4-20250514-v1:0"}'

# Configurar para Bedrock (con ARN de perfil de inferencia)
claude config set --global env '{"CLAUDE_CODE_USE_BEDROCK": "true", "ANTHROPIC_MODEL": "arn:aws:bedrock:us-east-2:your-account-id:application-inference-profile/your-model-id"}'

# Configurar para Vertex AI
claude config set --global env '{"CLAUDE_CODE_USE_VERTEX": "true", "ANTHROPIC_MODEL": "claude-3-7-sonnet@20250219"}'

Consulta nuestra referencia de nombres de modelos para todos los modelos disponibles en diferentes proveedores.

Uso con APIs de terceros

Claude Code requiere acceso tanto a los modelos Claude Sonnet 3.7 como Claude Haiku 3.5, independientemente del proveedor de API que utilices.

Conectar a Amazon Bedrock

CLAUDE_CODE_USE_BEDROCK=1

Si no tienes habilitado el almacenamiento en caché de prompts, también establece:

DISABLE_PROMPT_CACHING=1

Contacta a Amazon Bedrock para el almacenamiento en caché de prompts para reducir costos y obtener límites de tasa más altos.

Requiere credenciales estándar del SDK de AWS (por ejemplo, ~/.aws/credentials o variables de entorno relevantes como AWS_ACCESS_KEY_ID, AWS_SECRET_ACCESS_KEY). Para configurar las credenciales de AWS, ejecuta:

aws configure

Si deseas acceder a Claude Code a través de un proxy, puedes usar la variable de entorno ANTHROPIC_BEDROCK_BASE_URL:

ANTHROPIC_BEDROCK_BASE_URL='https://your-proxy-url'

Si tu proxy mantiene sus propias credenciales de AWS, puedes usar la variable de entorno CLAUDE_CODE_SKIP_BEDROCK_AUTH para eliminar el requisito de Claude Code para las credenciales de AWS.

CLAUDE_CODE_SKIP_BEDROCK_AUTH=1

Los usuarios necesitarán acceso tanto a los modelos Claude Sonnet 3.7 como Claude Haiku 3.5 en su cuenta de AWS. Si tienes un rol de acceso a modelos, es posible que debas solicitar acceso a estos modelos si aún no están disponibles. El acceso a Bedrock en cada región es necesario porque los perfiles de inferencia requieren capacidad entre regiones.

Conectar a Google Vertex AI

CLAUDE_CODE_USE_VERTEX=1
CLOUD_ML_REGION=us-east5
ANTHROPIC_VERTEX_PROJECT_ID=your-project-id

Si no tienes habilitado el almacenamiento en caché de prompts, también establece:

DISABLE_PROMPT_CACHING=1

Claude Code en Vertex AI actualmente solo admite la región us-east5. Asegúrate de que tu proyecto tenga cuota asignada en esta región específica.

Los usuarios necesitarán acceso tanto a los modelos Claude Sonnet 3.7 como Claude Haiku 3.5 en su proyecto de Vertex AI.

Requiere credenciales estándar de GCP configuradas a través de google-auth-library. Para configurar las credenciales de GCP, ejecuta:

gcloud auth application-default login

Si deseas acceder a Claude Code a través de un proxy, puedes usar la variable de entorno ANTHROPIC_VERTEX_BASE_URL:

ANTHROPIC_VERTEX_BASE_URL='https://your-proxy-url'

Si tu proxy mantiene sus propias credenciales de GCP, puedes usar la variable de entorno CLAUDE_CODE_SKIP_VERTEX_AUTH para eliminar el requisito de Claude Code para las credenciales de GCP.

CLAUDE_CODE_SKIP_VERTEX_AUTH=1

Para obtener la mejor experiencia, contacta a Google para obtener límites de tasa más altos.

Conectar a través de un proxy

Al usar Claude Code con un proxy LLM, puedes controlar el comportamiento de autenticación utilizando las siguientes variables de entorno y configuraciones. Ten en cuenta que puedes combinar estas con configuraciones específicas de Bedrock y Vertex.

Configuraciones

Claude Code admite una serie de configuraciones controladas a través de variables de entorno para configurar el uso con Bedrock y Vertex. Consulta Variables de entorno para una referencia completa.

Si prefieres configurar a través de un archivo en lugar de variables de entorno, puedes agregar cualquiera de estas configuraciones al objeto env en tus archivos de configuración de Claude Code.

También puedes configurar la opción apiKeyHelper, para establecer un script de shell personalizado para obtener una clave API (invocada una vez al inicio y almacenada en caché durante la duración de cada sesión, o hasta que transcurra CLAUDE_CODE_API_KEY_HELPER_TTL_MS).

LiteLLM

LiteLLM es un servicio proxy de terceros. Anthropic no respalda, mantiene ni audita la seguridad o funcionalidad de LiteLLM. Esta guía se proporciona con fines informativos y puede quedar desactualizada. Úsala bajo tu propia discreción.

Esta sección muestra la configuración de Claude Code con LiteLLM Proxy Server, un proxy LLM de terceros que ofrece seguimiento de uso y gasto, autenticación centralizada, presupuestos por usuario y más.

Paso 1: Requisitos previos

  • Claude Code actualizado a la última versión
  • LiteLLM Proxy Server en ejecución y accesible por red a Claude Code
  • Tu clave de proxy LiteLLM

Paso 2: Configurar la autenticación del proxy

Elige uno de estos métodos de autenticación:

Opción A: Clave de proxy estática Establece tu clave de proxy como una variable de entorno:

ANTHROPIC_AUTH_TOKEN=your-proxy-key

Opción B: Clave de proxy dinámica Si tu organización utiliza claves rotativas o autenticación dinámica:

  1. No establezcas la variable de entorno ANTHROPIC_AUTH_TOKEN
  2. Crea un script de ayuda de claves para proporcionar tokens de autenticación
  3. Registra el script bajo la configuración apiKeyHelper en tu configuración de Claude Code
  4. Establece la vida útil del token para habilitar la actualización automática:
    CLAUDE_CODE_API_KEY_HELPER_TTL_MS=3600000
    
    Establece esto a la vida útil (en milisegundos) de los tokens devueltos por tu apiKeyHelper.

Paso 3: Configurar tu despliegue

Elige qué despliegue de Claude quieres usar a través de LiteLLM:

  • Anthropic API: Conexión directa a la API de Anthropic
  • Bedrock: Amazon Bedrock con modelos Claude
  • Vertex AI: Google Cloud Vertex AI con modelos Claude
Opción A: Anthropic API a través de LiteLLM
  1. Configura el punto final de LiteLLM:
    ANTHROPIC_BASE_URL=https://litellm-url:4000/anthropic
    
Opción B: Bedrock a través de LiteLLM
  1. Configura los ajustes de Bedrock:
    ANTHROPIC_BEDROCK_BASE_URL=https://litellm-url:4000/bedrock
    CLAUDE_CODE_SKIP_BEDROCK_AUTH=1
    CLAUDE_CODE_USE_BEDROCK=1
    
Opción C: Vertex AI a través de LiteLLM

Recomendado: Credenciales especificadas por el proxy

  1. Configura los ajustes de Vertex:
    ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
    CLAUDE_CODE_SKIP_VERTEX_AUTH=1
    CLAUDE_CODE_USE_VERTEX=1
    

Alternativa: Credenciales especificadas por el cliente

Si prefieres usar credenciales GCP locales:

  1. Autentícate con GCP localmente:

    gcloud auth application-default login
    
  2. Configura los ajustes de Vertex:

    ANTHROPIC_VERTEX_BASE_URL=https://litellm-url:4000/vertex_ai/v1
    ANTHROPIC_VERTEX_PROJECT_ID=your-gcp-project-id
    CLAUDE_CODE_USE_VERTEX=1
    CLOUD_ML_REGION=your-gcp-region
    
  3. Actualiza la configuración del encabezado de LiteLLM:

    Asegúrate de que tu configuración de LiteLLM tenga general_settings.litellm_key_header_name establecido en Proxy-Authorization, ya que el token GCP de paso estará ubicado en el encabezado Authorization.

Paso 4. Seleccionar un modelo

Por defecto, los modelos utilizarán los especificados en Configuración del modelo.

Si has configurado nombres de modelos personalizados en LiteLLM, establece las variables de entorno mencionadas anteriormente a esos nombres personalizados.

Para obtener información más detallada, consulta la documentación de LiteLLM.