Esta página proporciona información detallada sobre los precios de los modelos y características de Anthropic. Todos los precios están en USD.

Para obtener la información de precios más actualizada, visita anthropic.com/pricing.

Precios de los modelos

La siguiente tabla muestra los precios para todos los modelos de Claude en diferentes niveles de uso:

ModelBase Input TokensCache WritesCache HitsOutput Tokens
Claude 3.7 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Sonnet$3 / MTok$3.75 / MTok$0.30 / MTok$15 / MTok
Claude 3.5 Haiku$0.80 / MTok$1 / MTok$0.08 / MTok$4 / MTok
Claude 3 Opus$15 / MTok$18.75 / MTok$1.50 / MTok$75 / MTok
Claude 3 Haiku$0.25 / MTok$0.30 / MTok$0.03 / MTok$1.25 / MTok

MTok = Millones de tokens. La columna “Base Input Tokens” muestra el precio estándar de entrada, “Cache Writes” y “Cache Hits” son específicos para el almacenamiento en caché de prompts, y “Output Tokens” muestra el precio de salida.

Precios específicos por característica

Procesamiento por lotes

La API de procesamiento por lotes permite el procesamiento asíncrono de grandes volúmenes de solicitudes con un 50% de descuento tanto en tokens de entrada como de salida.

ModelBatch inputBatch output
Claude 3.7 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Sonnet$1.50 / MTok$7.50 / MTok
Claude 3.5 Haiku$0.40 / MTok$2 / MTok
Claude 3 Opus$7.50 / MTok$37.50 / MTok
Claude 3 Haiku$0.125 / MTok$0.625 / MTok

Para más información sobre el procesamiento por lotes, consulta nuestra documentación de procesamiento por lotes.

Precios de uso de herramientas

Tool use requests are priced based on:

  1. The total number of input tokens sent to the model (including in the tools parameter)
  2. The number of output tokens generated
  3. For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)

Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.

The additional tokens from tool use come from:

  • The tools parameter in API requests (tool names, descriptions, and schemas)
  • tool_use content blocks in API requests and responses
  • tool_result content blocks in API requests

When you use tools, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools are provided, then a tool choice of none uses 0 additional system prompt tokens.

ModelTool choiceTool use system prompt token count
Claude 3.7 Sonnetauto, none
any, tool
346 tokens
313 tokens
Claude 3.5 Sonnet (Oct)auto, none
any, tool
346 tokens
313 tokens
Claude 3 Opusauto, none
any, tool
530 tokens
281 tokens
Claude 3 Sonnetauto, none
any, tool
159 tokens
235 tokens
Claude 3 Haikuauto, none
any, tool
264 tokens
340 tokens
Claude 3.5 Sonnet (June)auto, none
any, tool
294 tokens
261 tokens

These token counts are added to your normal input and output tokens to calculate the total cost of a request.

Para los precios actuales por modelo, consulta nuestra sección de precios de modelos anterior.

Para más información sobre la implementación y mejores prácticas del uso de herramientas, consulta nuestra documentación de uso de herramientas.

Ejemplos de precios para casos de uso de agentes

Entender los precios para aplicaciones de agentes es crucial cuando se construye con Claude. Estos ejemplos del mundo real pueden ayudarte a estimar costos para diferentes patrones de agentes.

Ejemplo de agente de atención al cliente

Al construir un agente de atención al cliente, así es como se podrían desglosar los costos:

Ejemplo de cálculo para procesar 10,000 tickets de soporte:

  • Promedio de ~3,700 tokens por conversación
  • Usando Claude 3.7 Sonnet a 3/MTokdeentrada,3/MTok de entrada, 15/MTok de salida
  • Costo total: ~$22.20 por 10,000 tickets

Para una explicación detallada de este cálculo, consulta nuestra guía de agente de atención al cliente.

Precios del flujo de trabajo general del agente

Para arquitecturas de agentes más complejas con múltiples pasos:

  1. Procesamiento inicial de solicitudes

    • Entrada típica: 500-1,000 tokens
    • Costo de procesamiento: ~$0.003 por solicitud
  2. Recuperación de memoria y contexto

    • Contexto recuperado: 2,000-5,000 tokens
    • Costo por recuperación: ~$0.015 por operación
  3. Planificación y ejecución de acciones

    • Tokens de planificación: 1,000-2,000
    • Retroalimentación de ejecución: 500-1,000
    • Costo combinado: ~$0.045 por acción

Para una guía completa sobre patrones de precios de agentes, consulta nuestra guía de casos de uso de agentes.

Estrategias de optimización de costos

Al construir agentes con Claude:

  1. Usa los modelos apropiados: Elige Haiku para tareas simples, Sonnet para razonamiento complejo
  2. Implementa el almacenamiento en caché de prompts: Reduce costos para contextos repetidos
  3. Operaciones por lotes: Usa la API de procesamiento por lotes para tareas no sensibles al tiempo
  4. Monitorea patrones de uso: Rastrea el consumo de tokens para identificar oportunidades de optimización

Para aplicaciones de agentes de alto volumen, considera contactar a nuestro equipo de ventas empresariales para acuerdos de precios personalizados.

Consideraciones adicionales sobre precios

Límites de tasa

Los límites de tasa varían según el nivel de uso y afectan cuántas solicitudes puedes hacer:

  • Nivel 1: Uso de nivel de entrada con límites básicos
  • Nivel 2: Límites aumentados para aplicaciones en crecimiento
  • Nivel 3: Límites más altos para aplicaciones establecidas
  • Nivel 4: Límites estándar máximos
  • Empresarial: Límites personalizados disponibles

Para información detallada sobre límites de tasa, consulta nuestra documentación de límites de tasa.

Descuentos por volumen

Los descuentos por volumen pueden estar disponibles para usuarios de alto volumen. Estos se negocian caso por caso.

  • Los niveles estándar utilizan los precios mostrados arriba
  • Los clientes empresariales pueden contactar a ventas para precios personalizados
  • Pueden estar disponibles descuentos académicos y de investigación

Precios empresariales

Para clientes empresariales con necesidades específicas:

  • Límites de tasa personalizados
  • Descuentos por volumen
  • Soporte dedicado
  • Términos personalizados

Contacta a nuestro equipo de ventas en sales@anthropic.com o a través de la Consola de Anthropic para discutir opciones de precios empresariales.

Facturación y pago

  • La facturación se calcula mensualmente según el uso real
  • Los pagos se procesan en USD
  • Opciones disponibles de tarjeta de crédito y facturación
  • Seguimiento de uso disponible en la Consola de Anthropic

Preguntas frecuentes

¿Cómo se calcula el uso de tokens?

Los tokens son piezas de texto que procesan los modelos. Como estimación aproximada, 1 token es aproximadamente 4 caracteres o 0.75 palabras en inglés. El conteo exacto varía según el idioma y tipo de contenido.

¿Hay niveles gratuitos o pruebas?

Los nuevos usuarios reciben una pequeña cantidad de créditos gratuitos para probar la API. Contacta a ventas para información sobre pruebas extendidas para evaluación empresarial.

¿Cómo se acumulan los descuentos?

Los descuentos de la API de procesamiento por lotes y el almacenamiento en caché de prompts se pueden combinar. Por ejemplo, usar ambas características juntas proporciona ahorros significativos en costos comparado con llamadas estándar a la API.

¿Qué métodos de pago se aceptan?

Aceptamos las principales tarjetas de crédito para cuentas estándar. Los clientes empresariales pueden acordar facturación y otros métodos de pago.

Para preguntas adicionales sobre precios, contacta a support@anthropic.com.