claude-opus-4-20250514
)claude-sonnet-4-20250514
)claude-3-7-sonnet-20250219
)claude-3-5-sonnet-20240620
y claude-3-5-sonnet-20241022
)claude-3-5-haiku-20241022
)claude-3-haiku-20240307
)claude-3-opus-20240229
)Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
custom_id
único para identificar la solicitud de Mensajesparams
con los parámetros estándar de la API de Mensajesrequests
:
custom_id
único y contiene los parámetros estándar que usarías para una llamada a la API de Mensajes.
params
para cada solicitud de mensaje se realiza asincrónicamente, y los errores de validación se devuelven cuando el procesamiento de todo el lote ha terminado. Puedes asegurar que estás construyendo tu entrada correctamente verificando la forma de tu solicitud con la API de Mensajes primero.in_progress
.
processing_status
del Lote de Mensajes indica la etapa de procesamiento en la que se encuentra el lote. Comienza como in_progress
, luego se actualiza a ended
una vez que todas las solicitudes en el lote han terminado de procesarse, y los resultados están listos. Puedes monitorear el estado de tu lote visitando la Consola, o usando el endpoint de recuperación:
Tipo de Resultado | Descripción |
---|---|
succeeded | La solicitud fue exitosa. Incluye el resultado del mensaje. |
errored | La solicitud encontró un error y no se creó un mensaje. Los posibles errores incluyen solicitudes inválidas y errores internos del servidor. No se te cobrará por estas solicitudes. |
canceled | El usuario canceló el lote antes de que esta solicitud pudiera ser enviada al modelo. No se te cobrará por estas solicitudes. |
expired | El lote alcanzó su expiración de 24 horas antes de que esta solicitud pudiera ser enviada al modelo. No se te cobrará por estas solicitudes. |
request_counts
del lote, que muestra cuántas solicitudes alcanzaron cada uno de estos cuatro estados.
Los resultados del lote están disponibles para descarga en la propiedad results_url
del Lote de Mensajes, y si el permiso de la organización lo permite, en la Consola. Debido al tamaño potencialmente grande de los resultados, se recomienda transmitir resultados de vuelta en lugar de descargarlos todos a la vez.
.jsonl
, donde cada línea es un objeto JSON válido que representa el resultado de una sola solicitud en el Lote de Mensajes. Para cada resultado transmitido, puedes hacer algo diferente dependiendo de su custom_id
y tipo de resultado. Aquí hay un ejemplo de conjunto de resultados:
result.error
se establecerá a nuestra forma de error estándar.
custom_id
.cache_control
idénticos en cada solicitud de Mensaje dentro de tu lotecache_control
para aumentar la probabilidad de aciertos de caché.
custom_id
significativos para hacer coincidir fácilmente resultados con solicitudes, ya que el orden no está garantizado.request_too_large
.custom_id
único.created_at
del lote (no el tiempo ended_at
de procesamiento). Si han pasado más de 29 días, los resultados ya no serán visibles.¿Cuánto tiempo toma procesar un lote?
¿Está disponible la API de Lotes para todos los modelos?
¿Puedo usar la API de Lotes de Mensajes con otras características de la API?
¿Cómo afecta la API de Lotes de Mensajes a los precios?
¿Puedo actualizar un lote después de que ha sido enviado?
¿Hay límites de tasa de la API de Lotes de Mensajes y cómo interactúan con los límites de tasa de la API de Mensajes?
¿Cómo manejo errores en mis solicitudes de lote?
result
indicando si succeeded
, errored
, fue canceled
, o expired
. Para resultados errored
, se proporcionará información adicional del error. Ve el objeto de respuesta de error en la referencia de la API.¿Cómo maneja la API de Lotes de Mensajes la privacidad y separación de datos?
¿Puedo usar caché de prompts en la API de Lotes de Mensajes?