claude-opus-4-20250514
)claude-sonnet-4-20250514
)claude-3-7-sonnet-20250219
)claude-3-5-sonnet-20240620
и claude-3-5-sonnet-20241022
)claude-3-5-haiku-20241022
)claude-3-haiku-20240307
)claude-3-opus-20240229
)Model | Batch input | Batch output |
---|---|---|
Claude Opus 4.1 | $7.50 / MTok | $37.50 / MTok |
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 (deprecated) | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 (deprecated) | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
custom_id
для идентификации запроса Messagesparams
со стандартными параметрами Messages APIrequests
:
custom_id
и содержит стандартные параметры, которые вы бы использовали для вызова Messages API.
params
для каждого запроса сообщения выполняется асинхронно, и ошибки валидации возвращаются, когда обработка всего пакета завершена. Вы можете убедиться, что правильно строите ваш ввод, проверив форму вашего запроса с Messages API сначала.in_progress
.
processing_status
Message Batch указывает на стадию обработки, на которой находится пакет. Оно начинается как in_progress
, затем обновляется до ended
, когда все запросы в пакете завершили обработку, и результаты готовы. Вы можете отслеживать состояние вашего пакета, посетив Console, или используя конечную точку получения:
Тип результата | Описание |
---|---|
succeeded | Запрос был успешным. Включает результат сообщения. |
errored | Запрос столкнулся с ошибкой, и сообщение не было создано. Возможные ошибки включают недействительные запросы и внутренние ошибки сервера. Вы не будете оплачивать эти запросы. |
canceled | Пользователь отменил пакет до того, как этот запрос мог быть отправлен модели. Вы не будете оплачивать эти запросы. |
expired | Пакет достиг своего 24-часового истечения до того, как этот запрос мог быть отправлен модели. Вы не будете оплачивать эти запросы. |
request_counts
пакета, который показывает, сколько запросов достигло каждого из этих четырех состояний.
Результаты пакета доступны для загрузки по свойству results_url
на Message Batch, и если разрешения организации позволяют, в Console. Из-за потенциально большого размера результатов рекомендуется стримить результаты обратно, а не загружать их все сразу.
.jsonl
, где каждая строка является действительным JSON-объектом, представляющим результат одного запроса в Message Batch. Для каждого стримингового результата вы можете делать что-то разное в зависимости от его custom_id
и типа результата. Вот пример набора результатов:
result.error
будет установлен в нашу стандартную форму ошибки.
custom_id
.cache_control
в каждый запрос Message в вашем пакетеcache_control
для увеличения вероятности попаданий в кэш.
custom_id
для легкого сопоставления результатов с запросами, поскольку порядок не гарантирован.request_too_large
.custom_id
.created_at
пакета (не времени завершения обработки ended_at
). Если прошло более 29 дней, результаты больше не будут доступны для просмотра.Сколько времени требуется для обработки пакета?
Доступен ли Batches API для всех моделей?
Могу ли я использовать API Message Batches с другими функциями API?
Как API Message Batches влияет на ценообразование?
Могу ли я обновить пакет после его отправки?
Есть ли ограничения скорости API Message Batches и взаимодействуют ли они с ограничениями скорости Messages API?
Как обрабатывать ошибки в моих пакетных запросах?
result
, указывающее, был ли он succeeded
, errored
, был canceled
или expired
. Для результатов errored
будет предоставлена дополнительная информация об ошибке. Просмотрите объект ответа об ошибке в справочнике API.Как API Message Batches обрабатывает конфиденциальность и разделение данных?
Могу ли я использовать кэширование промптов в API Message Batches?