令牌计数功能目前处于测试阶段

要访问此功能,请在您的 API 请求中包含 anthropic-beta: token-counting-2024-11-01 标头,或在您的 SDK 调用中使用 client.beta.messages.count_tokens

我们将在接下来的几周内对这个公开测试版进行迭代,因此我们非常感谢您的反馈。请使用此表单分享您的想法和建议。

令牌计数使您能够在向 Claude 发送消息之前确定消息中的令牌数量,帮助您对提示和使用情况做出明智的决定。通过令牌计数,您可以:

  • 主动管理速率限制和成本
  • 做出明智的模型路由决策
  • 优化提示以达到特定长度

如何计算消息令牌

令牌计数端点接受与创建消息相同的结构化输入列表,包括对系统提示、工具图像PDF 的支持。响应包含输入令牌的总数。

令牌计数应被视为估计值。在某些情况下,创建消息时实际使用的输入令牌数可能会有少量差异。

支持的模型

令牌计数端点支持以下模型:

  • Claude 3.5 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Haiku
  • Claude 3 Opus

计算基本消息中的令牌

JSON
{ "input_tokens": 14 }

计算带工具的消息中的令牌

JSON
{ "input_tokens": 403 }

计算带图像的消息中的令牌

JSON
{ "input_tokens": 1551 }

计算带 PDF 的消息中的令牌

JSON
{ "input_tokens": 2188 }

令牌计数 API 支持的 PDF 与消息 API 具有相同的限制


定价和速率限制

令牌计数是免费使用的,但根据您的使用层级受每分钟请求数限制。如果您需要更高的限制,请通过 Anthropic Console 联系销售团队。

使用层级每分钟请求数 (RPM)
1100
22,000
34,000
48,000

令牌计数和消息创建有独立的速率限制 — 使用其中一个不会计入另一个的限制。