使用 Claude 构建
令牌计数(测试版)
令牌计数功能目前处于测试阶段
要访问此功能,请在您的 API 请求中包含 anthropic-beta: token-counting-2024-11-01
标头,或在您的 SDK 调用中使用 client.beta.messages.count_tokens
。
我们将在接下来的几周内对这个公开测试版进行迭代,因此我们非常感谢您的反馈。请使用此表单分享您的想法和建议。
令牌计数使您能够在向 Claude 发送消息之前确定消息中的令牌数量,帮助您对提示和使用情况做出明智的决定。通过令牌计数,您可以:
- 主动管理速率限制和成本
- 做出明智的模型路由决策
- 优化提示以达到特定长度
如何计算消息令牌
令牌计数端点接受与创建消息相同的结构化输入列表,包括对系统提示、工具、图像和 PDF 的支持。响应包含输入令牌的总数。
令牌计数应被视为估计值。在某些情况下,创建消息时实际使用的输入令牌数可能会有少量差异。
支持的模型
令牌计数端点支持以下模型:
- Claude 3.5 Sonnet
- Claude 3.5 Haiku
- Claude 3 Haiku
- Claude 3 Opus
计算基本消息中的令牌
JSON
计算带工具的消息中的令牌
JSON
计算带图像的消息中的令牌
JSON
计算带 PDF 的消息中的令牌
JSON
令牌计数 API 支持的 PDF 与消息 API 具有相同的限制。
定价和速率限制
令牌计数是免费使用的,但根据您的使用层级受每分钟请求数限制。如果您需要更高的限制,请通过 Anthropic Console 联系销售团队。
使用层级 | 每分钟请求数 (RPM) |
---|---|
1 | 100 |
2 | 2,000 |
3 | 4,000 |
4 | 8,000 |
令牌计数和消息创建有独立的速率限制 — 使用其中一个不会计入另一个的限制。
Was this page helpful?