工具使用(函数调用)
Claude能够与外部客户端工具和函数进行交互,让您可以为Claude配备自己的自定义工具,以执行更广泛的任务。
以下是使用Messages API为Claude提供工具的示例:
工具使用的工作原理
通过以下步骤将外部工具与Claude集成:
为Claude提供工具和用户提示
- 在API请求中定义具有名称、描述和输入模式的工具。
- 包含可能需要这些工具的用户提示,例如”旧金山的天气如何?”
Claude决定使用工具
- Claude评估是否有任何工具可以帮助回答用户的查询。
- 如果是,Claude构造一个格式正确的工具使用请求。
- API响应的
stop_reason
为tool_use
,表示Claude的意图。
提取工具输入、运行代码并返回结果
- 在您的端,从Claude的请求中提取工具名称和输入。
- 在客户端执行实际的工具代码。
- 继续对话,发送一个包含
tool_result
内容块的新user
消息。
Claude使用工具结果制定响应
- Claude分析工具结果,为原始用户提示制定最终响应。
注意:步骤3和4是可选的。对于某些工作流程,Claude的工具使用请求(步骤2)可能就是您所需要的全部内容,无需将结果发送回Claude。
所有工具都由用户提供
需要注意的是,Claude没有访问任何内置的服务器端工具。所有工具都必须由您(用户)在每个API请求中明确提供。这使您可以完全控制和灵活地决定Claude可以使用的工具。
如何实现工具使用
选择模型
通常,对于复杂的工具和模糊的查询,使用Claude 3 Opus;它可以更好地处理多个工具,并在需要时寻求澄清。
对于简单的工具使用Haiku,但请注意它可能会推断缺失的参数。
指定工具
工具在API请求的顶级参数tools
中指定。每个工具定义包括:
参数 | 描述 |
---|---|
name | 工具的名称。必须匹配正则表达式 ^[a-zA-Z0-9_-]{1,64}$ 。 |
description | 详细的纯文本描述,说明工具的功能、何时应使用以及其行为方式。 |
input_schema | 一个JSON Schema对象,定义工具的预期参数。 |
工具定义的最佳实践
要在使用工具时获得Claude的最佳性能,请遵循以下准则:
- 提供极其详细的描述。 这是工具性能中最重要的因素。您的描述应解释有关工具的每个细节,包括:
- 工具的功能
- 何时应使用(以及何时不应使用)
- 每个参数的含义及其如何影响工具的行为
- 任何重要的注意事项或限制,例如如果工具名称不清楚,工具不返回哪些信息。您能为Claude提供的关于工具的上下文越多,它就越能更好地决定何时以及如何使用它们。每个工具描述至少应包含3-4个句子,如果工具复杂,则应包含更多。
- 优先考虑描述而非示例。 虽然您可以在工具描述或附带的提示中包含如何使用工具的示例,但这不如对工具目的和参数有清晰全面的解释重要。只有在充分阐述描述之后才添加示例。
良好的描述清楚地解释了工具的功能、何时使用、返回什么数据以及ticker
参数的含义。糟糕的描述过于简短,让Claude对工具的行为和用法产生了许多疑问。
控制Claude的输出
强制使用工具
在某些情况下,您可能希望Claude使用特定的工具来回答用户的问题,即使Claude认为它可以在不使用工具的情况下提供答案。您可以通过在tool_choice
字段中指定工具来实现这一点,如下所示:
tool_choice = {"type": "tool", "name": "get_weather"}
在使用tool_choice参数时,我们有三种可能的选项:
auto
允许Claude决定是否调用任何提供的工具。这是默认值。any
告诉Claude它必须使用提供的工具之一,但不强制使用特定工具。tool
允许我们强制Claude始终使用特定工具。
此图说明了每个选项的工作原理:
请注意,当您将tool_choice
设置为any
或tool
时,我们会预填助手消息以强制使用工具。这意味着即使明确要求,模型也不会在tool_use
内容块之前发出链式思考的text
内容块。
我们的测试表明,这不应该降低性能。如果您希望保持链式思考(特别是对于Opus),同时仍然请求模型使用特定工具,您可以将tool_choice
设置为{"type": "auto"}
(默认值),并在user
消息中添加明确的指示。例如:伦敦的天气如何?在您的回答中使用get_weather工具。
JSON输出
工具不一定需要是客户端函数 - 只要您希望模型返回遵循提供的模式的JSON输出,就可以使用工具。例如,您可以使用具有特定模式的record_summary
工具。有关完整的工作示例,请参见工具使用示例。
链式思考
在使用工具时,Claude通常会展示其”链式思考”,即它用来分解问题并决定使用哪些工具的逐步推理。如果tool_choice
设置为auto
(这是默认值,请参见强制使用工具),Claude 3 Opus模型会这样做,而Sonnet和Haiku可以被提示这样做。
例如,给定提示”旧金山现在的天气如何,那里现在几点钟?“,Claude可能会回应:
{
"role": "assistant",
"content": [
{
"type": "text",
"text": "<thinking>要回答这个问题,我将:1. 使用get_weather工具获取旧金山的当前天气。2. 使用get_time工具获取America/Los_Angeles时区(覆盖旧金山,加利福尼亚州)的当前时间。</thinking>"
},
{
"type": "tool_use",
"id": "toolu_01A09q90qw90lq917835lq9",
"name": "get_weather",
"input": {"location": "San Francisco, CA"}
}
]
}
这种链式思考让我们洞察Claude的推理过程,可以帮助调试意外行为。
对于Claude 3 Sonnet模型,链式思考默认不太常见,但您可以通过在用户消息或系统提示中添加类似”在回答之前,请用标签解释您的逐步推理。“来提示Claude展示其推理。
重要的是要注意,虽然<thinking>
标签是Claude用来表示其链式思考的常见约定,但确切的格式(例如这个XML标签的名称)可能会随时间而改变。您的代码应该将链式思考视为任何其他助手生成的文本,而不应依赖于<thinking>
标签的存在或特定格式。
处理工具使用和工具结果内容块
当Claude决定使用您提供的工具之一时,它将返回一个stop_reason
为tool_use
的响应,以及API响应中的一个或多个tool_use
内容块,包括:
id
:此特定工具使用块的唯一标识符。这将用于稍后匹配工具结果。name
:正在使用的工具的名称。input
:包含传递给工具的输入的对象,符合工具的input_schema
。
当您收到工具使用响应时,您应该:
- 从
tool_use
块中提取name
、id
和input
。 - 在您的代码库中运行与该工具名称对应的实际工具,传入工具
input
。 - [可选] 通过发送一个新的
role
为user
的消息继续对话,该消息的content
块包含tool_result
类型和以下信息:tool_use_id
:这是结果对应的工具使用请求的id
。content
:工具的结果,可以是字符串(例如"content": "15度"
)或嵌套内容块的列表(例如"content": [{"type": "text", "text": "15度"}]
)。这些内容块可以使用text
或image
类型。is_error
(可选):如果工具执行导致错误,则设置为true
。
收到工具结果后,Claude将使用该信息继续生成对原始用户提示的响应。
与其他API的区别
与将工具使用分开或使用特殊角色如tool
或function
的API不同,Anthropic的API将工具直接集成到user
和assistant
消息结构中。
消息包含text
、image
、tool_use
和tool_result
块的数组。user
消息包括客户端内容和tool_result
,而assistant
消息包含AI生成的内容和tool_use
。
故障排除错误
在使用Claude的工具时,可能会出现几种不同类型的错误:
工具使用示例
以下是一些演示各种工具使用模式和技术的代码示例。为简洁起见,这些工具是简单的工具,工具描述比理想情况下确保最佳性能所需的要短。
定价
工具使用请求的定价与任何其他Claude API请求相同,基于发送给模型的总输入令牌数(包括tools
参数中的)和生成的输出令牌数。
工具使用带来的额外令牌来自:
- API请求中的
tools
参数(工具名称、描述和模式) - API请求和响应中的
tool_use
内容块 - API请求中的
tool_result
内容块
当您使用tools
时,我们还会自动为模型包含一个特殊的系统提示,以启用工具使用。每个模型所需的工具使用令牌数量如下所列(不包括上面列出的额外令牌):
模型 | 工具选择 | 工具使用系统提示令牌数 |
---|---|---|
Claude 3.5 Sonnet | auto any , tool | 294 tokens 261 tokens |
Claude 3 Opus | auto any , tool | 530 tokens 281 tokens |
Claude 3 Sonnet | auto any , tool | 159 tokens 235 tokens |
Claude 3 Haiku | auto any , tool | 264 tokens 340 tokens |
这些令牌数会被添加到您的正常输入和输出令牌中,以计算请求的总成本。请参考我们的模型概览表以获取当前每个模型的价格。
当您发送工具使用提示时,就像任何其他API请求一样,响应将输出输入和输出令牌数作为报告的usage
指标的一部分。
下一步
探索我们的cookbooks中现成可实施的工具使用代码示例库: