Claude 3 和 4 系列模型具备新的视觉功能,允许 Claude 理解和分析图像,为多模态交互开启了令人兴奋的可能性。
纵横比 | 图像尺寸 |
---|---|
1:1 | 1092x1092 px |
3:4 | 951x1268 px |
2:3 | 896x1344 px |
9:16 | 819x1456 px |
1:2 | 784x1568 px |
令牌 = (宽度像素 * 高度像素)/750
以下是基于 Claude Sonnet 3.7 每令牌价格每百万输入令牌 $3 的 API 大小约束内不同图像尺寸的大概令牌化和成本示例:
图像尺寸 | 令牌数 | 每张图像成本 | 每 1K 张图像成本 |
---|---|---|---|
200x200 px(0.04 兆像素) | ~54 | ~$0.00016 | ~$0.16 |
1000x1000 px(1 兆像素) | ~1334 | ~$0.004 | ~$4.00 |
1092x1092 px(1.19 兆像素) | ~1590 | ~$0.0048 | ~$4.80 |
image
内容块中的 base64 编码图像示例:一张图像
角色 | 内容 |
---|---|
用户 | [图像] 描述这张图像。 |
示例:多张图像
图像 1:
和 图像 2:
等介绍每张图像。您不需要在图像之间或图像与提示之间换行。要求 Claude 描述多张图像之间的差异。角色 | 内容 |
---|---|
用户 | 图像 1: [图像 1] 图像 2: [图像 2] 这些图像有什么不同? |
示例:带有系统提示的多张图像
内容 | |
---|---|
系统 | 只用西班牙语回应。 |
用户 | 图像 1: [图像 1] 图像 2: [图像 2] 这些图像有什么不同? |
示例:两个对话轮次中的四张图像
角色 | 内容 |
---|---|
用户 | 图像 1: [图像 1] 图像 2: [图像 2] 这些图像有什么不同? |
助手 | [Claude 的响应] |
用户 | 图像 1: [图像 3] 图像 2: [图像 4] 这些图像与前两张相似吗? |
助手 | [Claude 的响应] |
user
角色的 Messages 数组中。Claude 支持哪些图像文件类型?
image/jpeg
image/png
image/gif
image/webp
Claude 能读取图像 URL 吗?
我可以上传的图像文件大小有限制吗?
我可以在一个请求中包含多少张图像?
Claude 会读取图像元数据吗?
我可以删除已上传的图像吗?
在哪里可以找到图像上传数据隐私的详细信息?
如果 Claude 的图像解释似乎有误怎么办?
Claude 能生成或编辑图像吗?