Claude 3および4ファミリーのモデルには、Claudeが画像を理解・分析できる新しいビジョン機能が搭載されており、マルチモーダルインタラクションの刺激的な可能性を開きます。
アスペクト比 | 画像サイズ |
---|---|
1:1 | 1092x1092 px |
3:4 | 951x1268 px |
2:3 | 896x1344 px |
9:16 | 819x1456 px |
1:2 | 784x1568 px |
tokens = (width px * height px)/750
以下は、Claude Sonnet 3.7のトークンあたり$3(100万入力トークンあたり)の価格に基づく、APIのサイズ制約内のさまざまな画像サイズのおおよそのトークン化とコストの例です:
画像サイズ | トークン数 | 画像あたりのコスト | 1K画像あたりのコスト |
---|---|---|---|
200x200 px(0.04メガピクセル) | 〜54 | 〜$0.00016 | 〜$0.16 |
1000x1000 px(1メガピクセル) | 〜1334 | 〜$0.004 | 〜$4.00 |
1092x1092 px(1.19メガピクセル) | 〜1590 | 〜$0.0048 | 〜$4.80 |
image
コンテンツブロック内のbase64エンコードされた画像として例:1つの画像
ロール | コンテンツ |
---|---|
ユーザー | [画像] この画像を説明してください。 |
例:複数の画像
画像1:
と画像2:
などで紹介します。画像間や画像とプロンプト間に改行は必要ありません。Claudeに複数の画像の違いを説明してもらいます。ロール | コンテンツ |
---|---|
ユーザー | 画像1: [画像1] 画像2: [画像2] これらの画像はどのように違いますか? |
例:システムプロンプト付きの複数画像
コンテンツ | |
---|---|
システム | スペイン語でのみ応答してください。 |
ユーザー | 画像1: [画像1] 画像2: [画像2] これらの画像はどのように違いますか? |
例:2つの会話ターンにわたる4つの画像
ロール | コンテンツ |
---|---|
ユーザー | 画像1: [画像1] 画像2: [画像2] これらの画像はどのように違いますか? |
アシスタント | [Claudeの応答] |
ユーザー | 画像1: [画像3] 画像2: [画像4] これらの画像は最初の2つと似ていますか? |
アシスタント | [Claudeの応答] |
user
ロールのMessagesの配列に新しい画像を挿入するだけです。Claudeはどの画像ファイル形式をサポートしていますか?
image/jpeg
image/png
image/gif
image/webp
ClaudeはURLから画像を読み取れますか?
アップロードできる画像ファイルサイズに制限はありますか?
1つのリクエストに何枚の画像を含めることができますか?
Claudeは画像のメタデータを読み取りますか?
アップロードした画像を削除できますか?
画像アップロードのデータプライバシーに関する詳細はどこで確認できますか?
Claudeの画像解釈が間違っているように見える場合はどうすればよいですか?
Claudeは画像を生成または編集できますか?