Las familias de modelos Claude 3 y 4 vienen con nuevas capacidades de visión que permiten a Claude entender y analizar imágenes, abriendo posibilidades emocionantes para la interacción multimodal.
Relación de aspecto | Tamaño de imagen |
---|---|
1:1 | 1092x1092 px |
3:4 | 951x1268 px |
2:3 | 896x1344 px |
9:16 | 819x1456 px |
1:2 | 784x1568 px |
tokens = (ancho px * alto px)/750
Aquí hay ejemplos de tokenización aproximada y costos para diferentes tamaños de imagen dentro de las restricciones de tamaño de nuestra API basados en el precio por token de Claude Sonnet 3.7 de $3 por millón de tokens de entrada:
Tamaño de imagen | # de Tokens | Costo / imagen | Costo / 1K imágenes |
---|---|---|---|
200x200 px(0.04 megapíxeles) | ~54 | ~$0.00016 | ~$0.16 |
1000x1000 px(1 megapíxel) | ~1334 | ~$0.004 | ~$4.00 |
1092x1092 px(1.19 megapíxeles) | ~1590 | ~$0.0048 | ~$4.80 |
image
Ejemplo: Una imagen
Rol | Contenido |
---|---|
Usuario | [Imagen] Describe esta imagen. |
Ejemplo: Múltiples imágenes
Imagen 1:
e Imagen 2:
y así sucesivamente. No necesitas saltos de línea entre imágenes o entre imágenes y el prompt.Pide a Claude que describa las diferencias entre múltiples imágenes.Rol | Contenido |
---|---|
Usuario | Imagen 1: [Imagen 1] Imagen 2: [Imagen 2] ¿En qué se diferencian estas imágenes? |
Ejemplo: Múltiples imágenes con un prompt del sistema
Contenido | |
---|---|
Sistema | Responde solo en español. |
Usuario | Imagen 1: [Imagen 1] Imagen 2: [Imagen 2] ¿En qué se diferencian estas imágenes? |
Ejemplo: Cuatro imágenes a través de dos turnos de conversación
Rol | Contenido |
---|---|
Usuario | Imagen 1: [Imagen 1] Imagen 2: [Imagen 2] ¿En qué se diferencian estas imágenes? |
Asistente | [Respuesta de Claude] |
Usuario | Imagen 1: [Imagen 3] Imagen 2: [Imagen 4] ¿Son estas imágenes similares a las dos primeras? |
Asistente | [Respuesta de Claude] |
user
como parte de cualquier estructura estándar de conversación multiturnos.¿Qué tipos de archivos de imagen soporta Claude?
image/jpeg
image/png
image/gif
image/webp
¿Puede Claude leer URLs de imágenes?
¿Hay un límite al tamaño de archivo de imagen que puedo subir?
¿Cuántas imágenes puedo incluir en una solicitud?
¿Claude lee metadatos de imagen?
¿Puedo eliminar imágenes que he subido?
¿Dónde puedo encontrar detalles sobre privacidad de datos para subidas de imágenes?
¿Qué pasa si la interpretación de imagen de Claude parece incorrecta?
¿Puede Claude generar o editar imágenes?