Visione

Questa guida descrive come lavorare con le immagini in Claude, incluse le migliori pratiche, esempi di codice e limitazioni da tenere a mente.

Come utilizzare la visione

Utilizza le capacità di visione di Claude tramite:

claude.ai. Carica un’immagine come faresti con un file, o trascina e rilascia un’immagine direttamente nella finestra di chat.
Il Console Workbench. Se selezioni un modello che accetta immagini (solo modelli Claude 3 e 4), appare un pulsante per aggiungere immagini in alto a destra di ogni blocco messaggio Utente.
Richiesta API. Vedi gli esempi in questa guida.

Prima di caricare

Nozioni di base e limiti

Puoi includere più immagini in una singola richiesta (fino a 20 per claude.ai e 100 per le richieste API). Claude analizzerà tutte le immagini fornite quando formula la sua risposta. Questo può essere utile per confrontare o contrastare immagini.

Se invii un’immagine più grande di 8000x8000 px, verrà rifiutata. Se invii più di 20 immagini in una richiesta API, questo limite è 2000x2000 px.

Mentre l’API supporta 100 immagini per richiesta, c’è un limite di dimensione della richiesta di 32MB per gli endpoint standard.

Valutare la dimensione dell’immagine

Per prestazioni ottimali, raccomandiamo di ridimensionare le immagini prima del caricamento se sono troppo grandi. Se il lato lungo della tua immagine è più di 1568 pixel, o la tua immagine è più di ~1,600 token, verrà prima ridimensionata, preservando il rapporto d’aspetto, finché non rientra nei limiti di dimensione.

Se la tua immagine di input è troppo grande e deve essere ridimensionata, aumenterà la latenza del time-to-first-token, senza darti alcuna prestazione aggiuntiva del modello. Immagini molto piccole sotto i 200 pixel su qualsiasi lato possono degradare le prestazioni.

Per migliorare il time-to-first-token, raccomandiamo di ridimensionare le immagini a non più di 1,15 megapixel (e entro 1568 pixel in entrambe le dimensioni).

Ecco una tabella delle dimensioni massime delle immagini accettate dalla nostra API che non verranno ridimensionate per rapporti d’aspetto comuni. Con il modello Claude Sonnet 3.7, queste immagini utilizzano circa 1,600 token e circa $4,80/1K immagini.

Rapporto d’aspetto	Dimensione immagine
1:1	1092x1092 px
3:4	951x1268 px
2:3	896x1344 px
9:16	819x1456 px
1:2	784x1568 px

Calcolare i costi delle immagini

Ogni immagine che includi in una richiesta a Claude conta verso il tuo utilizzo di token. Per calcolare il costo approssimativo, moltiplica il numero approssimativo di token dell’immagine per il prezzo per token del modello che stai utilizzando.

Se la tua immagine non ha bisogno di essere ridimensionata, puoi stimare il numero di token utilizzati attraverso questo algoritmo: token = (larghezza px * altezza px)/750

Ecco esempi di tokenizzazione approssimativa e costi per diverse dimensioni di immagini entro i vincoli di dimensione della nostra API basati sul prezzo per token di Claude Sonnet 3.7 di $3 per milione di token di input:

Dimensione immagine	# di Token	Costo / immagine	Costo / 1K immagini
200x200 px(0,04 megapixel)	~54	~$0,00016	~$0,16
1000x1000 px(1 megapixel)	~1334	~$0,004	~$4,00
1092x1092 px(1,19 megapixel)	~1590	~$0,0048	~$4,80

Garantire la qualità dell’immagine

Quando fornisci immagini a Claude, tieni presente quanto segue per i migliori risultati:

Formato immagine: Usa un formato immagine supportato: JPEG, PNG, GIF o WebP.
Chiarezza dell’immagine: Assicurati che le immagini siano chiare e non troppo sfocate o pixelate.
Testo: Se l’immagine contiene testo importante, assicurati che sia leggibile e non troppo piccolo. Evita di ritagliare il contesto visuale chiave solo per ingrandire il testo.

Esempi di prompt

Molte delle tecniche di prompting che funzionano bene per le interazioni basate su testo con Claude possono essere applicate anche ai prompt basati su immagini.

Questi esempi dimostrano le strutture di prompt delle migliori pratiche che coinvolgono immagini.

Proprio come con il posizionamento documento-query, Claude funziona meglio quando le immagini vengono prima del testo. Le immagini posizionate dopo il testo o interpolate con il testo funzioneranno comunque bene, ma se il tuo caso d’uso lo permette, raccomandiamo una struttura immagine-poi-testo.

Informazioni sugli esempi di prompt

I seguenti esempi dimostrano come utilizzare le capacità di visione di Claude usando vari linguaggi di programmazione e approcci. Puoi fornire immagini a Claude in tre modi:

Come immagine codificata in base64 nei blocchi di contenuto image
Come riferimento URL a un’immagine ospitata online
Utilizzando l’API Files (carica una volta, usa più volte)

Gli esempi di prompt base64 utilizzano queste variabili:

    # Per immagini basate su URL, puoi usare l'URL direttamente nella tua richiesta JSON
    
    # Per immagini codificate in base64, devi prima codificare l'immagine
    # Esempio di come codificare un'immagine in base64 in bash:
    BASE64_IMAGE_DATA=$(curl -s "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg" | base64)
    
    # I dati codificati possono ora essere utilizzati nelle tue chiamate API

Di seguito sono riportati esempi di come includere immagini in una richiesta Messages API utilizzando immagini codificate in base64 e riferimenti URL:

Esempio di immagine codificata in base64

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image",
            "source": {
              "type": "base64",
              "media_type": "image/jpeg",
              "data": "'"$BASE64_IMAGE_DATA"'"
            }
          },
          {
            "type": "text",
            "text": "Descrivi questa immagine."
          }
        ]
      }
    ]
  }'

Esempio di immagine basata su URL

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image",
            "source": {
              "type": "url",
              "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
            }
          },
          {
            "type": "text",
            "text": "Descrivi questa immagine."
          }
        ]
      }
    ]
  }'

Esempio di immagine API Files

Per immagini che userai ripetutamente o quando vuoi evitare il sovraccarico di codifica, usa l’API Files:

# Prima, carica la tua immagine nell'API Files
curl -X POST https://api.anthropic.com/v1/files \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -F "file=@image.jpg"

# Poi usa il file_id restituito nel tuo messaggio
curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "anthropic-beta: files-api-2025-04-14" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-20250514",
    "max_tokens": 1024,
    "messages": [
      {
        "role": "user",
        "content": [
          {
            "type": "image",
            "source": {
              "type": "file",
              "file_id": "file_abc123"
            }
          },
          {
            "type": "text",
            "text": "Descrivi questa immagine."
          }
        ]
      }
    ]
  }'

Vedi esempi API Messages per più codice di esempio e dettagli sui parametri.

Esempio: Una immagine

È meglio posizionare le immagini prima nel prompt rispetto alle domande su di esse o alle istruzioni per i compiti che le utilizzano.

Chiedi a Claude di descrivere una immagine.

Ruolo	Contenuto
Utente	[Immagine] Descrivi questa immagine.

Ecco la chiamata API corrispondente utilizzando il modello Claude Sonnet 3.7.

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Descrivi questa immagine."
                }
            ],
        }
    ],
)

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Descrivi questa immagine."
                }
            ],
        }
    ],
)

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "image",
                    "source": {
                        "type": "url",
                        "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg",
                    },
                },
                {
                    "type": "text",
                    "text": "Descrivi questa immagine."
                }
            ],
        }
    ],
)

Esempio: Immagini multiple

In situazioni dove ci sono immagini multiple, introduci ogni immagine con Immagine 1: e Immagine 2: e così via. Non hai bisogno di nuove righe tra le immagini o tra le immagini e il prompt.

Chiedi a Claude di descrivere le differenze tra immagini multiple.

Ruolo	Contenuto
Utente	Immagine 1: [Immagine 1] Immagine 2: [Immagine 2] Come sono diverse queste immagini?

Ecco la chiamata API corrispondente utilizzando il modello Claude Sonnet 3.7.

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Immagine 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Immagine 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image2_media_type,
                        "data": image2_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Come sono diverse queste immagini?"
                }
            ],
        }
    ],
)

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Immagine 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Immagine 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image2_media_type,
                        "data": image2_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Come sono diverse queste immagini?"
                }
            ],
        }
    ],
)

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Immagine 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "url",
                        "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg",
                    },
                },
                {
                    "type": "text",
                    "text": "Immagine 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "url",
                        "url": "https://upload.wikimedia.org/wikipedia/commons/b/b5/Iridescent.green.sweat.bee1.jpg",
                    },
                },
                {
                    "type": "text",
                    "text": "Come sono diverse queste immagini?"
                }
            ],
        }
    ],
)

Esempio: Immagini multiple con un prompt di sistema

Chiedi a Claude di descrivere le differenze tra immagini multiple, dandogli un prompt di sistema su come rispondere.

Contenuto
Sistema	Rispondi solo in spagnolo.
Utente	Immagine 1: [Immagine 1] Immagine 2: [Immagine 2] Come sono diverse queste immagini?

Ecco la chiamata API corrispondente utilizzando il modello Claude Sonnet 3.7.

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    system="Rispondi solo in spagnolo.",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Immagine 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Immagine 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image2_media_type,
                        "data": image2_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Come sono diverse queste immagini?"
                }
            ],
        }
    ],
)

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    system="Rispondi solo in spagnolo.",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Immagine 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image1_media_type,
                        "data": image1_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Immagine 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "base64",
                        "media_type": image2_media_type,
                        "data": image2_data,
                    },
                },
                {
                    "type": "text",
                    "text": "Come sono diverse queste immagini?"
                }
            ],
        }
    ],
)

Python
message = client.messages.create(
    model="claude-sonnet-4-20250514",
    max_tokens=1024,
    system="Rispondi solo in spagnolo.",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Immagine 1:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "url",
                        "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg",
                    },
                },
                {
                    "type": "text",
                    "text": "Immagine 2:"
                },
                {
                    "type": "image",
                    "source": {
                        "type": "url",
                        "url": "https://upload.wikimedia.org/wikipedia/commons/b/b5/Iridescent.green.sweat.bee1.jpg",
                    },
                },
                {
                    "type": "text",
                    "text": "Come sono diverse queste immagini?"
                }
            ],
        }
    ],
)

Esempio: Quattro immagini attraverso due turni di conversazione

Le capacità di visione di Claude brillano nelle conversazioni multimodali che mescolano immagini e testo. Puoi avere scambi estesi avanti e indietro con Claude, aggiungendo nuove immagini o domande di follow-up in qualsiasi momento. Questo abilita flussi di lavoro potenti per l’analisi iterativa delle immagini, il confronto, o la combinazione di elementi visivi con altre conoscenze.

Chiedi a Claude di contrastare due immagini, poi fai una domanda di follow-up confrontando le prime immagini con due nuove immagini.

Ruolo	Contenuto
Utente	Immagine 1: [Immagine 1] Immagine 2: [Immagine 2] Come sono diverse queste immagini?
Assistente	[Risposta di Claude]
Utente	Immagine 1: [Immagine 3] Immagine 2: [Immagine 4] Queste immagini sono simili alle prime due?
Assistente	[Risposta di Claude]

Quando usi l’API, inserisci semplicemente nuove immagini nell’array di Messages nel ruolo user come parte di qualsiasi struttura di conversazione multi-turno standard.

Limitazioni

Mentre le capacità di comprensione delle immagini di Claude sono all’avanguardia, ci sono alcune limitazioni di cui essere consapevoli:

Identificazione di persone: Claude non può essere utilizzato per identificare (cioè, nominare) persone nelle immagini e si rifiuterà di farlo.
Accuratezza: Claude può allucinare o commettere errori quando interpreta immagini di bassa qualità, ruotate, o molto piccole sotto i 200 pixel.
Ragionamento spaziale: Le capacità di ragionamento spaziale di Claude sono limitate. Può avere difficoltà con compiti che richiedono localizzazione precisa o layout, come leggere il quadrante di un orologio analogico o descrivere posizioni esatte dei pezzi degli scacchi.
Conteggio: Claude può dare conteggi approssimativi di oggetti in un’immagine ma potrebbe non essere sempre precisamente accurato, specialmente con grandi numeri di oggetti piccoli.
Immagini generate da AI: Claude non sa se un’immagine è generata da AI e potrebbe essere scorretto se richiesto. Non fare affidamento su di esso per rilevare immagini false o sintetiche.
Contenuto inappropriato: Claude non processerà immagini inappropriate o esplicite che violano la nostra Politica di Uso Accettabile.
Applicazioni sanitarie: Mentre Claude può analizzare immagini mediche generali, non è progettato per interpretare scansioni diagnostiche complesse come TC o risonanze magnetiche. Gli output di Claude non dovrebbero essere considerati un sostituto per consigli medici professionali o diagnosi.

Rivedi sempre attentamente e verifica le interpretazioni delle immagini di Claude, specialmente per casi d’uso ad alto rischio. Non utilizzare Claude per compiti che richiedono precisione perfetta o analisi sensibili delle immagini senza supervisione umana.

FAQ

Quali tipi di file immagine supporta Claude?

Claude può leggere URL di immagini?

Sì, Claude può ora processare immagini da URL con i nostri blocchi sorgente immagine URL nell’API. Usa semplicemente il tipo sorgente “url” invece di “base64” nelle tue richieste API. Esempio:

{
  "type": "image",
  "source": {
    "type": "url",
    "url": "https://upload.wikimedia.org/wikipedia/commons/a/a7/Camponotus_flavomarginatus_ant.jpg"
  }
}

C'è un limite alla dimensione del file immagine che posso caricare?

Quante immagini posso includere in una richiesta?

Claude legge i metadati delle immagini?

Posso eliminare le immagini che ho caricato?

Dove posso trovare dettagli sulla privacy dei dati per i caricamenti di immagini?

Cosa succede se l'interpretazione dell'immagine di Claude sembra sbagliata?

Claude può generare o modificare immagini?

Approfondire la visione

Pronto per iniziare a costruire con le immagini usando Claude? Ecco alcune risorse utili:

Cookbook multimodale: Questo cookbook ha consigli su come iniziare con le immagini e tecniche delle migliori pratiche per garantire le prestazioni di qualità più alta con le immagini. Vedi come puoi effettivamente fare prompt a Claude con immagini per svolgere compiti come interpretare e analizzare grafici o estrarre contenuto da moduli.
Riferimento API: Visita la nostra documentazione per l’API Messages, inclusi esempi di chiamate API che coinvolgono immagini.

Se hai altre domande, sentiti libero di contattare il nostro team di supporto. Puoi anche unirti alla nostra comunità di sviluppatori per connetterti con altri creatori e ottenere aiuto dagli esperti di Anthropic.

Embeddings Supporto PDF

On this page

Come utilizzare la visione
Prima di caricare
Nozioni di base e limiti
Valutare la dimensione dell’immagine
Calcolare i costi delle immagini
Garantire la qualità dell’immagine
Esempi di prompt
Informazioni sugli esempi di prompt
Esempio di immagine codificata in base64
Esempio di immagine basata su URL
Esempio di immagine API Files
Limitazioni
FAQ
Approfondire la visione

Primi passi

Modelli e prezzi

Scopri Claude

Funzionalità

Strumenti

Model Context Protocol (MCP)

Casi d'uso

Ingegneria dei prompt

Testa e valuta

Rafforza le protezioni

Centro legale

Come utilizzare la visione

Prima di caricare

Nozioni di base e limiti

Valutare la dimensione dell’immagine

Calcolare i costi delle immagini

Garantire la qualità dell’immagine

Esempi di prompt

Informazioni sugli esempi di prompt

Esempio di immagine codificata in base64

Esempio di immagine basata su URL

Esempio di immagine API Files

Limitazioni

FAQ

Approfondire la visione

Primi passi

Modelli e prezzi

Scopri Claude

Funzionalità

Strumenti

Model Context Protocol (MCP)

Casi d'uso

Ingegneria dei prompt

Testa e valuta

Rafforza le protezioni

Centro legale

​Come utilizzare la visione

​Prima di caricare

​Nozioni di base e limiti

​Valutare la dimensione dell’immagine

​Calcolare i costi delle immagini

​Garantire la qualità dell’immagine

​Esempi di prompt

​Informazioni sugli esempi di prompt

​Esempio di immagine codificata in base64

​Esempio di immagine basata su URL

​Esempio di immagine API Files

​Limitazioni

​FAQ

​Approfondire la visione

Come utilizzare la visione

Prima di caricare

Nozioni di base e limiti

Valutare la dimensione dell’immagine

Calcolare i costi delle immagini

Garantire la qualità dell’immagine

Esempi di prompt

Informazioni sugli esempi di prompt

Esempio di immagine codificata in base64

Esempio di immagine basata su URL

Esempio di immagine API Files

Limitazioni

FAQ

Approfondire la visione