Uso degli strumenti a efficienza di token (beta)
Claude Sonnet 3.7 è in grado di chiamare strumenti in modo efficiente in termini di token. Le richieste risparmiano in media il 14% dei token in output, fino al 70%, riducendo anche la latenza. La riduzione esatta dei token e i miglioramenti della latenza dipendono dalla forma e dalle dimensioni complessive della risposta.
L’uso degli strumenti a efficienza di token è una funzionalità beta. Assicurati di valutare le tue risposte prima di utilizzarla in produzione.
Utilizza questo modulo per fornire feedback sulla qualità delle risposte del modello, sull’API stessa o sulla qualità della documentazione—non vediamo l’ora di ricevere il tuo feedback!
Se scegli di sperimentare questa funzionalità, ti consigliamo di utilizzare il Prompt Improver nella Console per migliorare il tuo prompt.
L’uso degli strumenti a efficienza di token attualmente non funziona con disable_parallel_tool_use
.
I modelli Claude 4 (Opus e Sonnet) non supportano questa funzionalità. L’intestazione beta token-efficient-tools-2025-02-19
non interromperà una richiesta API, ma risulterà in un’operazione nulla.
Per utilizzare questa funzionalità beta, aggiungi semplicemente l’intestazione beta token-efficient-tools-2025-02-19
a una richiesta di utilizzo degli strumenti. Se stai utilizzando l’SDK, assicurati di utilizzare l’SDK beta con anthropic.beta.messages
.
Ecco un esempio di come utilizzare gli strumenti a efficienza di token con l’API:
La richiesta sopra dovrebbe, in media, utilizzare meno token di input e output rispetto a una richiesta normale. Per confermarlo, prova a effettuare la stessa richiesta ma rimuovi token-efficient-tools-2025-02-19
dall’elenco delle intestazioni beta.
Per mantenere i vantaggi della memorizzazione nella cache dei prompt, utilizza l’intestazione beta in modo coerente per le richieste che desideri memorizzare nella cache. Se la utilizzi in modo selettivo, la memorizzazione nella cache dei prompt non funzionerà.