Utilizzo dello Strumento di Valutazione
La Console Anthropic include uno Strumento di valutazione che ti permette di testare i tuoi prompt in vari scenari.
Accesso alla Funzionalità di Valutazione
Per iniziare con lo Strumento di Valutazione:
- Apri la Console Anthropic e naviga all’editor di prompt.
- Dopo aver composto il tuo prompt, cerca la scheda ‘Valuta’ nella parte superiore dello schermo.
Assicurati che il tuo prompt includa almeno 1-2 variabili dinamiche utilizzando la sintassi a doppia parentesi graffa: {{variabile}}. Questo è necessario per creare set di test di valutazione.
Generazione di Prompt
La Console offre un generatore di prompt integrato alimentato da Claude Opus 4:
Clicca su 'Genera Prompt'
Cliccando sullo strumento di supporto ‘Genera Prompt’ si aprirà una finestra modale che ti permette di inserire le informazioni sul tuo compito.
Descrivi il tuo compito
Descrivi il compito desiderato (ad esempio, “Smistare le richieste di assistenza clienti in arrivo”) con tutti i dettagli che desideri. Più contesto includi, più Claude potrà adattare il prompt generato alle tue esigenze specifiche.
Genera il tuo prompt
Cliccando sul pulsante arancione ‘Genera Prompt’ in basso, Claude genererà un prompt di alta qualità per te. Potrai poi migliorare ulteriormente questi prompt utilizzando la schermata di Valutazione nella Console.
Questa funzionalità rende più facile creare prompt con la sintassi di variabile appropriata per la valutazione.
Creazione di Casi di Test
Quando accedi alla schermata di Valutazione, hai diverse opzioni per creare casi di test:
- Clicca sul pulsante ’+ Aggiungi Riga’ in basso a sinistra per aggiungere manualmente un caso.
- Utilizza la funzione ‘Genera Caso di Test’ per far generare automaticamente casi di test da Claude.
- Importa casi di test da un file CSV.
Per utilizzare la funzione ‘Genera Caso di Test’:
Clicca su 'Genera Caso di Test'
Claude genererà casi di test per te, una riga alla volta per ogni volta che clicchi sul pulsante.
Modifica la logica di generazione (opzionale)
Puoi anche modificare la logica di generazione dei casi di test cliccando sulla freccia a discesa a destra del pulsante ‘Genera Caso di Test’, quindi su ‘Mostra logica di generazione’ nella parte superiore della finestra Variabili che appare. Potrebbe essere necessario cliccare su `Genera’ in alto a destra di questa finestra per popolare la logica di generazione iniziale.
La modifica di questo ti permette di personalizzare e perfezionare i casi di test che Claude genera con maggiore precisione e specificità.
Ecco un esempio di una schermata di Valutazione popolata con diversi casi di test:
Se aggiorni il testo del prompt originale, puoi rieseguire l’intera suite di valutazione con il nuovo prompt per vedere come le modifiche influenzano le prestazioni in tutti i casi di test.
Suggerimenti per una Valutazione Efficace
Utilizza lo strumento di supporto ‘Genera un prompt’ nella Console per creare rapidamente prompt con la sintassi di variabile appropriata per la valutazione.
Comprendere e confrontare i risultati
Lo Strumento di Valutazione offre diverse funzionalità per aiutarti a perfezionare i tuoi prompt:
- Confronto affiancato: Confronta gli output di due o più prompt per vedere rapidamente l’impatto delle tue modifiche.
- Valutazione della qualità: Valuta la qualità della risposta su una scala a 5 punti per monitorare i miglioramenti nella qualità della risposta per prompt.
- Versionamento dei prompt: Crea nuove versioni del tuo prompt e riesegui la suite di test per iterare rapidamente e migliorare i risultati.
Esaminando i risultati tra i casi di test e confrontando diverse versioni di prompt, puoi individuare modelli e apportare modifiche informate al tuo prompt in modo più efficiente.
Inizia oggi a valutare i tuoi prompt per costruire applicazioni di IA più robuste con Claude!
Was this page helpful?