Accesso alla funzione di valutazione

Per iniziare con lo strumento di valutazione:

  1. Apri la Console Anthropic e vai all’editor dei prompt.
  2. Dopo aver composto il tuo prompt, cerca la scheda ‘Evaluate’ nella parte superiore dello schermo.

Accesso alla funzione di valutazione

Assicurati che il tuo prompt includa almeno 1-2 variabili dinamiche utilizzando la sintassi a doppie parentesi graffe: {{variabile}}. Questo è necessario per creare set di test di valutazione.

Generazione di prompt

La Console offre un generatore di prompt integrato alimentato da Claude 3.5 Sonnet:

1

Fai clic su 'Generate Prompt'

Facendo clic sullo strumento di supporto ‘Generate Prompt’ si aprirà una finestra che consente di inserire le informazioni sul tuo task.

2

Descrivi il tuo task

Descrivi il task desiderato (ad es. “Smistare le richieste di supporto clienti in entrata”) con quanti dettagli desideri. Più contesto includi, più Claude può adattare il prompt generato alle tue esigenze specifiche.

3

Genera il tuo prompt

Facendo clic sul pulsante arancione ‘Generate Prompt’ in basso, Claude genererà un prompt di alta qualità per te. Puoi quindi migliorare ulteriormente quei prompt utilizzando la schermata di valutazione nella Console.

Questa funzione semplifica la creazione di prompt con la sintassi delle variabili appropriata per la valutazione.

Generatore di prompt

Creazione di casi di test

Quando accedi alla schermata di valutazione, hai diverse opzioni per creare casi di test:

  1. Fai clic sul pulsante ’+ Add Row’ in basso a sinistra per aggiungere manualmente un caso.
  2. Utilizza la funzione ‘Generate Test Case’ per far generare automaticamente a Claude i casi di test per te.
  3. Importa casi di test da un file CSV.

Per utilizzare la funzione ‘Generate Test Case’:

1

Fai clic su 'Generate Test Case'

Claude genererà casi di test per te, una riga alla volta per ogni volta che fai clic sul pulsante.

2

Modifica la logica di generazione (opzionale)

Puoi anche modificare la logica di generazione dei casi di test facendo clic sulla freccia a discesa a destra del pulsante ‘Generate Test Case’, quindi su ‘Show generation logic’ nella parte superiore della finestra Variabili che si apre. Potrebbe essere necessario fare clic su ‘Generate’ in alto a destra di questa finestra per popolare la logica di generazione iniziale.

La modifica di questa logica ti consente di personalizzare e perfezionare con maggiore precisione e specificità i casi di test generati da Claude.

Ecco un esempio di schermata di valutazione popolata con diversi casi di test:

Schermata di valutazione popolata

Se aggiorni il testo del prompt originale, puoi rieseguire l’intera suite di valutazione sul nuovo prompt per vedere come le modifiche influiscono sulle prestazioni in tutti i casi di test.

Suggerimenti per una valutazione efficace

Utilizza lo strumento di supporto ‘Generate a prompt’ nella Console per creare rapidamente prompt con la sintassi delle variabili appropriata per la valutazione.

Comprensione e confronto dei risultati

Lo strumento di valutazione offre diverse funzionalità per aiutarti a perfezionare i tuoi prompt:

  1. Confronto affiancato: confronta gli output di due o più prompt per vedere rapidamente l’impatto delle tue modifiche.
  2. Valutazione della qualità: valuta la qualità della risposta su una scala a 5 punti per monitorare i miglioramenti nella qualità della risposta per prompt.
  3. Versioning dei prompt: crea nuove versioni del tuo prompt e riesegui la suite di test per iterare e migliorare rapidamente i risultati.

Esaminando i risultati in tutti i casi di test e confrontando diverse versioni del prompt, puoi individuare schemi e apportare modifiche informate al tuo prompt in modo più efficiente.

Inizia a valutare i tuoi prompt oggi stesso per creare applicazioni AI più robuste con Claude!