Accesso alla Funzionalità di Valutazione

Per iniziare con lo Strumento di Valutazione:

  1. Apri la Anthropic Console e naviga nell’editor dei prompt.
  2. Dopo aver composto il tuo prompt, cerca la scheda ‘Valuta’ nella parte superiore dello schermo.

Assicurati che il tuo prompt includa almeno 1-2 variabili dinamiche utilizzando la sintassi con doppie parentesi graffe: {{variable}}. Questo è necessario per creare set di test di valutazione.

Generazione dei Prompt

La Console offre un generatore di prompt integrato alimentato da Claude 3.5 Sonnet:

1

Clicca su 'Genera Prompt'

Cliccando sullo strumento di supporto ‘Genera Prompt’ si aprirà una finestra modale che ti permetterà di inserire le informazioni sul tuo compito.

2

Descrivi il tuo compito

Descrivi il compito desiderato (es. “Smista le richieste di assistenza clienti in arrivo”) con tutti i dettagli che desideri. Più contesto includi, più Claude potrà adattare il prompt generato alle tue esigenze specifiche.

3

Genera il tuo prompt

Cliccando sul pulsante arancione ‘Genera Prompt’ in basso, Claude genererà un prompt di alta qualità per te. Potrai poi migliorare ulteriormente questi prompt utilizzando la schermata di Valutazione nella Console.

Questa funzionalità rende più facile creare prompt con la sintassi appropriata delle variabili per la valutazione.

Creazione di Casi di Test

Quando accedi alla schermata di Valutazione, hai diverse opzioni per creare casi di test:

  1. Clicca sul pulsante ’+ Aggiungi Riga’ in basso a sinistra per aggiungere manualmente un caso.
  2. Usa la funzione ‘Genera Caso di Test’ per far generare automaticamente i casi di test da Claude.
  3. Importa casi di test da un file CSV.

Per utilizzare la funzione ‘Genera Caso di Test’:

1

Clicca su 'Genera Caso di Test'

Claude genererà casi di test per te, una riga alla volta per ogni click sul pulsante.

2

Modifica la logica di generazione (opzionale)

Puoi anche modificare la logica di generazione dei casi di test cliccando sulla freccia a discesa a destra del pulsante ‘Genera Caso di Test’, poi su ‘Mostra logica di generazione’ nella parte superiore della finestra Variabili che appare. Potrebbe essere necessario cliccare su ‘Genera’ in alto a destra di questa finestra per popolare la logica di generazione iniziale.

La modifica di questo ti permette di personalizzare e perfezionare i casi di test che Claude genera con maggiore precisione e specificità.

Ecco un esempio di una schermata di Valutazione popolata con diversi casi di test:

Se aggiorni il testo del prompt originale, puoi rieseguire l’intera suite di valutazione con il nuovo prompt per vedere come le modifiche influenzano le prestazioni in tutti i casi di test.

Suggerimenti per una Valutazione Efficace

Usa lo strumento di supporto ‘Genera un prompt’ nella Console per creare rapidamente prompt con la sintassi appropriata delle variabili per la valutazione.

Comprensione e confronto dei risultati

Lo Strumento di Valutazione offre diverse funzionalità per aiutarti a perfezionare i tuoi prompt:

  1. Confronto affiancato: Confronta gli output di due o più prompt per vedere rapidamente l’impatto delle tue modifiche.
  2. Valutazione della qualità: Valuta la qualità delle risposte su una scala di 5 punti per monitorare i miglioramenti nella qualità delle risposte per prompt.
  3. Versionamento dei prompt: Crea nuove versioni del tuo prompt e riesegui la suite di test per iterare e migliorare rapidamente i risultati.

Esaminando i risultati tra i casi di test e confrontando diverse versioni dei prompt, puoi individuare modelli e apportare modifiche informate al tuo prompt in modo più efficiente.

Inizia oggi a valutare i tuoi prompt per costruire applicazioni AI più robuste con Claude!