Использование инструмента оценки
В Anthropic Console есть инструмент оценки, который позволяет тестировать ваши промпты в различных сценариях.
Доступ к функции оценки
Чтобы начать работу с инструментом оценки:
- Откройте Anthropic Console и перейдите в редактор промптов.
- После составления промпта найдите вкладку ‘Evaluate’ в верхней части экрана.
Убедитесь, что ваш промпт включает как минимум 1-2 динамические переменные, используя синтаксис с двойными фигурными скобками: {{variable}}. Это необходимо для создания наборов тестов для оценки.
Генерация промптов
Console предлагает встроенный генератор промптов, работающий на Claude 3.5 Sonnet:
Нажмите 'Generate Prompt'
При нажатии на вспомогательный инструмент ‘Generate Prompt’ откроется модальное окно, позволяющее ввести информацию о вашей задаче.
Опишите вашу задачу
Опишите желаемую задачу (например, “Сортировка входящих запросов службы поддержки”) с той степенью детализации, которая вам нужна. Чем больше контекста вы включите, тем лучше Claude сможет адаптировать сгенерированный промпт под ваши конкретные потребности.
Сгенерируйте промпт
Нажатие оранжевой кнопки ‘Generate Prompt’ внизу позволит Claude сгенерировать для вас качественный промпт. Затем вы можете дополнительно улучшить эти промпты с помощью экрана оценки в Console.
Эта функция упрощает создание промптов с соответствующим синтаксисом переменных для оценки.
Создание тестовых случаев
Когда вы получаете доступ к экрану оценки, у вас есть несколько вариантов создания тестовых случаев:
- Нажмите кнопку ’+ Add Row’ в нижнем левом углу, чтобы вручную добавить случай.
- Используйте функцию ‘Generate Test Case’, чтобы Claude автоматически генерировал тестовые случаи для вас.
- Импортируйте тестовые случаи из CSV-файла.
Чтобы использовать функцию ‘Generate Test Case’:
Нажмите на 'Generate Test Case'
Claude будет генерировать тестовые случаи для вас, по одной строке за каждое нажатие кнопки.
Редактирование логики генерации (опционально)
Вы также можете редактировать логику генерации тестовых случаев, нажав на стрелку выпадающего списка справа от кнопки ‘Generate Test Case’, затем на ‘Show generation logic’ в верхней части всплывающего окна Variables. Возможно, вам придется нажать ‘Generate’ в правом верхнем углу этого окна, чтобы заполнить начальную логику генерации.
Редактирование этого позволяет настраивать и точно настраивать тестовые случаи, которые генерирует Claude, для большей точности и конкретности.
Вот пример заполненного экрана оценки с несколькими тестовыми случаями:
Если вы обновите исходный текст промпта, вы можете повторно запустить весь набор оценок с новым промптом, чтобы увидеть, как изменения влияют на производительность во всех тестовых случаях.
Советы по эффективной оценке
Используйте вспомогательный инструмент ‘Generate a prompt’ в Console для быстрого создания промптов с соответствующим синтаксисом переменных для оценки.
Понимание и сравнение результатов
Инструмент оценки предлагает несколько функций, помогающих улучшить ваши промпты:
- Сравнение бок о бок: Сравнивайте выходные данные двух или более промптов, чтобы быстро увидеть влияние ваших изменений.
- Оценка качества: Оценивайте качество ответов по 5-балльной шкале, чтобы отслеживать улучшения качества ответов для каждого промпта.
- Версионирование промптов: Создавайте новые версии вашего промпта и перезапускайте набор тестов для быстрой итерации и улучшения результатов.
Просматривая результаты по тестовым случаям и сравнивая различные версии промптов, вы можете заметить закономерности и более эффективно вносить обоснованные корректировки в ваш промпт.
Начните оценивать ваши промпты сегодня, чтобы создавать более надежные AI-приложения с Claude!