Агент службы поддержки клиентов
Это руководство объясняет, как использовать продвинутые разговорные возможности Claude для обработки запросов клиентов в реальном времени, обеспечивая круглосуточную поддержку, сокращая время ожидания и управляя большим объемом запросов с точными ответами и позитивным взаимодействием.
Перед созданием с Claude
Решите, стоит ли использовать Claude для чата поддержки
Вот некоторые ключевые показатели того, что вам следует использовать LLM, такую как Claude, для автоматизации частей процесса поддержки клиентов:
Некоторые соображения для выбора Claude вместо других LLM:
- Вы отдаете приоритет естественному, нюансированному разговору: сложное понимание языка Claude позволяет вести более естественные, контекстно-зависимые разговоры, которые кажутся более человечными, чем чаты с другими LLM.
- Вы часто получаете сложные и открытые запросы: Claude может обрабатывать широкий спектр тем и запросов без генерации шаблонных ответов или необходимости обширного программирования перестановок пользовательских высказываний.
- Вам нужна масштабируемая многоязычная поддержка: многоязычные возможности Claude позволяют ему вести разговоры на более чем 200 языках без необходимости в отдельных чат-ботах или обширных процессах перевода для каждого поддерживаемого языка.
Определите идеальное взаимодействие в чате
Опишите идеальное взаимодействие с клиентом, чтобы определить, как и когда вы ожидаете, что клиент будет взаимодействовать с Claude. Этот план поможет определить технические требования вашего решения.
Вот пример взаимодействия в чате для поддержки автострахования:
- Клиент: Инициирует опыт чата поддержки
- Claude: Тепло приветствует клиента и начинает разговор
- Клиент: Спрашивает о страховке для своего нового электромобиля
- Claude: Предоставляет соответствующую информацию о страховом покрытии электромобилей
- Клиент: Задает вопросы, связанные с уникальными потребностями страхования электромобилей
- Claude: Отвечает точными и информативными ответами и предоставляет ссылки на источники
- Клиент: Задает не относящиеся к теме вопросы, не связанные со страхованием или автомобилями
- Claude: Уточняет, что не обсуждает не связанные темы, и направляет пользователя обратно к автострахованию
- Клиент: Выражает интерес к получению страхового предложения
- Claude: Задает ряд вопросов для определения подходящего предложения, адаптируясь к их ответам
- Claude: Отправляет запрос на использование инструмента API для генерации предложения вместе с необходимой информацией, собранной от пользователя
- Claude: Получает информацию ответа от инструмента API, синтезирует информацию в естественный ответ и представляет предоставленное предложение пользователю
- Клиент: Задает дополнительные вопросы
- Claude: Отвечает на дополнительные вопросы по мере необходимости
- Claude: Направляет клиента к следующим шагам в процессе страхования и завершает разговор
Разбейте взаимодействие на уникальные задачи
Чат поддержки клиентов — это набор нескольких различных задач, от ответов на вопросы до поиска информации и выполнения действий по запросам, объединенных в одно взаимодействие с клиентом. Прежде чем начать создание, разбейте идеальное взаимодействие с клиентом на каждую задачу, которую вы хотите, чтобы Claude мог выполнять. Это гарантирует, что вы сможете подсказывать и оценивать Claude для каждой задачи, и дает вам хорошее представление о диапазоне взаимодействий, которые вам нужно учесть при написании тестовых случаев.
Вот ключевые задачи, связанные с примером взаимодействия по страхованию выше:
-
Приветствие и общее руководство
- Тепло приветствовать клиента и начать разговор
- Предоставить общую информацию о компании и взаимодействии
-
Информация о продукте
- Предоставить информацию о страховом покрытии электромобилей
Это потребует, чтобы Claude имел необходимую информацию в своем контексте, и может подразумевать, что необходима интеграция RAG.
- Ответить на вопросы, связанные с уникальными потребностями страхования электромобилей
- Ответить на дополнительные вопросы о предложении или деталях страхования
- Предлагать ссылки на источники, когда это уместно
- Предоставить информацию о страховом покрытии электромобилей
-
Управление разговором
- Оставаться в теме (автострахование)
- Перенаправлять не относящиеся к теме вопросы обратно к соответствующим темам
-
Генерация предложения
- Задавать соответствующие вопросы для определения права на получение предложения
- Адаптировать вопросы на основе ответов клиента
- Отправлять собранную информацию в API генерации предложения
- Представлять предоставленное предложение клиенту
Установите критерии успеха
Работайте с вашей командой поддержки, чтобы определить четкие критерии успеха и написать подробные оценки с измеримыми ориентирами и целями.
Вот критерии и ориентиры, которые можно использовать для оценки того, насколько успешно Claude выполняет определенные задачи:
Вот критерии и ориентиры, которые можно использовать для оценки бизнес-влияния использования Claude для поддержки:
Как реализовать Claude в качестве агента службы поддержки клиентов
Выберите правильную модель Claude
Выбор модели зависит от компромиссов между стоимостью, точностью и временем отклика.
Для чата поддержки клиентов claude-opus-4-20250514
хорошо подходит для баланса интеллекта, задержки и стоимости. Однако для случаев, когда у вас есть поток разговора с несколькими подсказками, включая RAG, использование инструментов и/или подсказки с длинным контекстом, claude-3-haiku-20240307
может быть более подходящим для оптимизации задержки.
Создайте сильную подсказку
Использование Claude для поддержки клиентов требует, чтобы Claude имел достаточно указаний и контекста для соответствующего ответа, при этом имея достаточную гибкость для обработки широкого спектра запросов клиентов.
Давайте начнем с написания элементов сильной подсказки, начиная с системной подсказки:
User
(с единственным исключением в виде ролевой подсказки). Подробнее читайте в Дать Claude роль с помощью системной подсказки.Лучше всего разбить сложные подсказки на подразделы и писать одну часть за раз. Для каждой задачи вы можете добиться большего успеха, следуя пошаговому процессу для определения частей подсказки, которые нужны Claude для хорошего выполнения задачи. Для этого примера поддержки автострахования мы будем писать по частям все части подсказки, начиная с задачи “Приветствие и общее руководство”. Это также облегчает отладку вашей подсказки, так как вы можете быстрее настраивать отдельные части общей подсказки.
Мы поместим все эти части в файл с названием config.py
.
Затем мы сделаем то же самое для нашей информации об автостраховании и страховании электромобилей.
Теперь, когда у нас есть наш статический контент, давайте добавим по крайней мере 4-5 примеров “хороших” взаимодействий, чтобы направлять ответы Claude. Эти примеры должны быть репрезентативными для вашего идеального взаимодействия с клиентом и могут включать ограничения, вызовы инструментов и т.д.
Вы также захотите включить любые важные инструкции, описывающие, что можно и что нельзя делать при взаимодействии Claude с клиентом. Это может быть основано на ограничениях бренда или политиках поддержки.
Теперь давайте объединим все эти разделы в одну строку для использования в качестве нашей подсказки.
Добавьте динамические и агентные возможности с использованием инструментов
Claude способен выполнять действия и динамически извлекать информацию с помощью функциональности использования инструментов на стороне клиента. Начните с перечисления любых внешних инструментов или API, которые должна использовать подсказка.
Для этого примера мы начнем с одного инструмента для расчета предложения.
Пример калькулятора страхового предложения:
Разверните ваши подсказки
Трудно узнать, насколько хорошо работает ваша подсказка, не развернув ее в тестовой производственной среде и не проведя оценки, поэтому давайте создадим небольшое приложение, используя нашу подсказку, SDK Anthropic и streamlit для пользовательского интерфейса.
В файле с названием chatbot.py
начните с настройки класса ChatBot, который будет инкапсулировать взаимодействия с SDK Anthropic.
Класс должен иметь два основных метода: generate_message
и process_user_input
.
Создайте пользовательский интерфейс
Протестируйте развертывание этого кода с помощью Streamlit, используя основной метод. Эта функция main()
настраивает интерфейс чата на основе Streamlit.
Мы сделаем это в файле с названием app.py
Запустите программу с помощью:
Оцените ваши подсказки
Подсказки часто требуют тестирования и оптимизации, чтобы быть готовыми к производству. Чтобы определить готовность вашего решения, оцените производительность чат-бота, используя систематический процесс, сочетающий количественные и качественные методы. Создание сильной эмпирической оценки на основе ваших определенных критериев успеха позволит вам оптимизировать ваши подсказки.
Улучшите производительность
В сложных сценариях может быть полезно рассмотреть дополнительные стратегии для улучшения производительности помимо стандартных техник инженерии подсказок и стратегий реализации ограничений. Вот некоторые распространенные сценарии:
Уменьшите задержку длинного контекста с помощью RAG
При работе с большими объемами статического и динамического контекста включение всей информации в подсказку может привести к высоким затратам, более медленному времени отклика и достижению пределов контекстного окна. В этом сценарии реализация техник Retrieval Augmented Generation (RAG) может значительно улучшить производительность и эффективность.
Используя модели встраивания, такие как Voyage для преобразования информации в векторные представления, вы можете создать более масштабируемую и отзывчивую систему. Этот подход позволяет динамически извлекать релевантную информацию на основе текущего запроса, а не включать весь возможный контекст в каждую подсказку.
Реализация RAG для случаев использования поддержки рецепт RAG показала увеличение точности, сокращение времени отклика и снижение затрат на API в системах с обширными требованиями к контексту.
Интегрируйте данные в реальном времени с использованием инструментов
При работе с запросами, требующими информации в реальном времени, такой как балансы счетов или детали полисов, подходы на основе встраивания RAG недостаточны. Вместо этого вы можете использовать инструменты, чтобы значительно улучшить способность вашего чат-бота предоставлять точные ответы в реальном времени. Например, вы можете использовать инструменты для поиска информации о клиентах, получения деталей заказов и отмены заказов от имени клиента.
Этот подход, описанный в нашем рецепте использования инструментов: агент службы поддержки клиентов, позволяет вам беспрепятственно интегрировать живые данные в ответы Claude и обеспечивать более персонализированный и эффективный опыт клиента.
Усильте ограничения ввода и вывода
При развертывании чат-бота, особенно в сценариях обслуживания клиентов, крайне важно предотвратить риски, связанные с неправильным использованием, запросами вне области и неподходящими ответами. Хотя Claude по своей природе устойчив к таким сценариям, вот дополнительные шаги для усиления ограничений вашего чат-бота:
- Уменьшите галлюцинации: Реализуйте механизмы проверки фактов и цитирования, чтобы основывать ответы на предоставленной информации.
- Перепроверяйте информацию: Проверяйте, что ответы агента соответствуют политикам вашей компании и известным фактам.
- Избегайте договорных обязательств: Убедитесь, что агент не дает обещаний или не заключает соглашений, на которые он не уполномочен.
- Смягчите взломы: Используйте методы, такие как экраны безвредности и валидация ввода, чтобы предотвратить использование пользователями уязвимостей модели, стремящихся генерировать неподходящий контент.
- Избегайте упоминания конкурентов: Реализуйте фильтр упоминания конкурентов, чтобы поддерживать фокус на бренде и не упоминать продукты или услуги конкурентов.
- Сохраняйте характер Claude: Предотвращайте изменение Claude своего стиля или контекста, даже во время длительных, сложных взаимодействий.
- Удаляйте персональную идентифицируемую информацию (PII): Если явно не требуется и не авторизовано, удаляйте любую PII из ответов.
Уменьшите воспринимаемое время отклика с помощью потоковой передачи
При работе с потенциально длинными ответами реализация потоковой передачи может значительно улучшить вовлеченность пользователя и удовлетворенность. В этом сценарии пользователи получают ответ постепенно вместо ожидания генерации всего ответа.
Вот как реализовать потоковую передачу:
- Используйте API потоковой передачи Anthropic для поддержки потоковых ответов.
- Настройте ваш фронтенд для обработки входящих фрагментов текста.
- Отображайте каждый фрагмент по мере его поступления, имитируя набор текста в реальном времени.
- Реализуйте механизм для сохранения полного ответа, позволяющий пользователям просматривать его, если они уходят и возвращаются.
В некоторых случаях потоковая передача позволяет использовать более продвинутые модели с более высокими базовыми задержками, так как постепенное отображение смягчает влияние более длительного времени обработки.
Масштабируйте ваш чат-бот
По мере роста сложности вашего чат-бота архитектура вашего приложения может развиваться соответственно. Прежде чем добавлять дополнительные слои к вашей архитектуре, рассмотрите следующие менее исчерпывающие варианты:
- Убедитесь, что вы максимально используете ваши подсказки и оптимизируете их через инженерию подсказок. Используйте наши руководства по инженерии подсказок, чтобы писать наиболее эффективные подсказки.
- Добавьте дополнительные инструменты к подсказке (которые могут включать цепочки подсказок) и посмотрите, можете ли вы достичь требуемой функциональности.
Если ваш чат-бот обрабатывает невероятно разнообразные задачи, вы можете рассмотреть возможность добавления отдельного классификатора намерений для маршрутизации начального запроса клиента. Для существующего приложения это будет включать создание дерева решений, которое будет направлять запросы клиентов через классификатор, а затем к специализированным разговорам (с их собственным набором инструментов и системных подсказок). Обратите внимание, этот метод требует дополнительного вызова Claude, что может увеличить задержку.
Интегрируйте Claude в ваш рабочий процесс поддержки
Хотя наши примеры были сосредоточены на функциях Python, вызываемых в среде Streamlit, развертывание Claude для чат-бота поддержки в реальном времени требует сервиса API.
Вот как вы можете подойти к этому:
-
Создайте обертку API: Разработайте простую обертку API вокруг вашей функции классификации. Например, вы можете использовать Flask API или Fast API для обертывания вашего кода в HTTP-сервис. Ваш HTTP-сервис может принимать ввод пользователя и возвращать ответ ассистента полностью. Таким образом, ваш сервис может иметь следующие характеристики:
- События, отправляемые сервером (SSE): SSE позволяет передавать ответы в реальном времени от сервера к клиенту. Это критически важно для обеспечения плавного, интерактивного опыта при работе с LLM.
- Кэширование: Реализация кэширования может значительно улучшить время отклика и уменьшить ненужные вызовы API.
- Сохранение контекста: Поддержание контекста, когда пользователь уходит и возвращается, важно для непрерывности в разговорах.
-
Создайте веб-интерфейс: Реализуйте удобный веб-интерфейс для взаимодействия с агентом, работающим на Claude.
Was this page helpful?