使用 Claude 构建
多语言支持
Claude在多种语言任务中表现出色,相对于英语保持着强大的跨语言性能。
概述
Claude展示了强大的多语言能力,在跨语言零样本任务中表现尤为出色。该模型在广泛使用的语言和低资源语言中都保持着一致的相对性能,使其成为多语言应用的可靠选择。
请注意,Claude在以下基准测试之外的许多语言中也具有能力。我们鼓励您测试与您特定用例相关的任何语言。
性能数据
以下是Claude 3.5模型在不同语言中的零样本链式思维评估分数,以相对于英语性能(100%)的百分比显示:
语言 | Claude 3.5 Sonnet (新) | Claude 3.5 Haiku |
---|---|---|
英语(基准线,固定为100%) | 100% | 100% |
法语 | 96.2% | 95.3% |
西班牙语 | 96.9% | 94.6% |
葡萄牙语(巴西) | 96.0% | 94.6% |
意大利语 | 95.6% | 95.0% |
德语 | 94.0% | 92.5% |
中文(简体) | 92.8% | 90.9% |
印尼语 | 94.0% | 91.2% |
日语 | 92.7% | 90.8% |
韩语 | 92.8% | 89.1% |
阿拉伯语 | 92.5% | 84.7% |
印地语 | 89.3% | 80.1% |
孟加拉语 | 85.9% | 72.9% |
斯瓦希里语 | 83.9% | 64.7% |
约鲁巴语 | 64.9% | 46.1% |
- 大多数欧洲语言相对于英语保持超过95%的相对性能
- 东亚语言(中文、日语、韩语)显示出约92-93%的相对性能,保持强大的一致性
这些指标基于MMLU(大规模多任务语言理解)英语测试集,该测试集由专业人工翻译人员翻译成另外14种语言,详见OpenAI的simple-evals仓库。在此评估中使用人工翻译确保了高质量的翻译,这对于数字资源较少的语言尤为重要。
最佳实践
在处理多语言内容时:
- 提供清晰的语言上下文:虽然Claude可以自动检测目标语言,但明确说明所需的输入/输出语言可以提高可靠性。为了增强流畅性,您可以提示Claude”像母语者一样使用地道的表达方式”。
- 使用原生文字:提交文本时使用其原生文字而不是音译,以获得最佳效果
- 考虑文化背景:有效的沟通通常需要超越纯粹翻译的文化和地区意识
我们还建议遵循我们的通用提示工程指南来更好地提升Claude的性能。
语言支持注意事项
- Claude可以处理使用标准Unicode字符的大多数世界语言的输入和输出
- 性能因语言而异,在使用广泛的语言中具有特别强大的能力
- 即使在数字资源较少的语言中,Claude也保持着有意义的能力