使用 Claude 构建
多语言支持
Claude在多种语言任务中表现出色,相对于英语保持着强大的跨语言性能。
概述
Claude展示了强大的多语言能力,在跨语言零样本任务中表现尤为出色。该模型在广泛使用的语言和低资源语言中都保持着一致的相对性能,使其成为多语言应用的可靠选择。
请注意,Claude在以下基准测试之外的许多语言中也具有能力。我们鼓励您测试与您特定用例相关的任何语言。
性能数据
以下是Claude 3.7 Sonnet和Claude 3.5模型在不同语言中的零样本思维链评估分数,以相对于英语性能(100%)的百分比显示:
语言 | Claude 3.7 Sonnet1 | Claude 3.5 Sonnet (New) | Claude 3.5 Haiku |
---|---|---|---|
英语(基准线,固定为100%) | 100% | 100% | 100% |
西班牙语 | 97.6% | 96.9% | 94.6% |
葡萄牙语(巴西) | 97.3% | 96.0% | 94.6% |
意大利语 | 97.2% | 95.6% | 95.0% |
法语 | 96.9% | 96.2% | 95.3% |
印度尼西亚语 | 96.3% | 94.0% | 91.2% |
德语 | 96.2% | 94.0% | 92.5% |
阿拉伯语 | 95.4% | 92.5% | 84.7% |
中文(简体) | 95.3% | 92.8% | 90.9% |
韩语 | 95.2% | 92.8% | 89.1% |
日语 | 95.0% | 92.7% | 90.8% |
印地语 | 94.2% | 89.3% | 80.1% |
孟加拉语 | 92.4% | 85.9% | 72.9% |
斯瓦希里语 | 89.2% | 83.9% | 64.7% |
约鲁巴语 | 76.7% | 64.9% | 46.1% |
1 使用延伸思考和16,000个budget_tokens
。
这些指标基于MMLU(大规模多任务语言理解)英语测试集,该测试集由专业人工翻译人员翻译成另外14种语言,详见OpenAI的simple-evals仓库。在此评估中使用人工翻译确保了高质量的翻译,这对于数字资源较少的语言尤为重要。
最佳实践
在处理多语言内容时:
- 提供清晰的语言上下文:虽然Claude可以自动检测目标语言,但明确说明所需的输入/输出语言可以提高可靠性。为了提高流畅度,您可以提示Claude”像母语者一样使用地道的表达方式”。
- 使用原生文字:提交文本时使用其原生文字而不是音译,以获得最佳效果
- 考虑文化背景:有效的沟通通常需要超越纯粹翻译的文化和地区意识
我们还建议遵循我们的一般提示工程指南来更好地提升Claude的性能。
语言支持注意事项
- Claude可以处理使用标准Unicode字符的大多数世界语言的输入和输出
- 性能因语言而异,在使用广泛的语言中具有特别强大的能力
- 即使在数字资源较少的语言中,Claude也保持着有意义的能力