使用 Claude 進行開發
多語言支援
Claude 在多種語言的任務中表現出色,相對於英語保持強大的跨語言性能。
概述
Claude 展現出強大的多語言能力,在跨語言零樣本任務中表現特別出色。該模型在廣泛使用的語言和資源較少的語言中都保持一致的相對性能,使其成為多語言應用的可靠選擇。
請注意,Claude 能夠處理的語言遠超過以下基準測試中列出的語言。我們鼓勵您測試與您特定使用案例相關的任何語言。
性能數據
以下是 Claude 3.5 模型在不同語言中的零樣本思維鏈評估分數,以相對於英語性能(100%)的百分比顯示:
語言 | Claude 3.5 Sonnet(新) | Claude 3.5 Haiku |
---|---|---|
英語(基準,固定為 100%) | 100% | 100% |
法語 | 96.2% | 95.3% |
西班牙語 | 96.9% | 94.6% |
葡萄牙語(巴西) | 96.0% | 94.6% |
義大利語 | 95.6% | 95.0% |
德語 | 94.0% | 92.5% |
簡體中文 | 92.8% | 90.9% |
印尼語 | 94.0% | 91.2% |
日語 | 92.7% | 90.8% |
韓語 | 92.8% | 89.1% |
阿拉伯語 | 92.5% | 84.7% |
印地語 | 89.3% | 80.1% |
孟加拉語 | 85.9% | 72.9% |
斯瓦希里語 | 83.9% | 64.7% |
約魯巴語 | 64.9% | 46.1% |
- 大多數歐洲語言相對於英語保持超過 95% 的相對性能
- 東亞語言(中文、日語、韓語)在約 92-93% 的相對性能上表現出強大的一致性
這些指標基於由專業人類翻譯人員將英語測試集翻譯成額外 14 種語言的 MMLU(大規模多任務語言理解),詳見 OpenAI 的 simple-evals 儲存庫。在此評估中使用人類翻譯確保了高品質的翻譯,這對於數位資源較少的語言尤為重要。
最佳實踐
在處理多語言內容時:
- 提供清晰的語言上下文:雖然 Claude 可以自動檢測目標語言,但明確說明所需的輸入/輸出語言可以提高可靠性。為了提升流暢度,您可以提示 Claude 使用「如同母語者般的慣用語言」。
- 使用原生文字:提交文本時使用其原生文字而非音譯以獲得最佳結果
- 考慮文化背景:有效的溝通通常需要超越純粹翻譯的文化和地區意識
我們也建議遵循我們的一般提示工程指南以更好地提升 Claude 的性能。
語言支援考慮因素
- Claude 可處理使用標準 Unicode 字符的大多數世界語言的輸入和輸出
- 性能因語言而異,在使用廣泛的語言中具有特別強大的能力
- 即使在數位資源較少的語言中,Claude 仍保持有意義的能力