概述

Claude 展現出強大的多語言能力,在跨語言零樣本任務中表現特別出色。該模型在廣泛使用的語言和資源較少的語言中都保持一致的相對性能,使其成為多語言應用的可靠選擇。

請注意,Claude 能夠處理的語言遠超過以下基準測試中列出的語言。我們鼓勵您測試與您特定使用案例相關的任何語言。

性能數據

以下是 Claude 3.5 模型在不同語言中的零樣本思維鏈評估分數,以相對於英語性能(100%)的百分比顯示:

語言Claude 3.5 Sonnet(新)Claude 3.5 Haiku
英語(基準,固定為 100%)100%100%
法語96.2%95.3%
西班牙語96.9%94.6%
葡萄牙語(巴西)96.0%94.6%
義大利語95.6%95.0%
德語94.0%92.5%
簡體中文92.8%90.9%
印尼語94.0%91.2%
日語92.7%90.8%
韓語92.8%89.1%
阿拉伯語92.5%84.7%
印地語89.3%80.1%
孟加拉語85.9%72.9%
斯瓦希里語83.9%64.7%
約魯巴語64.9%46.1%
  • 大多數歐洲語言相對於英語保持超過 95% 的相對性能
  • 東亞語言(中文、日語、韓語)在約 92-93% 的相對性能上表現出強大的一致性

這些指標基於由專業人類翻譯人員將英語測試集翻譯成額外 14 種語言的 MMLU(大規模多任務語言理解),詳見 OpenAI 的 simple-evals 儲存庫。在此評估中使用人類翻譯確保了高品質的翻譯,這對於數位資源較少的語言尤為重要。


最佳實踐

在處理多語言內容時:

  1. 提供清晰的語言上下文:雖然 Claude 可以自動檢測目標語言,但明確說明所需的輸入/輸出語言可以提高可靠性。為了提升流暢度,您可以提示 Claude 使用「如同母語者般的慣用語言」。
  2. 使用原生文字:提交文本時使用其原生文字而非音譯以獲得最佳結果
  3. 考慮文化背景:有效的溝通通常需要超越純粹翻譯的文化和地區意識

我們也建議遵循我們的一般提示工程指南以更好地提升 Claude 的性能。


語言支援考慮因素

  • Claude 可處理使用標準 Unicode 字符的大多數世界語言的輸入和輸出
  • 性能因語言而異,在使用廣泛的語言中具有特別強大的能力
  • 即使在數位資源較少的語言中,Claude 仍保持有意義的能力

Was this page helpful?