개요

Claude는 강력한 다국어 기능을 보여주며, 특히 여러 언어에 걸친 제로샷 작업에서 뛰어난 성능을 보입니다. 이 모델은 널리 사용되는 언어와 저자원 언어 모두에서 일관된 상대적 성능을 유지하여 다국어 애플리케이션에 신뢰할 수 있는 선택이 됩니다.

아래 벤치마크된 언어 외에도 Claude는 많은 언어에서 능력을 발휘할 수 있습니다. 귀하의 특정 사용 사례와 관련된 모든 언어로 테스트해 보시기를 권장합니다.

성능 데이터

다음은 Claude 3.5 모델의 여러 언어에 대한 제로샷 체인오브소트 평가 점수로, 영어 성능(100%) 대비 백분율로 표시됩니다:

언어Claude 3.5 Sonnet (신규)Claude 3.5 Haiku
English (기준, 100%로 고정)100%100%
French96.2%95.3%
Spanish96.9%94.6%
Portuguese (Brazil)96.0%94.6%
Italian95.6%95.0%
German94.0%92.5%
Chinese (Simplified)92.8%90.9%
Indonesian94.0%91.2%
Japanese92.7%90.8%
Korean92.8%89.1%
Arabic92.5%84.7%
Hindi89.3%80.1%
Bengali85.9%72.9%
Swahili83.9%64.7%
Yoruba64.9%46.1%
  • 대부분의 유럽 언어는 영어 대비 95% 이상의 상대적 성능을 유지합니다
  • 동아시아 언어(중국어, 일본어, 한국어)는 약 92-93%의 상대적 성능으로 강한 일관성을 보입니다

이러한 메트릭은 MMLU(Massive Multitask Language Understanding) 영어 테스트 세트를 전문 인간 번역가가 14개의 추가 언어로 번역한 것을 기반으로 하며, 이는 OpenAI의 simple-evals 저장소에 문서화되어 있습니다. 이 평가에서 인간 번역가를 활용한 것은 특히 디지털 리소스가 적은 언어에서 중요한 고품질 번역을 보장합니다.


모범 사례

다국어 콘텐츠 작업 시:

  1. 명확한 언어 컨텍스트 제공: Claude가 대상 언어를 자동으로 감지할 수 있지만, 원하는 입력/출력 언어를 명시적으로 명시하면 신뢰성이 향상됩니다. 더 나은 유창성을 위해 “원어민처럼 관용적인 표현을 사용하도록” Claude에게 프롬프트를 줄 수 있습니다.
  2. 원어 스크립트 사용: 최적의 결과를 위해 음차가 아닌 원어 스크립트로 텍스트를 제출하세요
  3. 문화적 맥락 고려: 효과적인 의사소통은 종종 순수한 번역을 넘어서는 문화적, 지역적 인식이 필요합니다

또한 Claude의 성능을 더욱 향상시키기 위해 일반적인 프롬프트 엔지니어링 가이드라인을 따르는 것을 제안합니다.


언어 지원 고려사항

  • Claude는 표준 유니코드 문자를 사용하는 대부분의 세계 언어로 입력을 처리하고 출력을 생성합니다
  • 성능은 언어에 따라 다르며, 특히 널리 사용되는 언어에서 강력한 기능을 보입니다
  • 디지털 리소스가 적은 언어에서도 Claude는 의미 있는 기능을 유지합니다

Was this page helpful?