PDF 지원 (베타)
Claude 3.5 Sonnet 모델은 이제 PDF 입력을 지원하며 문서 내의 텍스트와 시각적 콘텐츠를 모두 이해합니다.
PDF 지원은 공개 베타 단계입니다
이 기능을 사용하려면 API 요청에 anthropic-beta: pdfs-2024-09-25
헤더를 포함하세요.
앞으로 몇 주 동안 이 공개 베타를 개선할 예정이므로, 여러분의 피드백을 환영합니다. 이 양식을 통해 아이디어와 제안을 공유해 주세요.
PDF 기능
Claude는 모든 표준 PDF와 호환됩니다. 제공하는 PDF의 텍스트, 그림, 차트, 표에 대해 Claude에게 질문할 수 있습니다. 사용 사례 예시:
- 재무 보고서 분석 및 차트/표 이해
- 법률 문서에서 핵심 정보 추출
- 문서 번역 지원
- 문서 정보를 구조화된 형식으로 변환
PDF 지원 작동 방식
PDF 파일이 포함된 요청을 보낼 때:
시스템이 문서의 내용을 추출합니다.
- 시스템이 문서의 각 페이지를 이미지로 변환합니다.
- 각 페이지의 텍스트가 추출되어 해당 페이지의 이미지와 함께 제공됩니다.
Claude가 문서를 더 잘 이해하기 위해 텍스트와 이미지를 모두 분석합니다.
- 문서는 분석을 위해 텍스트와 이미지의 조합으로 제공됩니다.
- 이를 통해 사용자는 차트, 다이어그램 및 기타 비텍스트 콘텐츠와 같은 PDF의 시각적 요소에 대한 통찰력을 요청할 수 있습니다.
다른 Claude 기능과 함께 문서를 사용하세요.
PDF 지원은 다음과 잘 연동됩니다:
- 프롬프트 캐싱: 반복적인 분석의 성능 향상을 위해.
- 배치 처리: 대용량 문서 처리를 위해.
- 도구 사용: 도구 입력으로 사용할 문서에서 특정 정보를 추출하기 위해.
PDF 지원 제한사항
애플리케이션에 PDF 지원을 통합하기 전에 파일이 다음 요구사항을 충족하는지 확인하세요:
요구사항 | 제한 |
---|---|
최대 요청 크기 | 32MB |
요청당 최대 페이지 수 | 100 |
지원되는 모델 | claude-3-5-sonnet-20241022 , claude-3-5-sonnet-20240620 |
PDF와 함께 전송되는 다른 콘텐츠를 포함하여 전체 요청 페이로드에 대한 제한사항임을 참고하세요. 제공되는 PDF는 비밀번호나 암호화가 없어야 합니다.
PDF 지원은 Claude의 시각 기능에 의존하므로 동일한 제한사항이 적용됩니다.
지원되는 플랫폼 및 모델
PDF 지원은 현재 직접 API 액세스를 통해 두 Claude 3.5 Sonnet 모델(claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
)에서 사용할 수 있습니다. 이 기능은 곧 Amazon Bedrock과 Google Vertex AI에서도 지원될 예정입니다.
예상 토큰 사용량 계산
PDF 파일의 토큰 수는 문서에서 추출된 총 텍스트와 페이지 수에 따라 달라집니다. 각 페이지가 이미지로 변환되므로 동일한 이미지 기반 비용 계산이 적용됩니다. 각 페이지는 콘텐츠 밀도에 따라 일반적으로 1,500에서 3,000개의 토큰을 사용합니다. PDF 처리에 대한 추가 요금 없이 표준 입력 토큰 가격이 적용됩니다.
토큰 카운팅을 사용하여 PDF가 포함된 메시지의 토큰 수를 확인할 수도 있습니다.
Messages API에서 PDF를 사용하는 방법
다음은 Messages API에서 PDF를 사용하는 간단한 예시입니다:
시작하는 데 도움이 되는 몇 가지 다른 예시들입니다:
PDF 분석을 위한 모범 사례
- 텍스트가 선명하고 읽기 쉬운지 확인하세요.
- 페이지를 올바른 방향으로 회전하세요.
- 페이지 번호를 참조할 때는 페이지에 표시된 물리적 번호가 아닌 PDF 뷰어가 보고하는 논리적 번호를 사용하세요.
- 표준 글꼴을 사용하세요.
- 요청에서 PDF를 텍스트 앞에 배치하세요.
- 제한을 초과하는 매우 큰 PDF는 더 작은 청크로 분할하세요.
- 동일한 문서의 반복 분석에는 프롬프트 캐싱을 사용하세요.
다음 단계
Claude를 사용하여 PDF 작업을 시작할 준비가 되셨나요? 다음은 도움이 되는 리소스입니다: