PDF 지원
Claude 3.5 Sonnet으로 PDF를 처리하세요. 문서에서 텍스트를 추출하고, 차트를 분석하고, 시각적 콘텐츠를 이해하세요.
이제 제공하는 PDF의 텍스트, 그림, 차트, 표에 대해 Claude에게 문의할 수 있습니다. 샘플 사용 사례:
- 재무 보고서 분석 및 차트/표 이해
- 법률 문서에서 핵심 정보 추출
- 문서 번역 지원
- 문서 정보를 구조화된 형식으로 변환
시작하기 전에
PDF 요구사항 확인
Claude는 모든 표준 PDF와 작동합니다. 하지만 PDF 지원을 사용할 때 요청 크기가 다음 요구사항을 충족하는지 확인해야 합니다:
요구사항 | 제한 |
---|---|
최대 요청 크기 | 32MB |
요청당 최대 페이지 수 | 100 |
형식 | 표준 PDF (비밀번호/암호화 없음) |
두 제한 모두 PDF와 함께 전송되는 다른 콘텐츠를 포함한 전체 요청 페이로드에 적용됩니다.
PDF 지원은 Claude의 시각 기능에 의존하므로 다른 시각 작업과 동일한 제한사항 및 고려사항이 적용됩니다.
지원되는 플랫폼 및 모델
PDF 지원은 현재 직접 API 액세스를 통해 두 Claude 3.5 Sonnet 모델(claude-3-5-sonnet-20241022
, claude-3-5-sonnet-20240620
)에서 사용할 수 있습니다. 이 기능은 곧 Amazon Bedrock과 Google Vertex AI에서도 지원될 예정입니다.
Claude로 PDF 처리하기
첫 PDF 요청 보내기
Messages API를 사용한 간단한 예제로 시작해보겠습니다:
PDF 지원 작동 방식
Claude에 PDF를 보내면 다음 단계가 진행됩니다:
시스템이 문서의 내용을 추출합니다.
- 시스템이 문서의 각 페이지를 이미지로 변환합니다.
- 각 페이지의 텍스트가 추출되어 각 페이지의 이미지와 함께 제공됩니다.
Claude가 문서를 더 잘 이해하기 위해 텍스트와 이미지를 모두 분석합니다.
- 문서는 분석을 위해 텍스트와 이미지의 조합으로 제공됩니다.
- 이를 통해 사용자는 차트, 다이어그램 및 기타 비텍스트 콘텐츠와 같은 PDF의 시각적 요소에 대한 통찰력을 요청할 수 있습니다.
Claude가 관련이 있는 경우 PDF의 내용을 참조하여 응답합니다.
Claude는 응답할 때 텍스트 및 시각적 콘텐츠를 모두 참조할 수 있습니다. 다음을 통해 성능을 더욱 향상시킬 수 있습니다:
- 프롬프트 캐싱: 반복적인 분석의 성능 향상을 위해
- 배치 처리: 대용량 문서 처리를 위해
- 도구 사용: 도구 입력으로 사용할 문서에서 특정 정보를 추출하기 위해
비용 추정
PDF 파일의 토큰 수는 문서에서 추출된 총 텍스트와 페이지 수에 따라 달라집니다:
- 텍스트 토큰 비용: 각 페이지는 일반적으로 콘텐츠 밀도에 따라 페이지당 1,500-3,000 토큰을 사용합니다. 추가 PDF 수수료 없이 표준 API 가격이 적용됩니다.
- 이미지 토큰 비용: 각 페이지가 이미지로 변환되므로 동일한 이미지 기반 비용 계산이 적용됩니다.
특정 PDF의 비용을 추정하기 위해 토큰 계산을 사용할 수 있습니다.
PDF 처리 최적화
성능 향상
최적의 결과를 위해 다음 모범 사례를 따르세요:
- 요청에서 PDF를 텍스트 앞에 배치
- 표준 글꼴 사용
- 텍스트가 선명하고 읽기 쉬운지 확인
- 페이지를 올바른 세로 방향으로 회전
- 프롬프트에서 논리적 페이지 번호(PDF 뷰어의) 사용
- 필요한 경우 큰 PDF를 청크로 분할
- 반복적인 분석을 위해 프롬프트 캐싱 활성화
구현 확장
대용량 처리를 위해 다음 접근 방식을 고려하세요:
프롬프트 캐싱 사용
반복되는 쿼리의 성능을 향상시키기 위해 PDF를 캐시:
문서 배치 처리
대용량 워크플로우를 위해 Message Batches API 사용: