Sekarang Anda dapat bertanya kepada Claude tentang teks, gambar, grafik, dan tabel dalam PDF yang Anda berikan. Beberapa contoh penggunaan:

  • Menganalisis laporan keuangan dan memahami grafik/tabel
  • Mengekstrak informasi penting dari dokumen hukum
  • Bantuan penerjemahan untuk dokumen
  • Mengkonversi informasi dokumen ke dalam format terstruktur

Sebelum Anda memulai

Periksa persyaratan PDF

Claude bekerja dengan PDF standar apapun. Namun, Anda harus memastikan ukuran permintaan Anda memenuhi persyaratan ini saat menggunakan dukungan PDF:

PersyaratanBatas
Ukuran permintaan maksimum32MB
Halaman maksimum per permintaan100
FormatPDF Standar (tanpa kata sandi/enkripsi)

Harap dicatat bahwa kedua batas tersebut berlaku untuk seluruh muatan permintaan, termasuk konten lain yang dikirim bersama PDF.

Karena dukungan PDF bergantung pada kemampuan penglihatan Claude, ini tunduk pada batasan dan pertimbangan yang sama seperti tugas penglihatan lainnya.

Platform dan model yang didukung

Dukungan PDF saat ini tersedia pada kedua model Claude 3.5 Sonnet (claude-3-5-sonnet-20241022, claude-3-5-sonnet-20240620) melalui akses API langsung. Fungsi ini akan segera didukung di Amazon Bedrock dan Google Vertex AI


Memproses PDF dengan Claude

Kirim permintaan PDF pertama Anda

Mari mulai dengan contoh sederhana menggunakan Messages API:

Bagaimana dukungan PDF bekerja

Ketika Anda mengirim PDF ke Claude, langkah-langkah berikut terjadi:

1

Sistem mengekstrak isi dokumen.

  • Sistem mengkonversi setiap halaman dokumen menjadi gambar.
  • Teks dari setiap halaman diekstrak dan disediakan bersama gambar setiap halaman.
2

Claude menganalisis baik teks maupun gambar untuk lebih memahami dokumen.

  • Dokumen disediakan sebagai kombinasi teks dan gambar untuk analisis.
  • Ini memungkinkan pengguna untuk meminta wawasan tentang elemen visual PDF, seperti grafik, diagram, dan konten non-tekstual lainnya.
3

Claude merespons, merujuk pada isi PDF jika relevan.

Claude dapat merujuk pada konten tekstual dan visual saat merespons. Anda dapat meningkatkan kinerja lebih lanjut dengan mengintegrasikan dukungan PDF dengan:

  • Caching prompt: Untuk meningkatkan kinerja untuk analisis berulang.
  • Pemrosesan batch: Untuk pemrosesan dokumen volume tinggi.
  • Penggunaan alat: Untuk mengekstrak informasi spesifik dari dokumen untuk digunakan sebagai input alat.

Perkirakan biaya Anda

Jumlah token file PDF tergantung pada total teks yang diekstrak dari dokumen serta jumlah halaman:

  • Biaya token teks: Setiap halaman biasanya menggunakan 1.500-3.000 token per halaman tergantung kepadatan konten. Harga API standar berlaku tanpa biaya PDF tambahan.
  • Biaya token gambar: Karena setiap halaman dikonversi menjadi gambar, perhitungan biaya berbasis gambar yang sama diterapkan.

Anda dapat menggunakan penghitungan token untuk memperkirakan biaya untuk PDF spesifik Anda.


Optimalkan pemrosesan PDF

Tingkatkan kinerja

Ikuti praktik terbaik ini untuk hasil optimal:

  • Tempatkan PDF sebelum teks dalam permintaan Anda
  • Gunakan font standar
  • Pastikan teks jelas dan terbaca
  • Putar halaman ke orientasi tegak yang benar
  • Gunakan nomor halaman yang logis (dari penampil PDF) dalam prompt
  • Pisahkan PDF besar menjadi potongan jika diperlukan
  • Aktifkan caching prompt untuk analisis berulang

Skalakan implementasi Anda

Untuk pemrosesan volume tinggi, pertimbangkan pendekatan ini:

Gunakan caching prompt

Cache PDF untuk meningkatkan kinerja pada kueri berulang:

Proses batch dokumen

Gunakan Message Batches API untuk alur kerja volume tinggi:

Langkah selanjutnya

Was this page helpful?