Tarification
Découvrez la structure tarifaire d’Anthropic pour les modèles et fonctionnalités
Cette page fournit des informations détaillées sur la tarification des modèles et fonctionnalités d’Anthropic. Tous les prix sont en USD.
Pour obtenir les informations tarifaires les plus récentes, veuillez consulter anthropic.com/pricing.
Tarification des modèles
Le tableau suivant présente les tarifs pour tous les modèles Claude à travers différents niveaux d’utilisation :
Model | Base Input Tokens | 5m Cache Writes | 1h Cache Writes | Cache Hits & Refreshes | Output Tokens |
---|---|---|---|---|---|
Claude Opus 4 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Sonnet 4 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.7 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Sonnet 3.5 | $3 / MTok | $3.75 / MTok | $6 / MTok | $0.30 / MTok | $15 / MTok |
Claude Haiku 3.5 | $0.80 / MTok | $1 / MTok | $1.6 / MTok | $0.08 / MTok | $4 / MTok |
Claude Opus 3 | $15 / MTok | $18.75 / MTok | $30 / MTok | $1.50 / MTok | $75 / MTok |
Claude Haiku 3 | $0.25 / MTok | $0.30 / MTok | $0.50 / MTok | $0.03 / MTok | $1.25 / MTok |
MTok = Million de tokens. La colonne “Base Input Tokens” indique la tarification standard des entrées, “Cache Writes” et “Cache Hits” sont spécifiques au cache de prompts, et “Output Tokens” indique la tarification des sorties.
Tarification spécifique aux fonctionnalités
Traitement par lots
L’API Batch permet le traitement asynchrone de grands volumes de requêtes avec une réduction de 50% sur les tokens d’entrée et de sortie.
Model | Batch input | Batch output |
---|---|---|
Claude Opus 4 | $7.50 / MTok | $37.50 / MTok |
Claude Sonnet 4 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.7 | $1.50 / MTok | $7.50 / MTok |
Claude Sonnet 3.5 | $1.50 / MTok | $7.50 / MTok |
Claude Haiku 3.5 | $0.40 / MTok | $2 / MTok |
Claude Opus 3 | $7.50 / MTok | $37.50 / MTok |
Claude Haiku 3 | $0.125 / MTok | $0.625 / MTok |
Pour plus d’informations sur le traitement par lots, consultez notre documentation sur le traitement par lots.
Tarification de l’utilisation d’outils
Tool use requests are priced based on:
- The total number of input tokens sent to the model (including in the
tools
parameter) - The number of output tokens generated
- For server-side tools, additional usage-based pricing (e.g., web search charges per search performed)
Client-side tools are priced the same as any other Claude API request, while server-side tools may incur additional charges based on their specific usage.
The additional tokens from tool use come from:
- The
tools
parameter in API requests (tool names, descriptions, and schemas) tool_use
content blocks in API requests and responsestool_result
content blocks in API requests
When you use tools
, we also automatically include a special system prompt for the model which enables tool use. The number of tool use tokens required for each model are listed below (excluding the additional tokens listed above). Note that the table assumes at least 1 tool is provided. If no tools
are provided, then a tool choice of none
uses 0 additional system prompt tokens.
Model | Tool choice | Tool use system prompt token count |
---|---|---|
Claude Opus 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 4 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.7 | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (Oct) | auto , none any , tool | 346 tokens 313 tokens |
Claude Sonnet 3.5 (June) | auto , none any , tool | 294 tokens 261 tokens |
Claude Haiku 3.5 | auto , none any , tool | 264 tokens 340 tokens |
Claude Opus 3 | auto , none any , tool | 530 tokens 281 tokens |
Claude Sonnet 3 | auto , none any , tool | 159 tokens 235 tokens |
Claude Haiku 3 | auto , none any , tool | 264 tokens 340 tokens |
These token counts are added to your normal input and output tokens to calculate the total cost of a request.
Pour les prix actuels par modèle, référez-vous à notre section tarification des modèles ci-dessus.
Pour plus d’informations sur l’implémentation de l’utilisation d’outils et les meilleures pratiques, consultez notre documentation sur l’utilisation d’outils.
Exemples de tarification pour les cas d’utilisation d’agents
Comprendre la tarification des applications d’agents est crucial lors de la construction avec Claude. Ces exemples concrets peuvent vous aider à estimer les coûts pour différents modèles d’agents.
Exemple d’agent de support client
Lors de la création d’un agent de support client, voici comment les coûts pourraient se répartir :
Exemple de calcul pour le traitement de 10 000 tickets de support :
- Moyenne d’environ 3 700 tokens par conversation
- Utilisation de Claude Sonnet 4 à 3/MTok en sortie
- Coût total : environ 22,20$ pour 10 000 tickets
Pour une explication détaillée de ce calcul, consultez notre guide d’agent de support client.
Tarification générale du flux de travail des agents
Pour des architectures d’agents plus complexes avec plusieurs étapes :
-
Traitement initial des requêtes
- Entrée typique : 500-1 000 tokens
- Coût de traitement : environ 0,003$ par requête
-
Récupération de la mémoire et du contexte
- Contexte récupéré : 2 000-5 000 tokens
- Coût par récupération : environ 0,015$ par opération
-
Planification et exécution d’actions
- Tokens de planification : 1 000-2 000
- Retour d’exécution : 500-1 000
- Coût combiné : environ 0,045$ par action
Pour un guide complet sur les modèles de tarification des agents, consultez notre guide des cas d’utilisation d’agents.
Stratégies d’optimisation des coûts
Lors de la création d’agents avec Claude :
- Utilisez les modèles appropriés : Choisissez Haiku pour les tâches simples, Sonnet pour le raisonnement complexe
- Implémentez le cache de prompts : Réduisez les coûts pour le contexte répété
- Opérations par lots : Utilisez l’API Batch pour les tâches non sensibles au temps
- Surveillez les modèles d’utilisation : Suivez la consommation de tokens pour identifier les opportunités d’optimisation
Pour les applications d’agents à volume élevé, envisagez de contacter notre équipe commerciale pour entreprises pour des arrangements tarifaires personnalisés.
Considérations tarifaires supplémentaires
Limites de débit
Les limites de débit varient selon le niveau d’utilisation et affectent le nombre de requêtes que vous pouvez effectuer :
- Niveau 1 : Utilisation de base avec des limites élémentaires
- Niveau 2 : Limites accrues pour les applications en croissance
- Niveau 3 : Limites plus élevées pour les applications établies
- Niveau 4 : Limites standard maximales
- Entreprise : Limites personnalisées disponibles
Pour des informations détaillées sur les limites de débit, consultez notre documentation sur les limites de débit.
Remises sur volume
Des remises sur volume peuvent être disponibles pour les utilisateurs à haut volume. Celles-ci sont négociées au cas par cas.
- Les niveaux standard utilisent la tarification indiquée ci-dessus
- Les clients entreprises peuvent contacter les ventes pour une tarification personnalisée
- Des remises académiques et de recherche peuvent être disponibles
Tarification pour entreprises
Pour les clients entreprises ayant des besoins spécifiques :
- Limites de débit personnalisées
- Remises sur volume
- Support dédié
- Conditions personnalisées
Contactez notre équipe commerciale à sales@anthropic.com ou via la Console Anthropic pour discuter des options de tarification pour entreprises.
Facturation et paiement
- La facturation est calculée mensuellement en fonction de l’utilisation réelle
- Les paiements sont traités en USD
- Options de carte de crédit et de facturation disponibles
- Suivi de l’utilisation disponible dans la Console Anthropic
Questions fréquemment posées
Comment l’utilisation des tokens est-elle calculée ?
Les tokens sont des morceaux de texte que les modèles traitent. En estimation approximative, 1 token équivaut à environ 4 caractères ou 0,75 mots en anglais. Le nombre exact varie selon la langue et le type de contenu.
Existe-t-il des niveaux gratuits ou des essais ?
Les nouveaux utilisateurs reçoivent une petite quantité de crédits gratuits pour tester l’API. Contactez les ventes pour obtenir des informations sur les essais prolongés pour l’évaluation par les entreprises.
Comment les remises se cumulent-elles ?
Les remises de l’API Batch et du cache de prompts peuvent être combinées. Par exemple, l’utilisation conjointe de ces fonctionnalités permet des économies significatives par rapport aux appels API standard.
Quels modes de paiement sont acceptés ?
Nous acceptons les principales cartes de crédit pour les comptes standard. Les clients entreprises peuvent organiser la facturation et d’autres méthodes de paiement.
Pour des questions supplémentaires concernant la tarification, contactez support@anthropic.com.