Le comptage des tokens est en version bêta

Pour accéder à cette fonctionnalité, incluez l’en-tête anthropic-beta: token-counting-2024-11-01 dans vos requêtes API, ou utilisez client.beta.messages.count_tokens dans vos appels SDK.

Nous continuerons à améliorer cette version bêta ouverte dans les semaines à venir, donc nous apprécions vos retours. Veuillez partager vos idées et suggestions en utilisant ce formulaire.

Le comptage des tokens vous permet de déterminer le nombre de tokens dans un message avant de l’envoyer à Claude, vous aidant à prendre des décisions éclairées concernant vos prompts et votre utilisation. Avec le comptage des tokens, vous pouvez :

  • Gérer de manière proactive les limites de taux et les coûts
  • Prendre des décisions intelligentes sur le routage des modèles
  • Optimiser les prompts pour une longueur spécifique

Comment compter les tokens des messages

Le point de terminaison comptage des tokens accepte la même liste structurée d’entrées pour créer un message, y compris la prise en charge des prompts système, des outils, des images, et des PDF. La réponse contient le nombre total de tokens d’entrée.

Le nombre de tokens doit être considéré comme une estimation. Dans certains cas, le nombre réel de tokens d’entrée utilisés lors de la création d’un message peut différer légèrement.

Modèles pris en charge

Le point de terminaison de comptage des tokens prend en charge les modèles suivants :

  • Claude 3.5 Sonnet
  • Claude 3.5 Haiku
  • Claude 3 Haiku
  • Claude 3 Opus

Compter les tokens dans les messages de base

JSON
{ "input_tokens": 14 }

Compter les tokens dans les messages avec des outils

JSON
{ "input_tokens": 403 }

Compter les tokens dans les messages avec des images

JSON
{ "input_tokens": 1551 }

Compter les tokens dans les messages avec des PDF

JSON
{ "input_tokens": 2188 }

L’API de comptage des tokens prend en charge les PDF avec les mêmes limitations que l’API Messages.


Tarification et limites de taux

Le comptage des tokens est gratuit mais soumis à des limites de requêtes par minute basées sur votre niveau d’utilisation. Si vous avez besoin de limites plus élevées, contactez le service commercial via la Console Anthropic.

Niveau d’utilisationRequêtes par minute (RPM)
1100
22 000
34 000
48 000

Le comptage des tokens et la création de messages ont des limites de taux séparées et indépendantes — l’utilisation de l’un ne compte pas dans les limites de l’autre.