Estimador de Tokens de IA

Analisa textos multilíngues e estima tokens para OpenAI, Codex, Claude e DeepSeek

Estima o uso de tokens para texto colado ou arquivos TXT/Markdown enviados.

O que faz:

  • Detecta composição multilíngue, incluindo han chinês, latim, kana, hangul, cirílico, árabe, emoji, símbolos e linhas semelhantes a código
  • Conta OpenAI / Codex o200kbase e OpenAI cl100kbase com tokenizer offline
  • Conta Claude com Anthropic counttokens quando CLAUDEAPIKEY ou ANTHROPICAPI_KEY está disponível, e só volta para heurística se a chamada oficial falhar
  • Estima DeepSeek com heurísticas transparentes quando contadores oficiais não estão disponíveis
  • Marca cada perfil como exact-offline-tokenizer, official-provider-api ou heuristic para não exagerar a precisão

Exemplos de resultados

1 Exemplos

Estimar um prompt misto em chinês e inglês

Analisa uma instrução curta multilíngue antes de enviá-la para vários modelos de IA

{
  "result": {
    "input": {
      "characters": 37
    },
    "language": {
      "primary": "Latin",
      "mixed": true
    },
    "estimates": [
      {
        "profile": "openai-codex-o200k-base"
      }
    ]
  }
}
Ver parâmetros de entrada
{ "inputText": "请总结 this API design and list 3 risks.", "modelProfile": "All Profiles", "countMode": "raw-text" }

Click to upload file or drag and drop file here

Maximum file size: 20MB Supported formats: text/plain, text/markdown, .txt, .md, .csv, .json, .log

Fatos principais

Categoria
AI
Tipos de entrada
textarea, file, select
Tipo de saída
json
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Estimador de Tokens de IA é uma ferramenta essencial para desenvolvedores e criadores de conteúdo que precisam calcular com precisão o consumo de tokens em seus prompts e textos multilíngues. Ele analisa a composição do texto (incluindo caracteres latinos, han chinês, cirílico, emojis e código) e fornece estimativas detalhadas para modelos da OpenAI (o200k_base e cl100k_base), Claude e DeepSeek, ajudando a otimizar custos e evitar limites de contexto de forma prática.

Quando usar

  • Antes de enviar prompts longos ou arquivos de código para APIs de IA, garantindo que o texto caiba no limite de contexto do modelo.
  • Ao otimizar custos de chamadas de API estimando o consumo exato de tokens em textos multilíngues ou estruturados.
  • Durante o desenvolvimento de aplicações de IA para validar o tamanho de mensagens de chat e logs antes do processamento.

Como funciona

  • Insira o texto diretamente na área de entrada ou faça o upload de arquivos nos formatos suportados, como TXT, Markdown, CSV ou JSON.
  • Selecione o perfil de modelo desejado (como OpenAI o200k_base, cl100k_base, Claude ou DeepSeek) e defina o modo de contagem entre texto bruto ou mensagem de chat.
  • A ferramenta analisa a composição linguística e executa tokenizadores offline exatos ou heurísticas transparentes para calcular os tokens.
  • Visualize o relatório detalhado com a contagem de caracteres, classificação do idioma e o nível de precisão da estimativa para cada modelo.

Casos de uso

Estimativa de custos de API para pipelines de processamento de documentos em lote.
Depuração de prompts de chat multilíngues para evitar truncamento de mensagens.
Auditoria de arquivos de log e datasets antes do treinamento ou ajuste fino de modelos de linguagem.

Exemplos

1. Otimização de Prompt Multilíngue

Engenheiro de Prompt
Contexto
Um engenheiro precisa enviar instruções complexas contendo explicações em inglês, exemplos em chinês e trechos de código para a API da OpenAI.
Problema
O prompt corre o risco de estourar o limite de tokens da janela de contexto do modelo cl100k_base.
Como usar
Cole o prompt misto no campo de texto de entrada, selecione o perfil 'OpenAI cl100k_base' e escolha o modo de contagem 'Texto bruto'.
Resultado
A ferramenta calcula instantaneamente a contagem exata de tokens via tokenizer offline, permitindo ajustar o texto antes de enviá-lo à API.

2. Estimativa de Custo para Tradução de Documentos

Gerente de Localização
Contexto
Uma equipe precisa traduzir grandes arquivos Markdown contendo documentação técnica para múltiplos idiomas.
Problema
Estimar o custo financeiro aproximado do uso das APIs do Claude e DeepSeek antes de iniciar o projeto de tradução.
Como usar
Faça o upload do arquivo Markdown usando a opção de arquivo de texto, selecione 'Todos os perfis' e analise os resultados gerados.
Resultado
Obtenção de uma estimativa clara do consumo de tokens para cada modelo, categorizada por nível de precisão (heurística e oficial), facilitando a previsão orçamentária.

Testar com amostras

json, csv, markdown

Hubs relacionados

FAQ

Como a ferramenta calcula os tokens da OpenAI?

Ela utiliza tokenizadores offline exatos para os perfis o200k_base e cl100k_base, garantindo precisão total sem chamadas externas.

Quais formatos de arquivo posso enviar para análise?

Você pode enviar arquivos de texto nos formatos TXT, Markdown (.md), CSV, JSON e arquivos de log (.log) de até 20 MB.

Como funciona a estimativa para o Claude e o DeepSeek?

Para o Claude, a ferramenta usa a API oficial se as chaves estiverem configuradas, recorrendo a heurísticas caso falhe. Para o DeepSeek, são aplicadas heurísticas transparentes.

O que significam as marcações de precisão nos resultados?

Elas indicam a origem do cálculo: 'exact-offline-tokenizer' para contagem exata local, 'official-provider-api' para chamadas oficiais e 'heuristic' para estimativas aproximadas.

A ferramenta suporta textos com múltiplos idiomas e códigos?

Sim, ela detecta e processa misturas de caracteres latinos, han chinês, cirílico, árabe, emojis, símbolos e sintaxes de código.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/ai-token-estimator

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
inputText textarea Não -
textFile file (Upload necessário) Não -
modelProfile select Não -
countMode select Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/ai-token-estimator para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Dados JSON: Dados JSON

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-ai-token-estimator": {
      "name": "ai-token-estimator",
      "description": "Analisa textos multilíngues e estima tokens para OpenAI, Codex, Claude e DeepSeek",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=ai-token-estimator",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]