AI Token 预估器

按语言体系分析文本,并预估 OpenAI、Codex、Claude 和 DeepSeek 的 token 消耗

预估粘贴文本或上传 TXT/Markdown 文件的 AI token 消耗。

功能说明:

  • 识别中文汉字、拉丁文字、假名、韩文、俄文、西里尔文字、阿拉伯文、表情符号、符号以及类代码行等混合文本结构
  • 使用离线 tokenizer 精确计算 OpenAI / Codex o200kbase 与 OpenAI cl100kbase
  • 如果配置了 CLAUDEAPIKEY 或 ANTHROPICAPIKEY,会用 Anthropic count_tokens 官方接口计算 Claude;仅在官方调用失败时回退启发式估算
  • 在缺少官方计数器时,用透明的启发式规则估算 DeepSeek
  • 每个模型结果都会标记 exact-offline-tokenizer、official-provider-api 或 heuristic,避免把估算结果误当成精确值

示例结果

1 个示例

估算中英文混合提示词

在发送给多个 AI 模型前分析一段混合语言指令

{
  "result": {
    "input": {
      "characters": 37
    },
    "language": {
      "primary": "Latin",
      "mixed": true
    },
    "estimates": [
      {
        "profile": "openai-codex-o200k-base"
      }
    ]
  }
}
查看输入参数
{ "inputText": "请总结 this API design and list 3 risks.", "modelProfile": "All Profiles", "countMode": "raw-text" }

Click to upload file or drag and drop file here

Maximum file size: 20MB Supported formats: text/plain, text/markdown, .txt, .md, .csv, .json, .log

关键信息

分类
AI
输入类型
textarea, file, select
输出类型
json
样本覆盖
4
支持 API
Yes

概览

AI Token 预估器是一款专为大语言模型用户设计的文本分析与 Token 计算工具。它能够智能识别中英文、代码、日韩文等多语言混合文本,并基于离线分词器(如 OpenAI o200k_base 和 cl100k_base)以及官方 API 或启发式规则,精准预估 OpenAI、Codex、Claude 和 DeepSeek 的 Token 消耗,帮助您有效控制 API 预算并优化提示词长度。

适用场景

  • 在向大语言模型发送超长提示词或批量调用 API 前,需要精确预估 Token 消耗以控制调用成本。
  • 处理包含中文、英文、代码、表情符号等多语言混合文本,需要分析不同模型分词器的处理效率。
  • 编写长篇 Markdown 报告或上传大型 TXT 文本文件,需要在发送给 AI 助手前确认是否超出上下文窗口限制。

工作原理

  • 输入文本或上传文件:在输入框中直接粘贴文本,或上传 TXT、Markdown、CSV、JSON、Log 等格式的文本文件。
  • 选择模型与计数模式:选择特定的模型配置(如 OpenAI cl100k_base、Claude 或全部配置),并设定是纯文本模式还是聊天消息模式。
  • 多维度分析与计算:系统自动识别文本的语言体系,使用离线分词器精确计算 OpenAI/Codex Token,或通过官方 API/启发式规则估算 Claude 与 DeepSeek 的 Token。
  • 输出详细预估报告:实时生成 JSON 格式的分析结果,明确标注每个模型的计算精度类型(如精确离线计算、官方 API 或启发式估算)。

使用场景

API 成本预算控制:在开发 AI 应用或进行大规模文本处理前,批量预估各模型的 Token 消耗,合理规划 API 账单。
提示词长度优化:分析中英文混合提示词在不同分词器下的表现,精简冗余字符,提高 Token 利用率。
上下文窗口校验:在上传长篇 Markdown 文档或代码日志给 Claude 或 DeepSeek 前,确保其未超出模型的最大上下文限制。

用户案例

1. 优化中英双语提示词

提示词工程师
背景原因
需要设计一个包含大量英文 API 文档和中文说明的复杂提示词,用于自动化客服系统。
解决问题
提示词过长可能导致超出模型窗口,且不清楚在 OpenAI 和 Claude 下的 Token 消耗差异。
如何使用
将中英混合提示词粘贴到输入框,选择“全部配置”模型,并保持“纯文本”计数模式。
示例配置
{
  "inputText": "请总结以下 API 设计并列出 3 个风险:\n\nAPI Specification:\nGET /v1/users\nDescription: Retrieve user list...",
  "modelProfile": "All Profiles",
  "countMode": "raw-text"
}
效果
预估器快速输出分析报告,显示该文本在 OpenAI o200k_base 下的精确 Token 数以及 Claude 的估算 Token 数,帮助工程师精准删减了 15% 的冗余英文描述。

2. 批量分析代码日志文件

后端开发人员
背景原因
需要将一份 5MB 的系统崩溃日志(包含大量代码行、符号和时间戳)输入给 DeepSeek 进行故障分析。
解决问题
无法确定日志文件是否会超出 DeepSeek 的单次输入限制,且手动计算极不现实。
如何使用
上传 system_error.log 文件,在模型配置中选择“DeepSeek Chat 估算”,点击开始分析。
示例配置
{
  "textFile": "system_error.log",
  "modelProfile": "DeepSeek Chat Estimate",
  "countMode": "raw-text"
}
效果
工具通过启发式规则快速计算出该日志文件的预估 Token 消耗,并识别出文本中包含大量的代码行与符号,帮助开发人员决定分批次上传日志。

用 Samples 测试

json, csv, markdown

相关专题

常见问题

这个工具是如何计算 OpenAI 的 Token 的?

工具内置了离线分词器,能够精确计算 OpenAI/Codex 的 o200k_base 和 cl100k_base 编码,无需调用外部 API 即可给出 100% 精确的 Token 数量。

为什么 Claude 和 DeepSeek 的计算结果有时会显示为“估算(heuristic)”?

在未配置官方 API 密钥或官方接口调用失败时,工具会采用透明的启发式规则进行估算。如果配置了 Claude 的 API 密钥,则会通过官方接口进行精确计算。

支持哪些文件格式的导入?

支持导入 .txt、.md、.csv、.json 和 .log 等文本文件,单个文件大小限制在 20MB 以内。

纯文本模式与聊天消息模式有什么区别?

纯文本模式直接计算输入文本的 Token;聊天消息模式会模拟大模型对话的特定格式(如系统角色、用户角色等元数据包装)来计算更接近真实 API 调用的 Token 消耗。

我的文本数据会被上传到服务器吗?安全吗?

对于 OpenAI 的离线计算完全在本地浏览器中完成。只有在您配置了 API 密钥并需要调用 Claude 官方接口时,才会发起安全的网络请求,您的文本隐私得到严格保护。

API 文档

请求端点

POST /zh/api/tools/ai-token-estimator

请求参数

参数名 类型 必填 描述
inputText textarea -
textFile file (需要先上传) -
modelProfile select -
countMode select -

文件类型参数需要先通过 POST /upload/ai-token-estimator 上传获取 filePath,然后将 filePath 传递给对应的文件字段。

响应格式

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
JSON数据: JSON数据

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-ai-token-estimator": {
      "name": "ai-token-estimator",
      "description": "按语言体系分析文本,并预估 OpenAI、Codex、Claude 和 DeepSeek 的 token 消耗",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=ai-token-estimator",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

支持 URL 文件链接或 Base64 编码作为文件参数。

如果遇见问题,请联系我们:[email protected]