关键信息
- 分类
- AI
- 输入类型
- textarea, file, select
- 输出类型
- json
- 样本覆盖
- 4
- 支持 API
- Yes
概览
AI Token 预估器是一款专为大语言模型用户设计的文本分析与 Token 计算工具。它能够智能识别中英文、代码、日韩文等多语言混合文本,并基于离线分词器(如 OpenAI o200k_base 和 cl100k_base)以及官方 API 或启发式规则,精准预估 OpenAI、Codex、Claude 和 DeepSeek 的 Token 消耗,帮助您有效控制 API 预算并优化提示词长度。
适用场景
- •在向大语言模型发送超长提示词或批量调用 API 前,需要精确预估 Token 消耗以控制调用成本。
- •处理包含中文、英文、代码、表情符号等多语言混合文本,需要分析不同模型分词器的处理效率。
- •编写长篇 Markdown 报告或上传大型 TXT 文本文件,需要在发送给 AI 助手前确认是否超出上下文窗口限制。
工作原理
- •输入文本或上传文件:在输入框中直接粘贴文本,或上传 TXT、Markdown、CSV、JSON、Log 等格式的文本文件。
- •选择模型与计数模式:选择特定的模型配置(如 OpenAI cl100k_base、Claude 或全部配置),并设定是纯文本模式还是聊天消息模式。
- •多维度分析与计算:系统自动识别文本的语言体系,使用离线分词器精确计算 OpenAI/Codex Token,或通过官方 API/启发式规则估算 Claude 与 DeepSeek 的 Token。
- •输出详细预估报告:实时生成 JSON 格式的分析结果,明确标注每个模型的计算精度类型(如精确离线计算、官方 API 或启发式估算)。
使用场景
用户案例
1. 优化中英双语提示词
提示词工程师- 背景原因
- 需要设计一个包含大量英文 API 文档和中文说明的复杂提示词,用于自动化客服系统。
- 解决问题
- 提示词过长可能导致超出模型窗口,且不清楚在 OpenAI 和 Claude 下的 Token 消耗差异。
- 如何使用
- 将中英混合提示词粘贴到输入框,选择“全部配置”模型,并保持“纯文本”计数模式。
- 示例配置
-
{ "inputText": "请总结以下 API 设计并列出 3 个风险:\n\nAPI Specification:\nGET /v1/users\nDescription: Retrieve user list...", "modelProfile": "All Profiles", "countMode": "raw-text" } - 效果
- 预估器快速输出分析报告,显示该文本在 OpenAI o200k_base 下的精确 Token 数以及 Claude 的估算 Token 数,帮助工程师精准删减了 15% 的冗余英文描述。
2. 批量分析代码日志文件
后端开发人员- 背景原因
- 需要将一份 5MB 的系统崩溃日志(包含大量代码行、符号和时间戳)输入给 DeepSeek 进行故障分析。
- 解决问题
- 无法确定日志文件是否会超出 DeepSeek 的单次输入限制,且手动计算极不现实。
- 如何使用
- 上传 system_error.log 文件,在模型配置中选择“DeepSeek Chat 估算”,点击开始分析。
- 示例配置
-
{ "textFile": "system_error.log", "modelProfile": "DeepSeek Chat Estimate", "countMode": "raw-text" } - 效果
- 工具通过启发式规则快速计算出该日志文件的预估 Token 消耗,并识别出文本中包含大量的代码行与符号,帮助开发人员决定分批次上传日志。
用 Samples 测试
json, csv, markdown相关专题
常见问题
这个工具是如何计算 OpenAI 的 Token 的?
工具内置了离线分词器,能够精确计算 OpenAI/Codex 的 o200k_base 和 cl100k_base 编码,无需调用外部 API 即可给出 100% 精确的 Token 数量。
为什么 Claude 和 DeepSeek 的计算结果有时会显示为“估算(heuristic)”?
在未配置官方 API 密钥或官方接口调用失败时,工具会采用透明的启发式规则进行估算。如果配置了 Claude 的 API 密钥,则会通过官方接口进行精确计算。
支持哪些文件格式的导入?
支持导入 .txt、.md、.csv、.json 和 .log 等文本文件,单个文件大小限制在 20MB 以内。
纯文本模式与聊天消息模式有什么区别?
纯文本模式直接计算输入文本的 Token;聊天消息模式会模拟大模型对话的特定格式(如系统角色、用户角色等元数据包装)来计算更接近真实 API 调用的 Token 消耗。
我的文本数据会被上传到服务器吗?安全吗?
对于 OpenAI 的离线计算完全在本地浏览器中完成。只有在您配置了 API 密钥并需要调用 Claude 官方接口时,才会发起安全的网络请求,您的文本隐私得到严格保护。