XLSX CSV 检测规范化

自动检测 CSV 分隔符与编码(UTF-8/GBK),规范化后导入导出

可输出规范化 CSV、XLSX 或两者打包,附检测结果元数据。

示例结果

1 个示例

检测并规范化导出

自动检测并输出CSV+XLSX及清单

xlsx-csv-detect-normalize-example1.zip 查看文件
查看输入参数
{ "sourceFile": "/public/samples/csv/sample-utf8.csv", "sourceEncoding": "auto", "outputMode": "both", "outputDelimiter": "," }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: text/csv, text/tab-separated-values, text/plain

关键信息

分类
转换与编码
输入类型
file, select, text, checkbox
输出类型
file
样本覆盖
4
支持 API
Yes

概览

XLSX CSV 检测规范化工具旨在解决数据导入过程中的编码乱码与分隔符识别难题,通过自动检测源文件的编码格式(如 UTF-8 或 GBK)及分隔符,快速将不规范的文本数据转换为标准化的 CSV 或 XLSX 格式。

适用场景

  • 当打开 CSV 文件出现乱码,怀疑是编码格式(如 GBK 与 UTF-8)不匹配时。
  • 当 CSV 文件分隔符不统一,导致数据无法被 Excel 正确分列读取时。
  • 需要将非标准格式的文本数据批量转换为 Excel 可直接使用的 XLSX 格式时。

工作原理

  • 上传您的 CSV 或 TSV 源文件,工具将自动扫描并识别文件的编码类型与分隔符。
  • 根据需求选择输出模式(CSV、XLSX 或两者打包),并可自定义输出的分隔符与表头处理方式。
  • 点击执行,工具将自动清洗数据(如去除首尾空白),并生成规范化的文件供下载。

使用场景

修复从旧系统导出的 GBK 编码 CSV 文件,使其在现代 Excel 中正常显示中文。
将制表符分隔的 TSV 数据转换为标准的逗号分隔 CSV,以便导入数据库。
快速将多个格式混乱的文本数据源统一转换为标准的 XLSX 格式,方便进行数据分析。

用户案例

1. 修复乱码并转换为 Excel

数据分析师
背景原因
从旧版财务系统导出的 CSV 文件在 Excel 中打开时,所有中文均显示为乱码。
解决问题
文件编码识别错误,且分隔符不统一,导致无法直接使用。
如何使用
上传文件,将源编码设为 GBK,输出模式选择 XLSX,并勾选“将首行视为表头”。
示例配置
sourceEncoding: 'gbk', outputMode: 'xlsx', includeHeader: true
效果
成功导出一个编码正确、格式规范的 XLSX 文件,中文显示正常,数据分列准确。

2. 清洗数据并统一分隔符

运营专员
背景原因
收集到的用户反馈数据包含大量首尾空格,且分隔符混杂。
解决问题
数据不整洁,无法直接导入 CRM 系统。
如何使用
上传文件,开启“去除首尾空白”选项,输出模式选择 CSV,输出分隔符设为逗号。
示例配置
trimWhitespace: true, outputMode: 'csv', outputDelimiter: ','
效果
获得一份干净的 CSV 文件,所有多余空格已被剔除,且统一为逗号分隔,可直接导入 CRM。

用 Samples 测试

csv, xlsx, xls

相关专题

常见问题

该工具支持哪些编码格式?

支持自动检测,并明确支持 UTF-8 和 GBK 编码,有效解决中文乱码问题。

如果我的文件不是逗号分隔的怎么办?

工具会自动识别原始分隔符,您也可以在输出设置中指定所需的输出分隔符,如分号、制表符或竖线。

可以将 CSV 直接转为 XLSX 吗?

可以,选择输出模式为“仅 XLSX”或“CSV + XLSX”,工具会自动将数据转换为 Excel 兼容的格式。

处理后的数据会保留原始格式吗?

工具提供“去除首尾空白”选项,可对数据进行清洗,确保导入后的数据整洁规范。

文件大小有限制吗?

单次上传的文件大小限制为 100MB,足以处理大多数日常办公数据报表。

API 文档

请求端点

POST /zh/api/tools/xlsx-csv-detect-normalize

请求参数

参数名 类型 必填 描述
sourceFile file (需要先上传) -
sourceEncoding select -
outputMode select -
outputDelimiter select -
sheetName text -
trimWhitespace checkbox -
includeHeader checkbox -

文件类型参数需要先通过 POST /upload/xlsx-csv-detect-normalize 上传获取 filePath,然后将 filePath 传递给对应的文件字段。

响应格式

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
文件: 文件

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-xlsx-csv-detect-normalize": {
      "name": "xlsx-csv-detect-normalize",
      "description": "自动检测 CSV 分隔符与编码(UTF-8/GBK),规范化后导入导出",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=xlsx-csv-detect-normalize",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

支持 URL 文件链接或 Base64 编码作为文件参数。

如果遇见问题,请联系我们:[email protected]