关键信息
- 分类
- 转换与编码
- 输入类型
- file, select, text, checkbox
- 输出类型
- file
- 样本覆盖
- 4
- 支持 API
- Yes
概览
XLSX CSV 检测规范化工具旨在解决数据导入过程中的编码乱码与分隔符识别难题,通过自动检测源文件的编码格式(如 UTF-8 或 GBK)及分隔符,快速将不规范的文本数据转换为标准化的 CSV 或 XLSX 格式。
适用场景
- •当打开 CSV 文件出现乱码,怀疑是编码格式(如 GBK 与 UTF-8)不匹配时。
- •当 CSV 文件分隔符不统一,导致数据无法被 Excel 正确分列读取时。
- •需要将非标准格式的文本数据批量转换为 Excel 可直接使用的 XLSX 格式时。
工作原理
- •上传您的 CSV 或 TSV 源文件,工具将自动扫描并识别文件的编码类型与分隔符。
- •根据需求选择输出模式(CSV、XLSX 或两者打包),并可自定义输出的分隔符与表头处理方式。
- •点击执行,工具将自动清洗数据(如去除首尾空白),并生成规范化的文件供下载。
使用场景
用户案例
1. 修复乱码并转换为 Excel
数据分析师- 背景原因
- 从旧版财务系统导出的 CSV 文件在 Excel 中打开时,所有中文均显示为乱码。
- 解决问题
- 文件编码识别错误,且分隔符不统一,导致无法直接使用。
- 如何使用
- 上传文件,将源编码设为 GBK,输出模式选择 XLSX,并勾选“将首行视为表头”。
- 示例配置
-
sourceEncoding: 'gbk', outputMode: 'xlsx', includeHeader: true - 效果
- 成功导出一个编码正确、格式规范的 XLSX 文件,中文显示正常,数据分列准确。
2. 清洗数据并统一分隔符
运营专员- 背景原因
- 收集到的用户反馈数据包含大量首尾空格,且分隔符混杂。
- 解决问题
- 数据不整洁,无法直接导入 CRM 系统。
- 如何使用
- 上传文件,开启“去除首尾空白”选项,输出模式选择 CSV,输出分隔符设为逗号。
- 示例配置
-
trimWhitespace: true, outputMode: 'csv', outputDelimiter: ',' - 效果
- 获得一份干净的 CSV 文件,所有多余空格已被剔除,且统一为逗号分隔,可直接导入 CRM。
用 Samples 测试
csv, xlsx, xls相关专题
常见问题
该工具支持哪些编码格式?
支持自动检测,并明确支持 UTF-8 和 GBK 编码,有效解决中文乱码问题。
如果我的文件不是逗号分隔的怎么办?
工具会自动识别原始分隔符,您也可以在输出设置中指定所需的输出分隔符,如分号、制表符或竖线。
可以将 CSV 直接转为 XLSX 吗?
可以,选择输出模式为“仅 XLSX”或“CSV + XLSX”,工具会自动将数据转换为 Excel 兼容的格式。
处理后的数据会保留原始格式吗?
工具提供“去除首尾空白”选项,可对数据进行清洗,确保导入后的数据整洁规范。
文件大小有限制吗?
单次上传的文件大小限制为 100MB,足以处理大多数日常办公数据报表。