关键信息
- 分类
- Data Processing
- 输入类型
- textarea, select, text, checkbox
- 输出类型
- text
- 样本覆盖
- 4
- 支持 API
- Yes
概览
CSV数据分组器是一款专为处理CSV文件设计的工具,能够按指定列对数据进行分组,并应用多种聚合函数进行统计分析。它帮助用户快速从原始数据中提取洞察,适用于数据汇总、报告生成和业务分析等场景。
适用场景
- •当您需要按类别、日期或其他标准对CSV数据进行分组汇总时。
- •当您想对大型数据集执行聚合计算,如求和、平均值或计数时。
- •当您需要将杂乱的数据转换为结构化的分组报告以支持决策时。
工作原理
- •输入CSV数据:通过文本框粘贴或上传CSV文件,确保第一行包含标题。
- •配置分组规则:指定分组列名,支持多列以创建嵌套分组。
- •设置聚合选项:定义聚合函数,如对数值列求和或对文本列计数。
- •选择输出格式:生成CSV或JSON格式的结果,并可自定义排序和值修剪。
使用场景
销售数据分析:按产品类别分组,计算总销售额和平均订单价值。
库存管理:按仓库位置分组,统计库存数量和产品种类。
调查数据汇总:按受访者年龄组分组,汇总回答频率和分布情况。
用户案例
1. 销售业绩月度汇总
销售经理- 背景原因
- 公司每月导出销售记录CSV文件,包含日期、产品、销售额等列。
- 解决问题
- 需要快速按产品类别和月份汇总销售额,以生成月度报告。
- 如何使用
- 上传CSV文件,设置分隔符为逗号,分组列为'产品类别,月份',聚合选项为'销售额:sum'。
- 示例配置
-
[{"column": "销售额", "function": "sum", "as": "总销售额"}] - 效果
- 生成按产品类别和月份分组的汇总表,显示每个组的总销售额,便于分析趋势。
2. 库存统计与去重
- 背景原因
- 仓库系统导出库存数据CSV,需要按位置统计库存并计算唯一产品数。
- 解决问题
- 数据包含重复条目,需要分组统计并去重。
- 如何使用
- 输入CSV数据,选择分隔符,分组列为'仓库位置',聚合选项为'库存数量:sum,产品ID:count_unique'。
- 效果
- 输出JSON报告,显示每个仓库位置的库存总量和唯一产品数量,优化库存管理。
用 Samples 测试
json, csv, video相关专题
常见问题
支持哪些聚合函数?
支持count, sum, avg/average, min, max, first, last, join, unique, count_unique等函数。
如何处理大型CSV文件?
工具优化用于处理大型数据集,但建议对于超大文件分批处理以避免浏览器性能问题。
输出格式有哪些选项?
您可以选择输出为CSV格式或JSON格式,根据需求灵活选择。
分组列可以指定多个吗?
是的,在'分组列'输入框中用逗号分隔多个列名,例如'类别,年份',以实现嵌套分组。
是否支持自定义聚合规则?
是的,通过'聚合选项'输入框,您可以使用JSON格式或简单格式定义复杂的聚合规则。