XLSX S3 批处理器

批量处理对象存储中的 xlsx(筛选、清洗、输出)并可回传

从 S3 读取多个 XLSX 执行清洗筛选并输出 ZIP(可上传回桶)。

示例结果

1 个示例

批量清洗筛选对象存储XLSX

读取多个 xlsx,清洗并筛选后返回压缩包

xlsx-s3-batch-processor-example1.zip 查看文件
查看输入参数
{ "region": "us-east-1", "bucket": "my-data-bucket", "objectKeys": "input/a.xlsx\ninput/b.xlsx", "filterColumn": "status", "filterOperator": "equals", "filterValue": "paid", "outputFormat": "xlsx" }

关键信息

分类
转换与编码
输入类型
text, textarea, number, select, checkbox
输出类型
file
样本覆盖
4
支持 API
Yes

概览

XLSX S3 批处理器是一款专为云端数据管理设计的自动化工具,支持从 S3 对象存储中批量读取 XLSX 文件,执行高效的清洗、筛选与格式转换,并可将处理后的结果打包回传至指定存储桶。

适用场景

  • 需要从 S3 存储桶中批量提取并清洗多个 XLSX 数据文件时。
  • 需要根据特定条件(如状态、数值范围)对大规模表格数据进行自动化筛选时。
  • 需要将处理后的数据统一转换为 CSV 或 JSON 格式并归档回云端存储时。

工作原理

  • 配置 S3 访问凭证及目标存储桶信息,指定需要处理的多个对象键(Object Keys)。
  • 设置筛选规则(如列名、操作符及阈值)以及数据清洗选项(如去除空白、删除空行)。
  • 选择输出格式(XLSX、CSV 或 JSON),并决定是否将结果自动回传至 S3 存储桶。
  • 点击执行,系统将自动处理文件并生成包含结果的 ZIP 压缩包供下载。

使用场景

电商订单数据清洗:从 S3 批量拉取各地区订单表,筛选出“已支付”状态的记录并转换为 CSV 格式。
财务报表自动化:定期处理存储桶中的发票明细,剔除空行并统一格式后回传至归档目录。
大规模数据迁移:将存储在 S3 中的多个 Excel 原始数据文件批量转换为 JSON 格式,以便导入数据库。

用户案例

1. 批量筛选已支付订单

数据分析师
背景原因
存储桶中存放了大量按月导出的订单 XLSX 文件,需要提取所有状态为“已支付”的记录进行后续分析。
解决问题
手动下载并筛选数百个文件效率极低,且容易出错。
如何使用
输入 S3 凭证,指定对象键列表,设置筛选列为 'status',操作符为 'equals',值为 'paid'。
示例配置
region: us-east-1, bucket: my-data-bucket, filterColumn: status, filterOperator: equals, filterValue: paid, outputFormat: xlsx
效果
系统自动处理所有指定文件,提取出符合条件的行,并打包成一个 ZIP 文件供下载。

2. 财务数据清洗与归档

财务专员
背景原因
每月需处理大量包含空行和格式不统一的财务报表,并将其上传至指定的归档存储桶。
解决问题
需要自动化清洗数据并自动回传,减少人工操作。
如何使用
配置 S3 访问信息,勾选 '去除首尾空白' 和 '删除空行',开启 '回传处理结果' 并设置输出前缀。
示例配置
trimWhitespace: true, removeEmptyRows: true, uploadBack: true, outputPrefix: processed/
效果
清洗后的整洁数据自动保存至 S3 的 'processed/' 目录下,无需手动上传。

用 Samples 测试

csv, xlsx, xls

相关专题

常见问题

该工具支持哪些 S3 兼容存储?

支持 AWS S3 及其他兼容 S3 API 的对象存储服务,通过配置端点(Endpoint)即可连接。

可以一次处理多少个文件?

支持通过文本框批量输入多个对象键,系统会按顺序对这些文件进行批处理。

筛选功能支持哪些逻辑?

支持等于、包含、开头/结尾匹配,以及大于、小于、大于等于、小于等于等数值比较逻辑。

处理后的文件如何获取?

处理完成后,系统会生成一个 ZIP 压缩包供您直接下载;若开启回传选项,文件将自动上传至 S3 指定路径。

清洗选项包含哪些内容?

支持自动去除单元格首尾空白字符以及自动删除表格中的空行,确保数据整洁。

API 文档

请求端点

POST /zh/api/tools/xlsx-s3-batch-processor

请求参数

参数名 类型 必填 描述
endpoint text -
region text -
bucket text -
accessKeyId text -
secretAccessKey text -
sessionToken text -
objectKeys textarea -
sheetName text -
headerRow number -
filterColumn text -
filterOperator select -
filterValue text -
outputFormat select -
csvDelimiter text -
trimWhitespace checkbox -
removeEmptyRows checkbox -
uploadBack checkbox -
outputPrefix text -

响应格式

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
文件: 文件

AI MCP 文档

将此工具添加到您的 MCP 服务器配置中:

{
  "mcpServers": {
    "elysiatools-xlsx-s3-batch-processor": {
      "name": "xlsx-s3-batch-processor",
      "description": "批量处理对象存储中的 xlsx(筛选、清洗、输出)并可回传",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=xlsx-s3-batch-processor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

你可以串联多个工具,比如:`https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`,最多20个。

如果遇见问题,请联系我们:[email protected]