Procesador Batch XLSX S3

Procesa xlsx en almacenamiento de objetos por lotes

Lee, limpia, filtra y exporta resultados con opcion de re-subida.

Resultados de ejemplo

1 Ejemplos

Procesar XLSX por lotes en S3

Limpia y filtra varios xlsx y devuelve zip

xlsx-s3-batch-processor-example1.zip Ver archivo
Ver parámetros de entrada
{ "region": "us-east-1", "bucket": "my-data-bucket", "objectKeys": "input/a.xlsx\ninput/b.xlsx", "filterColumn": "status", "filterOperator": "equals", "filterValue": "paid", "outputFormat": "xlsx" }

Datos clave

Categoría
Conversión y codificación
Tipos de entrada
text, textarea, number, select, checkbox
Tipo de salida
file
Cobertura de muestras
4
API disponible
Yes

Resumen

El Procesador Batch XLSX S3 es una herramienta diseñada para automatizar la limpieza, filtrado y conversión de múltiples archivos Excel almacenados en buckets de S3, permitiendo exportar los resultados directamente o re-subirlos al almacenamiento.

Cuándo usarlo

  • Cuando necesitas filtrar registros específicos en múltiples archivos XLSX de gran tamaño almacenados en la nube.
  • Para estandarizar y limpiar datos de Excel eliminando filas vacías o espacios innecesarios antes de integrarlos en otros sistemas.
  • Al requerir una conversión masiva de formatos XLSX a CSV o JSON para facilitar el análisis de datos o la ingesta en bases de datos.

Cómo funciona

  • Conecta tu bucket de S3 proporcionando tus credenciales de acceso y la región correspondiente.
  • Define las rutas de los archivos (object keys) que deseas procesar y configura los criterios de filtrado por columna.
  • Aplica opciones de limpieza como el recorte de espacios y la eliminación de filas vacías.
  • Selecciona el formato de salida deseado y elige si prefieres descargar el resultado o subirlo automáticamente de vuelta a tu bucket.

Casos de uso

Consolidación de reportes financieros mensuales almacenados en S3 para extraer solo las transacciones marcadas como 'pagadas'.
Limpieza automatizada de bases de datos de clientes en formato Excel para eliminar filas incompletas antes de una migración.
Conversión masiva de archivos de inventario XLSX a formato JSON para su consumo directo por aplicaciones web.

Ejemplos

1. Filtrado de facturas pagadas en S3

Analista de Datos
Contexto
El equipo financiero almacena cientos de facturas en formato XLSX en un bucket de S3, pero solo necesitan analizar las que tienen el estado 'pagado'.
Problema
Extraer manualmente la información de cada archivo es ineficiente y propenso a errores.
Cómo usarlo
Configura el bucket, define la columna 'status' con el operador 'equals' y el valor 'paid', y selecciona el formato de salida XLSX.
Configuración de ejemplo
bucket: 'finanzas-data', filterColumn: 'status', filterOperator: 'equals', filterValue: 'paid', outputFormat: 'xlsx'
Resultado
Se genera un archivo comprimido (ZIP) que contiene solo las filas filtradas de todos los archivos seleccionados.

2. Limpieza de datos de clientes

Ingeniero de Datos
Contexto
Se reciben archivos de clientes con múltiples espacios en blanco y filas vacías que impiden la carga correcta en el CRM.
Problema
Limpiar los datos de forma masiva antes de la importación.
Cómo usarlo
Activa las opciones 'Recortar espacios' y 'Eliminar Vacio Filas' al procesar los archivos desde el bucket.
Configuración de ejemplo
trimWhitespace: true, removeEmptyRows: true, outputFormat: 'csv'
Resultado
Archivos CSV limpios y listos para ser importados directamente al CRM sin errores de formato.

Probar con muestras

csv, xlsx, xls

Hubs relacionados

Preguntas frecuentes

¿Qué formatos de salida admite la herramienta?

Puedes exportar tus datos procesados en formatos XLSX, CSV o JSON.

¿Es posible subir los archivos procesados de vuelta a S3?

Sí, activando la opción 'Subir Procesados Archivos de vuelta' y configurando un prefijo de salida.

¿Qué tipo de filtros puedo aplicar?

Puedes filtrar datos mediante operadores como igual a, contiene, empieza con, termina con, o comparaciones numéricas como mayor o menor que.

¿Puedo procesar varios archivos a la vez?

Sí, la herramienta está diseñada para el procesamiento por lotes; solo debes listar las rutas de los objetos separadas por saltos de línea o comas.

¿Se requiere una configuración especial para buckets privados?

Debes proporcionar un Access Key ID y un Secret Access Key válidos con permisos de lectura y escritura sobre el bucket especificado.

Documentación de la API

Punto final de la solicitud

POST /es/api/tools/xlsx-s3-batch-processor

Parámetros de la solicitud

Nombre del parámetro Tipo Requerido Descripción
endpoint text No -
region text No -
bucket text -
accessKeyId text -
secretAccessKey text -
sessionToken text No -
objectKeys textarea -
sheetName text No -
headerRow number No -
filterColumn text No -
filterOperator select No -
filterValue text No -
outputFormat select No -
csvDelimiter text No -
trimWhitespace checkbox No -
removeEmptyRows checkbox No -
uploadBack checkbox No -
outputPrefix text No -

Formato de respuesta

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Archivo: Archivo

Documentación de MCP

Agregue este herramienta a su configuración de servidor MCP:

{
  "mcpServers": {
    "elysiatools-xlsx-s3-batch-processor": {
      "name": "xlsx-s3-batch-processor",
      "description": "Procesa xlsx en almacenamiento de objetos por lotes",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=xlsx-s3-batch-processor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Puede encadenar múltiples herramientas, por ejemplo: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máximo 20 herramientas.

Si encuentra algún problema, por favor, póngase en contacto con nosotros en [email protected]