XLSX S3 Batch-Prozessor

Verarbeitet xlsx im Objektspeicher stapelweise

Liest, bereinigt, filtert und exportiert mit optionalem Re-Upload.

Beispielergebnisse

1 Beispiele

XLSX-Batchverarbeitung in S3

Bereinigt/filtert mehrere xlsx und gibt zip zuruck

xlsx-s3-batch-processor-example1.zip Datei anzeigen
Eingabeparameter anzeigen
{ "region": "us-east-1", "bucket": "my-data-bucket", "objectKeys": "input/a.xlsx\ninput/b.xlsx", "filterColumn": "status", "filterOperator": "equals", "filterValue": "paid", "outputFormat": "xlsx" }

Wichtige Fakten

Kategorie
Konvertierung & Kodierung
Eingabetypen
text, textarea, number, select, checkbox
Ausgabetyp
file
Sample-Abdeckung
4
API verfügbar
Yes

Überblick

Der XLSX S3 Batch-Prozessor ermöglicht die effiziente Stapelverarbeitung von Excel-Dateien direkt aus Ihrem S3-kompatiblen Objektspeicher, inklusive automatisierter Bereinigung, Filterung und Formatkonvertierung.

Wann verwenden

  • Wenn Sie große Mengen an XLSX-Dateien in einem S3-Bucket bereinigen und filtern müssen.
  • Wenn Sie Daten aus Excel-Tabellen in andere Formate wie CSV oder JSON konvertieren möchten.
  • Wenn Sie verarbeitete Dateien direkt wieder in Ihren Objektspeicher zurückschreiben wollen.

So funktioniert es

  • Verbinden Sie den Dienst mit Ihrem S3-Bucket unter Angabe der Zugangsdaten.
  • Definieren Sie die zu verarbeitenden Objekt-Keys und wählen Sie Filterkriterien für Ihre Daten.
  • Konfigurieren Sie die Bereinigungsoptionen wie das Trimmen von Leerzeichen oder das Entfernen leerer Zeilen.
  • Starten Sie den Prozess, um die Ergebnisse als ZIP-Archiv herunterzuladen oder direkt zurück in den Speicher zu laden.

Anwendungsfälle

Automatisierte Konsolidierung von monatlichen Finanzberichten aus verschiedenen S3-Ordnern.
Bereinigung von Kundendaten-Listen durch Entfernen leerer Zeilen und Formatierung für den Import in Datenbanken.
Batch-Konvertierung von Excel-Archiven in JSON für die Weiterverarbeitung in Web-Applikationen.

Beispiele

1. Rechnungsdaten filtern und konvertieren

Datenanalyst
Hintergrund
Hunderte von Rechnungsdateien liegen im S3-Bucket, wobei nur bezahlte Rechnungen für die Buchhaltung extrahiert werden sollen.
Problem
Manuelles Öffnen und Filtern jeder einzelnen Datei ist zu zeitaufwendig.
Verwendung
S3-Zugangsdaten eingeben, die Liste der Rechnungs-Keys einfügen und den Filter 'status' auf 'equals' 'paid' setzen.
Beispielkonfiguration
filterColumn: status, filterOperator: equals, filterValue: paid, outputFormat: csv
Ergebnis
Eine ZIP-Datei mit allen gefilterten Rechnungsdaten im CSV-Format wird erstellt.

2. Stapelweise Datenbereinigung

Systemadministrator
Hintergrund
Ein Datensatz enthält viele leere Zeilen und inkonsistente Leerzeichen, die die Datenqualität mindern.
Problem
Die Daten müssen vor dem Import in ein CRM-System bereinigt werden.
Verwendung
Die betroffenen XLSX-Dateien im S3-Bucket auswählen und die Optionen zum Trimmen und Entfernen leerer Zeilen aktivieren.
Beispielkonfiguration
trimWhitespace: true, removeEmptyRows: true, outputFormat: xlsx
Ergebnis
Bereinigte XLSX-Dateien, die sofort für den Import bereit sind.

Mit Samples testen

csv, xlsx, xls

Verwandte Hubs

FAQ

Welche Dateiformate werden unterstützt?

Das Tool verarbeitet primär XLSX-Dateien und kann diese in XLSX, CSV oder JSON konvertieren.

Kann ich die verarbeiteten Dateien direkt in S3 speichern?

Ja, durch Aktivierung der Option 'Hochladen Verarbeitete Dateien zurück' werden die Ergebnisse automatisch in den angegebenen Bucket geschrieben.

Wie werden die Dateien im Batch ausgewählt?

Sie können die Objekt-Keys der gewünschten Dateien einfach zeilenweise oder durch Kommas getrennt in das Eingabefeld einfügen.

Ist eine Filterung der Daten möglich?

Ja, Sie können eine Spalte angeben und diese mit Operatoren wie 'Gleich', 'Enthält' oder 'Größer als' filtern.

Werden Leerzeichen in den Daten automatisch entfernt?

Ja, die Option 'Leerzeichen trimmen' ist standardmäßig aktiviert, um eine saubere Datenbasis zu gewährleisten.

API-Dokumentation

Request-Endpunkt

POST /de/api/tools/xlsx-s3-batch-processor

Request-Parameter

Parameter-Name Typ Erforderlich Beschreibung
endpoint text Nein -
region text Nein -
bucket text Ja -
accessKeyId text Ja -
secretAccessKey text Ja -
sessionToken text Nein -
objectKeys textarea Ja -
sheetName text Nein -
headerRow number Nein -
filterColumn text Nein -
filterOperator select Nein -
filterValue text Nein -
outputFormat select Nein -
csvDelimiter text Nein -
trimWhitespace checkbox Nein -
removeEmptyRows checkbox Nein -
uploadBack checkbox Nein -
outputPrefix text Nein -

Antwortformat

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Datei: Datei

MCP-Dokumentation

Fügen Sie dieses Tool zu Ihrer MCP-Server-Konfiguration hinzu:

{
  "mcpServers": {
    "elysiatools-xlsx-s3-batch-processor": {
      "name": "xlsx-s3-batch-processor",
      "description": "Verarbeitet xlsx im Objektspeicher stapelweise",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=xlsx-s3-batch-processor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Sie können mehrere Tools verketten, z.B.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, maximal 20 Tools.

Wenn Sie auf Probleme stoßen, kontaktieren Sie uns bitte bei [email protected]