Wichtige Fakten
- Kategorie
- Konvertierung & Kodierung
- Eingabetypen
- text, textarea, number, select, checkbox
- Ausgabetyp
- file
- Sample-Abdeckung
- 4
- API verfügbar
- Yes
Überblick
Der XLSX S3 Batch-Prozessor ermöglicht die effiziente Stapelverarbeitung von Excel-Dateien direkt aus Ihrem S3-kompatiblen Objektspeicher, inklusive automatisierter Bereinigung, Filterung und Formatkonvertierung.
Wann verwenden
- •Wenn Sie große Mengen an XLSX-Dateien in einem S3-Bucket bereinigen und filtern müssen.
- •Wenn Sie Daten aus Excel-Tabellen in andere Formate wie CSV oder JSON konvertieren möchten.
- •Wenn Sie verarbeitete Dateien direkt wieder in Ihren Objektspeicher zurückschreiben wollen.
So funktioniert es
- •Verbinden Sie den Dienst mit Ihrem S3-Bucket unter Angabe der Zugangsdaten.
- •Definieren Sie die zu verarbeitenden Objekt-Keys und wählen Sie Filterkriterien für Ihre Daten.
- •Konfigurieren Sie die Bereinigungsoptionen wie das Trimmen von Leerzeichen oder das Entfernen leerer Zeilen.
- •Starten Sie den Prozess, um die Ergebnisse als ZIP-Archiv herunterzuladen oder direkt zurück in den Speicher zu laden.
Anwendungsfälle
Beispiele
1. Rechnungsdaten filtern und konvertieren
Datenanalyst- Hintergrund
- Hunderte von Rechnungsdateien liegen im S3-Bucket, wobei nur bezahlte Rechnungen für die Buchhaltung extrahiert werden sollen.
- Problem
- Manuelles Öffnen und Filtern jeder einzelnen Datei ist zu zeitaufwendig.
- Verwendung
- S3-Zugangsdaten eingeben, die Liste der Rechnungs-Keys einfügen und den Filter 'status' auf 'equals' 'paid' setzen.
- Beispielkonfiguration
-
filterColumn: status, filterOperator: equals, filterValue: paid, outputFormat: csv - Ergebnis
- Eine ZIP-Datei mit allen gefilterten Rechnungsdaten im CSV-Format wird erstellt.
2. Stapelweise Datenbereinigung
Systemadministrator- Hintergrund
- Ein Datensatz enthält viele leere Zeilen und inkonsistente Leerzeichen, die die Datenqualität mindern.
- Problem
- Die Daten müssen vor dem Import in ein CRM-System bereinigt werden.
- Verwendung
- Die betroffenen XLSX-Dateien im S3-Bucket auswählen und die Optionen zum Trimmen und Entfernen leerer Zeilen aktivieren.
- Beispielkonfiguration
-
trimWhitespace: true, removeEmptyRows: true, outputFormat: xlsx - Ergebnis
- Bereinigte XLSX-Dateien, die sofort für den Import bereit sind.
Mit Samples testen
csv, xlsx, xlsVerwandte Hubs
FAQ
Welche Dateiformate werden unterstützt?
Das Tool verarbeitet primär XLSX-Dateien und kann diese in XLSX, CSV oder JSON konvertieren.
Kann ich die verarbeiteten Dateien direkt in S3 speichern?
Ja, durch Aktivierung der Option 'Hochladen Verarbeitete Dateien zurück' werden die Ergebnisse automatisch in den angegebenen Bucket geschrieben.
Wie werden die Dateien im Batch ausgewählt?
Sie können die Objekt-Keys der gewünschten Dateien einfach zeilenweise oder durch Kommas getrennt in das Eingabefeld einfügen.
Ist eine Filterung der Daten möglich?
Ja, Sie können eine Spalte angeben und diese mit Operatoren wie 'Gleich', 'Enthält' oder 'Größer als' filtern.
Werden Leerzeichen in den Daten automatisch entfernt?
Ja, die Option 'Leerzeichen trimmen' ist standardmäßig aktiviert, um eine saubere Datenbasis zu gewährleisten.