Wichtige Fakten
- Kategorie
- Konvertierung & Kodierung
- Eingabetypen
- file, select, text, checkbox
- Ausgabetyp
- file
- Sample-Abdeckung
- 4
- API verfügbar
- Yes
Überblick
Dieses Tool ermöglicht die automatische Erkennung von Trennzeichen und Zeichenkodierungen in CSV-Dateien, um diese präzise zu normalisieren und in saubere CSV- oder XLSX-Formate zu konvertieren.
Wann verwenden
- •Wenn Sie eine CSV-Datei mit unbekanntem Trennzeichen oder fehlerhafter Kodierung erhalten haben.
- •Wenn Sie Daten aus verschiedenen Quellen in ein einheitliches XLSX- oder CSV-Format für den Import in andere Systeme bringen müssen.
- •Wenn Sie Sonderzeichen (wie bei GBK-Kodierung) korrekt in ein modernes UTF-8-Format umwandeln möchten.
So funktioniert es
- •Laden Sie Ihre Quelldatei hoch und wählen Sie die Kodierung aus oder lassen Sie diese automatisch erkennen.
- •Konfigurieren Sie das gewünschte Ausgabeformat (CSV, XLSX oder beides) sowie das bevorzugte Trennzeichen.
- •Nutzen Sie die Optionen zum Trimmen von Leerzeichen und zur Definition der Kopfzeile, um die Datenstruktur zu bereinigen.
- •Starten Sie den Prozess, um die normalisierte Datei direkt herunterzuladen.
Anwendungsfälle
Beispiele
1. Normalisierung einer fehlerhaften CSV-Datei
Datenanalyst- Hintergrund
- Ein Analyst erhält eine CSV-Datei aus einem alten System, die mit Semikolons getrennt ist und Sonderzeichen falsch darstellt.
- Problem
- Die Datei lässt sich nicht direkt in Excel öffnen, da die Kodierung und das Trennzeichen nicht erkannt werden.
- Verwendung
- Datei hochladen, 'auto' für Kodierung wählen, ';' als Trennzeichen festlegen und 'XLSX' als Ausgabeformat wählen.
- Beispielkonfiguration
-
sourceEncoding: auto, outputMode: xlsx, outputDelimiter: ; - Ergebnis
- Eine saubere XLSX-Datei, die sofort in Excel ohne Formatierungsfehler geöffnet werden kann.
2. Vorbereitung für den Systemimport
IT-Administrator- Hintergrund
- Ein Administrator muss eine Liste von Benutzern in ein neues System importieren, das strikt UTF-8 und Komma-Trennung erfordert.
- Problem
- Die Quelldaten enthalten inkonsistente Leerzeichen und unterschiedliche Trennzeichen.
- Verwendung
- Datei hochladen, 'UTF-8' wählen, 'Leerzeichen trimmen' aktivieren und 'Nur CSV' mit Komma-Trennung exportieren.
- Beispielkonfiguration
-
sourceEncoding: utf-8, outputMode: csv, outputDelimiter: ,, trimWhitespace: true - Ergebnis
- Eine perfekt normalisierte CSV-Datei, die vom Zielsystem ohne Fehlermeldungen akzeptiert wird.
Mit Samples testen
csv, xlsx, xlsVerwandte Hubs
FAQ
Welche Dateiformate werden unterstützt?
Das Tool unterstützt CSV-, TSV- und einfache Textdateien als Eingabe.
Kann das Tool GBK-kodierte Dateien verarbeiten?
Ja, Sie können explizit GBK als Quellkodierung auswählen, um eine korrekte Darstellung der Zeichen zu gewährleisten.
Was passiert, wenn ich 'Beide' als Ausgabemodus wähle?
Sie erhalten ein ZIP-Paket, das sowohl die normalisierte CSV-Datei als auch eine konvertierte XLSX-Datei enthält.
Werden Leerzeichen in den Daten automatisch entfernt?
Wenn die Option 'Leerzeichen trimmen' aktiviert ist, werden überflüssige Leerzeichen an den Rändern der Zellinhalte automatisch entfernt.
Wie erkennt das Tool das Trennzeichen?
Das Tool analysiert die Struktur der Datei und identifiziert automatisch gängige Trennzeichen wie Komma, Semikolon, Tabulator oder Pipe.