Welche Dateiformate werden unterstützt?

Das Tool unterstützt CSV- und JSON-Dateien. JSON-Daten sollten als Array von Objekten oder als Objekt mit einem "rows"-Array formatiert sein.

Wie wird der Quality Score berechnet?

Der Score ist ein Wert von 0 bis 100. Er sinkt, je mehr leere Zellen, doppelte Zeilen oder Anomalien im Datensatz gefunden werden.

Was bedeutet "Format drift" im Bericht?

Formatdrift zeigt an, dass die Werte in einer Spalte strukturell uneinheitlich sind, beispielsweise wenn Datumsformate gemischt werden oder Text in einer Zahlenspalte auftaucht.

Kann ich Duplikate nur anhand bestimmter Spalten finden?

Ja, Sie können im Feld "Duplikatspalten" kommagetrennte Spaltennamen (wie "id,email") angeben, um gezielt nach doppelten Geschäftsschlüsseln zu suchen, anstatt ganze Zeilen zu vergleichen.

Ist dieses Tool ein Ersatz für Data-Governance-Software?

Nein, der Profiler liefert einen schnellen operativen Hinweis auf die Datenqualität und ist keine formale Data-Governance-Benotung.

Elysia Tools

Mobile Navigation

Data Analysis

Datensatzqualitaets-Profiler

Profiling fuer CSV- oder JSON-Datensaetze mit Fehlwerten, Duplikaten, Formatdrift, Typen und Ausreissern.

Einzelheiten

Wobei dieses Tool hilft

Fuegen Sie CSV in "Datensatz-Eingabe" ein oder laden Sie eine CSV-/JSON-Datei hoch. Der Profiler untersucht jede Spalte und liefert einen schnellen Qualitaetsblick vor BI, ETL oder ML.

Was geprueft wird:

Fehlwerte pro Spalte
Doppelte Zeilen oder doppelte Kombinationen anhand der in "Duplikatspalten" angegebenen Felder
Typinferenz fuer Spalten: number, boolean, date, string oder empty
Numerische Ausreisser per IQR-aehnlicher Regel
Formatdrift in String-/Datumsfeldern, etwa gemischte Datumsstile oder Codes zusammen mit Freitext

So werden die Felder befuellt:

Datensatz-Eingabe: CSV-Text direkt einfuegen fuer ein schnelles Profil
Datendatei: CSV oder JSON hochladen, wenn der Datensatz groesser ist oder lokal vorliegt
Duplikatspalten: optional; kommagetrennte Schluessel wie id,email, um Duplikate nach Geschaeftsschluessel statt ganzer Zeile zu finden
Beispielzeilen: steuert, wie viele Beispielzeilen im Bericht angezeigt werden

So liest man den Bericht:

Quality score ist eine schnelle 0-100-Zusammenfassung; mehr Fehlwerte, Duplikate und Anomalien senken den Wert
Missing zeigt, wie viele leere/null-Zellen in der Spalte gefunden wurden
Distinct zeigt, wie viele unterschiedliche Werte vorkommen
Anomalies hebt numerische Ausreisser hervor
Format drift markiert Spalten mit strukturell uneinheitlichen Werten

Aktueller Umfang:

CSV und JSON werden unterstuetzt
JSON sollte ein Array von Objekten oder ein Objekt mit rows-Array sein
Der Score ist ein schneller operativer Hinweis und keine formale Data-Governance-Benotung

Ausführung

Dieses Tool ausführen

Fülle das Formular aus, starte das Tool und prüfe das Ergebnis an einem Ort.

Ergebnis

Bereit zum Start

Nach dem Ausführen erscheinen hier Dateien, Text, strukturierte Daten oder Stream-Ausgaben.

Beispiele

Beispiele zu diesem Tool

Verwandt

Datensatzqualitaets-Profiler

Wobei dieses Tool hilft

Dieses Tool ausführen

Vorbereitete Beispielausführungen

Eingaben

Ergebnis

Beispiele zu diesem Tool

Mit verwandten Tools und Themen fortfahren

Vorbereitete Beispielausführungen

Eingaben

Ergebnis

Erfahren Sie, wann dieses Tool passt, was es unterstützt und wie Nutzer es anwenden.

Wichtige Fakten

Überblick

Wann verwenden

So funktioniert es

Anwendungsfälle

Beispiele

1. Transaktions-CSV vor BI profilieren

2. Kunden-JSON auf Formatdrift prüfen

FAQ

CSV Beispiele

Python Beispiele

JWT-Beispiele

Apache Arrow Beispiele

Analysator fuer strukturierte Logs

Datensatz-Imbalance-Detektor und Resampler

Zeitreihen-Anomalie-Detektor

Zeitreihen-Prognose- und Saisonalitaetsanalyse

JSON-Formatierungs-, Diff- und Normalisierungs-Tools

Tools fuer Datenqualitaet, Dublettenbereinigung und Anomalieerkennung

Text-Redaktions-, Hervorhebungs- und Darstellungsformatierungs-Tools

Tools fur JSON-Austausch und Format-Ubersetzung