Fuegen Sie CSV in "Datensatz-Eingabe" ein oder laden Sie eine CSV-/JSON-Datei hoch. Der Profiler untersucht jede Spalte und liefert einen schnellen Qualitaetsblick vor BI, ETL oder ML.
Was geprueft wird:
- Fehlwerte pro Spalte
- Doppelte Zeilen oder doppelte Kombinationen anhand der in "Duplikatspalten" angegebenen Felder
- Typinferenz fuer Spalten: number, boolean, date, string oder empty
- Numerische Ausreisser per IQR-aehnlicher Regel
- Formatdrift in String-/Datumsfeldern, etwa gemischte Datumsstile oder Codes zusammen mit Freitext
So werden die Felder befuellt:
- Datensatz-Eingabe: CSV-Text direkt einfuegen fuer ein schnelles Profil
- Datendatei: CSV oder JSON hochladen, wenn der Datensatz groesser ist oder lokal vorliegt
- Duplikatspalten: optional; kommagetrennte Schluessel wie id,email, um Duplikate nach Geschaeftsschluessel statt ganzer Zeile zu finden
- Beispielzeilen: steuert, wie viele Beispielzeilen im Bericht angezeigt werden
So liest man den Bericht:
- Quality score ist eine schnelle 0-100-Zusammenfassung; mehr Fehlwerte, Duplikate und Anomalien senken den Wert
- Missing zeigt, wie viele leere/null-Zellen in der Spalte gefunden wurden
- Distinct zeigt, wie viele unterschiedliche Werte vorkommen
- Anomalies hebt numerische Ausreisser hervor
- Format drift markiert Spalten mit strukturell uneinheitlichen Werten
Aktueller Umfang:
- CSV und JSON werden unterstuetzt
- JSON sollte ein Array von Objekten oder ein Objekt mit rows-Array sein
- Der Score ist ein schneller operativer Hinweis und keine formale Data-Governance-Benotung