Wichtige Fakten
- Kategorie
- Data Processing
- Eingabetypen
- textarea, select, checkbox
- Ausgabetyp
- text
- Sample-Abdeckung
- 4
- API verfügbar
- Yes
Überblick
Der Datenbereichs-Begrenzer ist ein effizientes Werkzeug zur Bereinigung und Validierung numerischer Datensätze. Er ermöglicht es Ihnen, Werte präzise auf definierte Min-Max-Bereiche zu begrenzen, indem Sie diese entweder zuschneiden (Clipping), ungültige Zeilen filtern oder Modifikationen zur späteren Überprüfung markieren.
Wann verwenden
- •Wenn Sie Sensordaten oder Messwerte bereinigen müssen, die physikalisch unmögliche Ausreißer enthalten.
- •Zur Vorbereitung von Datensätzen für Machine-Learning-Modelle, die strikte Wertebereiche erfordern.
- •Bei der Qualitätssicherung von CSV-Berichten, um sicherzustellen, dass alle Eingaben innerhalb definierter Geschäftsregeln liegen.
So funktioniert es
- •Laden Sie Ihre CSV-Daten in das Eingabefeld hoch.
- •Definieren Sie die gewünschten Grenzwerte für Ihre Spalten im JSON-Format.
- •Wählen Sie eine Strategie wie 'Clipping' zum Kürzen, 'Filter' zum Entfernen oder 'Markieren' zur Kennzeichnung.
- •Starten Sie den Prozess und laden Sie die bereinigten Daten inklusive optionaler Statistik herunter.
Anwendungsfälle
Beispiele
1. Sensordaten-Bereinigung
Datenanalyst- Hintergrund
- Ein IoT-Sensor liefert Temperaturdaten, die gelegentlich durch Übertragungsfehler unrealistische Spitzenwerte (z.B. 500°C) aufweisen.
- Problem
- Die Ausreißer verfälschen den Durchschnittswert der Messreihe.
- Verwendung
- CSV-Daten einfügen, Bereich für 'temperature' auf 0 bis 100 festlegen und die Strategie 'clip' wählen.
- Beispielkonfiguration
-
{"temperature": {"min": 0, "max": 100}} - Ergebnis
- Alle Werte über 100°C werden auf 100°C korrigiert, wodurch die statistische Auswertung stabil bleibt.
2. Validierung von Altersangaben
HR-Manager- Hintergrund
- In einer Mitarbeiterliste befinden sich fehlerhafte Altersangaben, die außerhalb des arbeitsfähigen Bereichs liegen.
- Problem
- Identifikation und Entfernung von Datensätzen mit ungültigen Altersangaben.
- Verwendung
- CSV-Daten hochladen, Bereich für 'age' auf 18 bis 67 setzen und die Strategie 'filter' wählen.
- Beispielkonfiguration
-
{"age": {"min": 18, "max": 67}} - Ergebnis
- Die Liste enthält nach der Verarbeitung nur noch valide Datensätze, während fehlerhafte Zeilen automatisch entfernt wurden.
Mit Samples testen
json, csv, videoVerwandte Hubs
FAQ
Was ist der Unterschied zwischen Clipping und Filtern?
Clipping setzt Werte, die außerhalb des Bereichs liegen, auf den jeweiligen Min- oder Max-Wert zurück. Filtern entfernt die gesamte Zeile, in der ein Wert außerhalb des Bereichs liegt.
Kann das Tool Spalten automatisch erkennen?
Ja, wenn Sie die Option 'Reasonable Bereiche automatisch erkennen' aktivieren, schlägt das Tool basierend auf der Datenverteilung sinnvolle Grenzwerte vor.
Bleiben meine Originaldaten erhalten?
Wenn Sie die Option 'Originale Spalten erhalten' wählen, werden die ursprünglichen Werte in neuen Spalten mit dem Suffix '_original' gespeichert.
Welche Formate werden unterstützt?
Das Tool ist für die Verarbeitung von CSV-Daten optimiert, die Sie direkt in das Textfeld kopieren können.
Erhalte ich eine Übersicht der Änderungen?
Ja, bei aktivierter Option 'Statistiken einbeziehen' generiert das Tool einen detaillierten Bericht über alle vorgenommenen Modifikationen.