Wichtige Fakten
- Kategorie
- Data Processing
- Eingabetypen
- textarea, select, text, checkbox, number
- Ausgabetyp
- text
- Sample-Abdeckung
- 4
- API verfügbar
- Yes
Überblick
Der Z-Score Normalisierer transformiert Ihre numerischen Datensätze präzise, indem er Werte auf einen Mittelwert von 0 und eine Standardabweichung von 1 skaliert, um sie für statistische Analysen oder Machine-Learning-Modelle vergleichbar zu machen.
Wann verwenden
- •Wenn Sie Daten mit unterschiedlichen Skalen für Machine-Learning-Algorithmen vergleichbar machen müssen.
- •Zur Identifizierung von Ausreißern in großen Datensätzen durch statistische Schwellenwerte.
- •Wenn Sie statistische Hypothesentests durchführen, die normalverteilte Daten voraussetzen.
So funktioniert es
- •Laden Sie Ihre CSV-Daten in das Eingabefeld hoch oder fügen Sie diese direkt ein.
- •Wählen Sie die Zielspalten aus oder lassen Sie das Tool automatisch alle numerischen Spalten erkennen.
- •Konfigurieren Sie bei Bedarf die Behandlung fehlender Werte und wählen Sie zwischen Standard- oder robustem Z-Score.
- •Starten Sie die Berechnung, um die normalisierten Daten sowie eine statistische Zusammenfassung zu erhalten.
Anwendungsfälle
Beispiele
1. Vorbereitung von Kundendaten für Clustering
Datenanalyst- Hintergrund
- Ein Datensatz enthält Kundenalter und jährliches Einkommen in völlig unterschiedlichen Wertebereichen.
- Problem
- Die unterschiedlichen Skalen führen dazu, dass das Einkommen die Distanzberechnung im Clustering-Algorithmus dominiert.
- Verwendung
- CSV-Daten einfügen, 'age' und 'salary' als Zielspalten wählen und Z-Score Standardisierung anwenden.
- Beispielkonfiguration
-
standardizationType: zscore, targetColumns: age, salary - Ergebnis
- Beide Merkmale haben nun einen Mittelwert von 0 und eine Standardabweichung von 1, was eine faire Gewichtung im Algorithmus ermöglicht.
2. Ausreißer-Detektion in Sensordaten
Ingenieur- Hintergrund
- Ein Sensor liefert kontinuierlich Temperaturwerte, wobei gelegentlich fehlerhafte Messspitzen auftreten.
- Problem
- Manuelle Suche nach Messfehlern in tausenden Zeilen ist ineffizient.
- Verwendung
- Sensordaten hochladen, 'Ausreißer Erkennen' aktivieren und Schwelle auf 3 Standardabweichungen setzen.
- Beispielkonfiguration
-
detectOutliers: true, outlierThreshold: 3 - Ergebnis
- Das Tool identifiziert und markiert automatisch alle Messwerte, die mehr als 3 Standardabweichungen vom Mittelwert abweichen.
Mit Samples testen
csv, video, barcodeVerwandte Hubs
FAQ
Was ist der Unterschied zwischen Z-Score und robustem Z-Score?
Der Standard Z-Score nutzt Mittelwert und Standardabweichung, während der robuste Z-Score auf Median und Median Absolute Deviation (MAD) basiert, was ihn unempfindlicher gegenüber Ausreißern macht.
Wie werden fehlende Werte behandelt?
Sie können wählen, ob Zeilen mit fehlenden Werten übersprungen werden oder ob diese durch den Mittelwert, Median, Modus oder Null ersetzt werden sollen.
Kann ich die Originalspalten behalten?
Ja, aktivieren Sie einfach die Option 'Originale Spalten Erhalten', um die transformierten Werte zusätzlich zu Ihren ursprünglichen Daten in der Ergebnistabelle zu sehen.
Wie erkennt das Tool Ausreißer?
Das Tool markiert Werte als Ausreißer, wenn sie die definierte Standardabweichungs-Schwelle (Standardwert: 2) über- oder unterschreiten.
Ist das Tool für große Datensätze geeignet?
Ja, das Tool ist für die effiziente Verarbeitung numerischer Tabellendaten optimiert und liefert präzise Ergebnisse für statistische Vorverarbeitungsschritte.