Wichtige Fakten
- Kategorie
- Daten & Tabellen
- Eingabetypen
- textarea, select, text, checkbox
- Ausgabetyp
- text
- Sample-Abdeckung
- 4
- API verfügbar
- Yes
Überblick
Der Merkmals-Scaler ist ein Werkzeug zur Skalierung und Normalisierung numerischer Daten mit verschiedenen Methoden, das speziell für die Vorverarbeitung in maschinellen Lernprojekten und zur Datenstandardisierung entwickelt wurde.
Wann verwenden
- •Wenn numerische Merkmale für maschinelle Lernalgorithmen vorbereitet werden müssen, um die Modellleistung zu verbessern.
- •Zur Standardisierung von Daten mit unterschiedlichen Skalen und Einheiten für konsistente Analysen.
- •Bei der inversen Transformation von skalierten Daten zurück in den ursprünglichen Maßstab nach der Modellierung.
So funktioniert es
- •Geben Sie Ihre CSV-Daten in das Textfeld ein oder laden Sie eine Datei hoch, wobei die erste Zeile optional als Kopfzeile behandelt werden kann.
- •Wählen Sie eine Skalierungsmethode aus, wie Standard-Scaler (Z-score), Min-Max-Scaler oder Robuster Scaler, basierend auf Ihren Datenanforderungen.
- •Geben Sie optional die zu skalierenden Spalten durch Kommas getrennt an oder lassen Sie alle numerischen Spalten automatisch erkennen.
- •Konfigurieren Sie weitere Optionen wie das Ausgabeformat (CSV, JSON oder Textbericht) und ob Skalierungsparameter für inverse Transformationen gespeichert werden sollen.
Anwendungsfälle
Beispiele
1. Skalierung von Verkaufsdaten für maschinelles Lernen
- Hintergrund
- Ein Data Scientist arbeitet mit einem CSV-Datensatz, der Verkaufsmerkmale wie Umsatz, Transaktionsanzahl und Kundenzufriedenheit enthält.
- Problem
- Die Merkmale haben unterschiedliche Wertebereiche, was die Leistung eines Vorhersagemodells beeinträchtigt.
- Verwendung
- Laden Sie die CSV-Datei hoch, wählen Sie 'Standard-Scaler (Z-score)' als Methode und lassen Sie alle numerischen Spalten automatisch skalieren.
- Ergebnis
- Die Daten werden standardisiert (Mittelwert 0, Standardabweichung 1), was die Modelltrainingseffizienz verbessert.
2. Inverse Transformation von normalisierten Vorhersagen
- Hintergrund
- Ein Analyst hat zuvor Daten mit Min-Max-Scaler skaliert und ein ML-Modell trainiert, das skalierte Vorhersagen liefert.
- Problem
- Die Vorhersagen müssen in den ursprünglichen Wertebereich zurücktransformiert werden, um interpretierbar zu sein.
- Verwendung
- Aktivieren Sie 'Inverse Transformation', fügen Sie die gespeicherten Skalierungsparameter aus dem vorherigen Lauf ein und wählen Sie CSV als Ausgabeformat.
- Ergebnis
- Die Vorhersagen werden erfolgreich in den ursprünglichen Maßstab umgerechnet, ohne manuelle Berechnungen.
Mit Samples testen
csv, hashVerwandte Hubs
FAQ
Welche Skalierungsmethoden unterstützt das Tool?
Es unterstützt Standard-Scaler (Z-score), Min-Max-Scaler, Robuster Scaler, Max-Absolut-Scaler, Quantil-Scaler, Einheitsvektor-Scaler und Power-Transformation (Yeo-Johnson).
Kann ich nur bestimmte Spalten skalieren?
Ja, geben Sie die Spaltennamen durch Kommas getrennt im entsprechenden Feld an. Wenn leer, werden alle numerischen Spalten automatisch erkannt und skaliert.
Wie funktioniert die inverse Transformation?
Aktivieren Sie die Option 'Inverse Transformation' und fügen Sie die Skalierungsparameter aus einem vorherigen Lauf im JSON-Format ein, um skalierte Daten zurückzutransformieren.
Welche Ausgabeformate sind verfügbar?
Sie können die skalierten Daten im CSV-Format, JSON-Format oder als Textbericht zur direkten Anzeige ausgeben.
Was bewirkt die Option 'Nur skalierte Daten ausgeben'?
Wenn aktiviert, wird nur die skalierte CSV- oder JSON-Ausgabe ohne detaillierte Analyse erzeugt, was die Verarbeitung beschleunigt.