Merkmals-Scaler

Wichtige Fakten

Kategorie: Daten & Tabellen
Eingabetypen: textarea, select, text, checkbox
Ausgabetyp: text
Sample-Abdeckung: 4
API verfügbar: Yes

Überblick

Der Merkmals-Scaler ist ein Werkzeug zur Skalierung und Normalisierung numerischer Daten mit verschiedenen Methoden, das speziell für die Vorverarbeitung in maschinellen Lernprojekten und zur Datenstandardisierung entwickelt wurde.

Wann verwenden

•Wenn numerische Merkmale für maschinelle Lernalgorithmen vorbereitet werden müssen, um die Modellleistung zu verbessern.
•Zur Standardisierung von Daten mit unterschiedlichen Skalen und Einheiten für konsistente Analysen.
•Bei der inversen Transformation von skalierten Daten zurück in den ursprünglichen Maßstab nach der Modellierung.

So funktioniert es

•Geben Sie Ihre CSV-Daten in das Textfeld ein oder laden Sie eine Datei hoch, wobei die erste Zeile optional als Kopfzeile behandelt werden kann.
•Wählen Sie eine Skalierungsmethode aus, wie Standard-Scaler (Z-score), Min-Max-Scaler oder Robuster Scaler, basierend auf Ihren Datenanforderungen.
•Geben Sie optional die zu skalierenden Spalten durch Kommas getrennt an oder lassen Sie alle numerischen Spalten automatisch erkennen.
•Konfigurieren Sie weitere Optionen wie das Ausgabeformat (CSV, JSON oder Textbericht) und ob Skalierungsparameter für inverse Transformationen gespeichert werden sollen.

Anwendungsfälle

Vorbereitung von Datensätzen für neuronale Netzwerke oder andere ML-Modelle, um die Konvergenz und Genauigkeit zu erhöhen.

Normalisierung von Sensordaten in IoT-Anwendungen, um Messwerte unterschiedlicher Geräte vergleichbar zu machen.

Standardisierung von Finanz- oder Verkaufsdaten für Berichte und Dashboards, um Trends besser zu erkennen.

Beispiele

1. Skalierung von Verkaufsdaten für maschinelles Lernen

Hintergrund: Ein Data Scientist arbeitet mit einem CSV-Datensatz, der Verkaufsmerkmale wie Umsatz, Transaktionsanzahl und Kundenzufriedenheit enthält.
Problem: Die Merkmale haben unterschiedliche Wertebereiche, was die Leistung eines Vorhersagemodells beeinträchtigt.
Verwendung: Laden Sie die CSV-Datei hoch, wählen Sie 'Standard-Scaler (Z-score)' als Methode und lassen Sie alle numerischen Spalten automatisch skalieren.
Ergebnis: Die Daten werden standardisiert (Mittelwert 0, Standardabweichung 1), was die Modelltrainingseffizienz verbessert.

2. Inverse Transformation von normalisierten Vorhersagen

Hintergrund: Ein Analyst hat zuvor Daten mit Min-Max-Scaler skaliert und ein ML-Modell trainiert, das skalierte Vorhersagen liefert.
Problem: Die Vorhersagen müssen in den ursprünglichen Wertebereich zurücktransformiert werden, um interpretierbar zu sein.
Verwendung: Aktivieren Sie 'Inverse Transformation', fügen Sie die gespeicherten Skalierungsparameter aus dem vorherigen Lauf ein und wählen Sie CSV als Ausgabeformat.
Ergebnis: Die Vorhersagen werden erfolgreich in den ursprünglichen Maßstab umgerechnet, ohne manuelle Berechnungen.

Mit Samples testen

csv, hash

CSV Beispiele

CSV-Beispieldateien mit verschiedenen Datentypen, Größen und Komplexitätsstufen

preferred input family csv

csv

Regex-Ersetzungsbeispiele

Sammlung häufiger und nützlicher Regex-Ersetzungsmuster für Texttransformation und Datenbereinigung

preferred input family csv

csv

Beispiele für Doppelte Zeilen

Beispieldateien mit verschiedenen Arten doppelter Zeilen zum Testen von Tools zum Entfernen von Duplikaten

preferred input family csv

csv

Python Beispiele

Python Code-Beispiele und Hello World Demonstrationen

preferred input family csv

csv

FAQ

Welche Skalierungsmethoden unterstützt das Tool?

Es unterstützt Standard-Scaler (Z-score), Min-Max-Scaler, Robuster Scaler, Max-Absolut-Scaler, Quantil-Scaler, Einheitsvektor-Scaler und Power-Transformation (Yeo-Johnson).

Kann ich nur bestimmte Spalten skalieren?

Ja, geben Sie die Spaltennamen durch Kommas getrennt im entsprechenden Feld an. Wenn leer, werden alle numerischen Spalten automatisch erkannt und skaliert.

Wie funktioniert die inverse Transformation?

Aktivieren Sie die Option 'Inverse Transformation' und fügen Sie die Skalierungsparameter aus einem vorherigen Lauf im JSON-Format ein, um skalierte Daten zurückzutransformieren.

Welche Ausgabeformate sind verfügbar?

Sie können die skalierten Daten im CSV-Format, JSON-Format oder als Textbericht zur direkten Anzeige ausgeben.

Was bewirkt die Option 'Nur skalierte Daten ausgeben'?

Wenn aktiviert, wird nur die skalierte CSV- oder JSON-Ausgabe ohne detaillierte Analyse erzeugt, was die Verarbeitung beschleunigt.

Parameter-Name	Typ	Erforderlich	Beschreibung
csvData	textarea	Ja	-
scalingMethod	select	Ja	-
selectedColumns	text	Nein	Geben Sie an, welche Spalten skaliert werden sollen. Wenn leer, werden alle numerischen Spalten automatisch erkannt und skaliert.
scalingParams	textarea	Nein	Nur für inverse Transformation erforderlich. Fügen Sie die Skalierungsparameter aus einem vorherigen Lauf ein.
hasHeader	checkbox	Nein	Erste Zeile als Spaltenköpfe behandeln
inverseTransform	checkbox	Nein	Inverse Transformation mit bereitgestellten Parametern anwenden
outputFormat	select	Ja	-
saveParams	checkbox	Nein	Skalierungsparameter in der Ausgabe für zukünftige inverse Transformationen einschließen
scaledOnly	checkbox	Nein	Detaillierte Analyse überspringen und nur skalierte Daten ausgeben

Wichtige Fakten

Überblick

Wann verwenden

So funktioniert es

Anwendungsfälle

Beispiele

1. Skalierung von Verkaufsdaten für maschinelles Lernen

2. Inverse Transformation von normalisierten Vorhersagen

Mit Samples testen

Verwandte Hubs

FAQ

API-Dokumentation

Request-Endpunkt

Request-Parameter

Antwortformat

MCP-Dokumentation

Merkmals-Scaler

Wichtige Fakten

Überblick

Wann verwenden

So funktioniert es

Anwendungsfälle

Beispiele

1. Skalierung von Verkaufsdaten für maschinelles Lernen

2. Inverse Transformation von normalisierten Vorhersagen

Mit Samples testen

Verwandte Hubs

Verwandte Tools

FAQ

API-Dokumentation

Request-Endpunkt

Request-Parameter

Antwortformat

MCP-Dokumentation