Wichtige Fakten
- Kategorie
- Data Processing
- Eingabetypen
- textarea, text, select, checkbox, number
- Ausgabetyp
- text
- Sample-Abdeckung
- 4
- API verfügbar
- Yes
Überblick
Der Min-Max Normalisierer transformiert numerische Datensätze präzise in einen definierten Wertebereich, typischerweise zwischen 0 und 1. Dieses Tool ist essenziell für die Vorverarbeitung von Daten im Machine Learning, um unterschiedliche Skalierungen vergleichbar zu machen und die Konvergenz von Algorithmen zu verbessern.
Wann verwenden
- •Vorbereitung von Datensätzen für Machine-Learning-Modelle, die empfindlich auf unterschiedliche Skalierungen reagieren.
- •Harmonisierung von Daten aus verschiedenen Quellen, um eine faire Vergleichbarkeit in der statistischen Analyse zu gewährleisten.
- •Optimierung der Eingabedaten für neuronale Netze, um die Trainingsgeschwindigkeit und Stabilität zu erhöhen.
So funktioniert es
- •Laden Sie Ihre CSV-Daten in das Eingabefeld hoch oder fügen Sie diese direkt ein.
- •Wählen Sie die Zielspalten aus, die normalisiert werden sollen, und definieren Sie bei Bedarf einen benutzerdefinierten Ausgabebereich.
- •Konfigurieren Sie die Behandlung fehlender Werte und legen Sie die gewünschte Anzahl an Dezimalstellen fest.
- •Starten Sie den Prozess, um die skalierten Daten sowie optional eine statistische Zusammenfassung zu erhalten.
Anwendungsfälle
Beispiele
1. Vorbereitung von Immobilienpreisen für ML
Data Scientist- Hintergrund
- Ein Datensatz enthält Hauspreise und Quadratmeterzahlen in völlig unterschiedlichen Größenordnungen.
- Problem
- Die großen Unterschiede in den Skalen führen zu einer langsamen Konvergenz des Regressionsmodells.
- Verwendung
- CSV-Daten einfügen, die Spalten 'preis' und 'quadratmeter' auswählen und die Min-Max-Normalisierung auf den Bereich 0-1 anwenden.
- Beispielkonfiguration
-
targetColumns: preis, quadratmeter; outputRange: 0, 1; decimalPlaces: 4 - Ergebnis
- Alle Werte liegen nun zwischen 0 und 1, was das Training des Modells deutlich beschleunigt und die Genauigkeit verbessert.
2. Normalisierung von Kunden-KPIs
Business Analyst- Hintergrund
- Vergleich von Kundenaktivitäten wie 'Anzahl Logins' und 'Umsatz' in einem Dashboard.
- Problem
- Die 'Anzahl Logins' (0-50) ist im Vergleich zum 'Umsatz' (0-10.000) kaum sichtbar.
- Verwendung
- Daten hochladen, beide Spalten für die Normalisierung auswählen und die Option 'Statistiken Einbeziehen' aktivieren.
- Beispielkonfiguration
-
targetColumns: logins, umsatz; includeStatistics: true - Ergebnis
- Beide Metriken sind nun auf einer einheitlichen Skala von 0 bis 1 vergleichbar, was die Visualisierung im Dashboard erleichtert.
Mit Samples testen
csvVerwandte Hubs
FAQ
Was bewirkt die Min-Max-Normalisierung?
Sie skaliert numerische Daten linear auf einen festen Bereich, meist zwischen 0 und 1, wobei der kleinste Wert zu 0 und der größte zu 1 wird.
Wie werden fehlende Werte behandelt?
Sie können wählen, ob Zeilen mit fehlenden Werten übersprungen oder durch statistische Kennzahlen wie Mittelwert, Median, Minimum oder Maximum ersetzt werden sollen.
Kann ich den Zielbereich selbst festlegen?
Ja, Sie können im Feld 'Ausgabebereich' eigene Grenzen definieren, beispielsweise -1 bis 1, anstatt des Standardbereichs von 0 bis 1.
Bleiben nicht-numerische Spalten erhalten?
Ja, durch die Option 'Originale Spalten Erhalten' können Sie sicherstellen, dass nicht-numerische Daten unverändert in Ihrem Datensatz verbleiben.
Warum ist dieses Tool für Machine Learning wichtig?
Viele Algorithmen gewichten Merkmale mit größeren Zahlenbereichen stärker. Die Normalisierung stellt sicher, dass alle Features gleichberechtigt in das Modell einfließen.