Welche Dateiformate werden unterstützt?

Das Tool verarbeitet CSV- und JSON-Dateien. Sie können Daten auch direkt als CSV-Text in das Eingabefeld einfügen.

Was ist der Unterschied zwischen Oversampling und Undersampling?

Oversampling dupliziert Zeilen der Minderheitsklasse, bis sie der Mehrheitsklasse entsprechen. Undersampling reduziert die Mehrheitsklasse auf die Größe der Minderheitsklasse.

Werden meine Daten auf dem Server gespeichert?

Nein, die gesamte Verarbeitung und das Resampling erfolgen lokal in Ihrem Browser. Es werden keine Daten hochgeladen.

Kann ich die balancierten Daten exportieren?

Ja, Sie können das Ergebnis als JSON oder CSV in der Vorschau anzeigen und für Ihre ML-Pipeline kopieren.

Ersetzt dieses Tool SMOTE?

Nein, es nutzt einfaches Duplizieren oder Kürzen. Es hilft jedoch bei der Entscheidung, ob komplexere Methoden wie SMOTE später sinnvoll sind.

Elysia Tools

Mobile Navigation

Data Analysis

Datensatz-Imbalance-Detektor und Resampler

Erkennt Klassenungleichgewicht in CSV- oder JSON-Datensaetzen, vergleicht Strategien und zeigt ein balanciertes Ergebnis

Einzelheiten

Wobei dieses Tool hilft

Fuegen Sie einen CSV-Datensatz ein oder laden Sie eine CSV-/JSON-Datei hoch und waehlen Sie dann die Label-Spalte. Das Tool zaehlt jede Klasse, misst das Ungleichgewicht, schlaegt Oversampling oder Undersampling vor und erzeugt eine balancierte Vorschau.

So wird es genutzt:

Datensatz-Eingabe: CSV fuer eine schnelle Analyse einfuegen
Datendatei: CSV oder JSON hochladen
Label-Spalte: Zielklasse angeben
Resampling-Strategie: none, oversample oder undersample
Exportformat: Vorschau als JSON oder CSV
Vorschauzeilen: begrenzt die angezeigten balancierten Zeilen

Hinweise:

Oversampling dupliziert Minderheitszeilen bis zur Mehrheitsgroesse
Undersampling kuerzt Mehrheitszeilen auf die Minderheitsgroesse
Der Bericht vergleicht beide Strategien
So laesst sich besser entscheiden, ob spaeter SMOTE sinnvoll ist

Ausführung

Dieses Tool ausführen

Fülle das Formular aus, starte das Tool und prüfe das Ergebnis an einem Ort.

Vorbereitete Beispielausführungen

Klicken Sie auf ein Beispiel, um das Formular automatisch auszufüllen. Dateien müssen weiterhin hochgeladen werden.

1 Beispiele

Einen Betrugsdatensatz mit 95:5-Verteilung pruefen

Misst die Klassenverzerrung, vergleicht Strategien und exportiert eine balancierte Vorschau.

<div>Original distribution</div>

Eingaben

Fülle die erforderlichen Felder aus und starte das Tool.

6 Optionen

DateienQuelldateien für diesen Workflow hochladen.1

DatendateifileOptionales Feld

Maximale Größe pro Datei: 20 MBUnterstützte Typen: text/csv, application/json, text/plain, .csv, .json

InhaltHaupteingaben einfügen oder eingeben.2

Datensatz-EingabetextareaOptionales FeldLabel-SpaltetextPflicht

EinstellungenFormate, Bereiche, Zahlen und Modi anpassen.3

Resampling-StrategieselectOptionales FeldExportformatselectOptionales FeldVorschauzeilennumberOptionales Feld

Ergebnis

Bereit zum Start

Nach dem Ausführen erscheinen hier Dateien, Text, strukturierte Daten oder Stream-Ausgaben.

Beispiele

Beispiele zu diesem Tool

Verwandt

Datensatz-Imbalance-Detektor und Resampler

Wobei dieses Tool hilft

Dieses Tool ausführen

Vorbereitete Beispielausführungen

Eingaben

Ergebnis

Beispiele zu diesem Tool

Mit verwandten Tools und Themen fortfahren

Vorbereitete Beispielausführungen

Eingaben

Ergebnis

Erfahren Sie, wann dieses Tool passt, was es unterstützt und wie Nutzer es anwenden.

Wichtige Fakten

Überblick

Wann verwenden

So funktioniert es

Anwendungsfälle

Beispiele

1. Ausgleich eines Betrugsdatensatzes

2. Reduzierung dominanter Klassen in Churn-Daten

FAQ

CSV Beispiele

Python Beispiele

Distributed Tracing Beispiele

JWT-Beispiele

Zeitreihen-Anomalie-Detektor

Datensatzqualitaets-Profiler

Mock-Data-Praefix- und Abkuerzungs-Konfliktdetektor

Zeitreihen-Prognose- und Saisonalitaetsanalyse

Tools fur JSON-Austausch und Format-Ubersetzung

Textfall-, Encoding- und Normalisierungs-Konvertierungs-Tools

Werkzeuge fur JSON-Inspektion, Diff und Transformation

Tools fur CSV-Export und Tabellenkonvertierung