Wichtige Fakten
- Kategorie
- Data Analysis
- Eingabetypen
- textarea, select, text, number, checkbox
- Ausgabetyp
- text
- Sample-Abdeckung
- 4
- API verfügbar
- Yes
Überblick
Der Ausreißer-Detektor ist ein präzises Analysetool, mit dem Sie numerische Datensätze schnell auf Anomalien untersuchen können. Durch den Einsatz bewährter statistischer Verfahren wie IQR, Z-Score oder Isolation Forest identifizieren Sie fehlerhafte Messwerte oder signifikante Abweichungen in Ihren Datenreihen effizient und zuverlässig.
Wann verwenden
- •Zur Bereinigung von Datensätzen vor einer statistischen Auswertung.
- •Zur Identifizierung von Messfehlern oder ungewöhnlichen Datenpunkten in Finanz- oder Sensordaten.
- •Zur Validierung der Datenqualität bei der Vorbereitung von Machine-Learning-Modellen.
So funktioniert es
- •Geben Sie Ihre numerischen Daten in das Eingabefeld ein und wählen Sie das entsprechende Trennzeichen aus.
- •Wählen Sie eine statistische Methode wie IQR oder Z-Score aus, die am besten zu Ihrer Datenverteilung passt.
- •Passen Sie bei Bedarf die Empfindlichkeitsschwelle an, um die Strenge der Ausreißer-Erkennung zu steuern.
- •Starten Sie die Analyse und wählen Sie ein Ausgabeformat, um die identifizierten Anomalien übersichtlich zu betrachten.
Anwendungsfälle
Beispiele
1. Bereinigung von Sensordaten
Datenanalyst- Hintergrund
- Ein Sensor liefert kontinuierlich Temperaturwerte, enthält jedoch gelegentlich fehlerhafte Spitzenwerte durch Übertragungsstörungen.
- Problem
- Die fehlerhaften Messwerte verfälschen den Durchschnittswert der gesamten Messreihe.
- Verwendung
- Daten einfügen, 'IQR' als Methode wählen und die Empfindlichkeit auf 1.5 setzen.
- Beispielkonfiguration
-
Methode: IQR, Empfindlichkeit: 1.5, Ausgabe: Tabelle - Ergebnis
- Die fehlerhaften Temperaturspitzen werden als Ausreißer markiert und können gezielt aus dem Datensatz entfernt werden.
2. Finanzielle Anomalieerkennung
Buchhalter- Hintergrund
- Eine Liste von monatlichen Ausgaben enthält ungewöhnlich hohe Beträge, die manuell geprüft werden müssen.
- Problem
- Manuelle Suche nach Ausreißern in einer Liste mit über 500 Einträgen ist fehleranfällig.
- Verwendung
- Daten als Liste einfügen, 'Z-Score' Methode wählen und statistische Details aktivieren.
- Beispielkonfiguration
-
Methode: Z-Score, Empfindlichkeit: 2.0, Statistik: Ein - Ergebnis
- Alle Ausgaben, die mehr als zwei Standardabweichungen vom Mittelwert abweichen, werden sofort identifiziert.
Mit Samples testen
markdown, qrVerwandte Hubs
FAQ
Welche Methode eignet sich am besten für meine Daten?
Der IQR-Ansatz ist robust bei normalverteilten Daten, während der Z-Score bei großen Datensätzen gut funktioniert. Für komplexe oder nicht-lineare Daten sind Methoden wie der Isolationswald besser geeignet.
Was bewirkt die Empfindlichkeitsschwelle?
Die Schwelle bestimmt, wie weit ein Wert vom Durchschnitt abweichen muss, um als Ausreißer markiert zu werden. Ein niedrigerer Wert führt zu einer strengeren Erkennung.
Kann ich eigene Trennzeichen für meine Daten verwenden?
Ja, wählen Sie im Feld 'Daten-Trennzeichen' die Option 'Benutzerdefiniert' und geben Sie Ihr spezifisches Zeichen im entsprechenden Feld ein.
Werden meine Daten auf dem Server gespeichert?
Nein, die Datenverarbeitung erfolgt direkt in Ihrem Browser, wodurch Ihre Daten vertraulich bleiben.
Welche Ausgabeformate stehen zur Verfügung?
Sie können zwischen einer Zusammenfassung, einer detaillierten Tabelle, einer visuellen Darstellung oder einem JSON-Format wählen.