Points clés
- Catégorie
- Data Processing
- Types d’entrée
- textarea, select, text, checkbox, number
- Type de sortie
- text
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Le Normalisateur Z-Score est un outil puissant conçu pour transformer vos données numériques en une échelle standardisée, avec une moyenne de 0 et un écart-type de 1. Il est essentiel pour préparer vos jeux de données au machine learning, faciliter les analyses statistiques comparatives et identifier efficacement les valeurs aberrantes au sein de vos séries de mesures.
Quand l’utiliser
- •Avant d'entraîner des modèles de machine learning sensibles à l'échelle des données.
- •Pour comparer des variables exprimées dans des unités de mesure différentes.
- •Pour détecter et isoler statistiquement les valeurs aberrantes dans un ensemble de données.
Comment ça marche
- •Copiez-collez vos données au format CSV dans la zone de saisie prévue.
- •Sélectionnez les colonnes cibles ou laissez l'outil détecter automatiquement les données numériques.
- •Choisissez votre méthode de standardisation (Z-Score classique ou robuste) et configurez le traitement des valeurs manquantes.
- •Lancez le calcul pour obtenir vos données normalisées accompagnées d'un rapport statistique complet.
Cas d’usage
Exemples
1. Standardisation pour Machine Learning
Data Scientist- Contexte
- Un modèle de régression doit être entraîné sur des données de salaires et d'âges, dont les échelles diffèrent radicalement.
- Problème
- Les disparités d'échelle empêchent le modèle de converger correctement.
- Comment l’utiliser
- Coller le CSV, sélectionner les colonnes 'age' et 'salary', choisir 'Z-Score' et définir 4 décimales.
- Configuration d’exemple
-
standardizationType: zscore, decimalPlaces: 4 - Résultat
- Les données sont ramenées à une moyenne de 0 et un écart-type de 1, permettant une convergence rapide du modèle.
2. Détection d'anomalies dans des mesures
Analyste Qualité- Contexte
- Une série de mesures de production contient des variations normales et quelques erreurs de capteur extrêmes.
- Problème
- Identifier rapidement les mesures qui s'écartent trop de la norme.
- Comment l’utiliser
- Charger les mesures, activer 'Détecter les valeurs aberrantes' avec un seuil de 2.5.
- Configuration d’exemple
-
detectOutliers: true, outlierThreshold: 2.5 - Résultat
- Les mesures dépassant 2.5 écarts-types sont signalées, permettant de filtrer les erreurs de capteur.
Tester avec des échantillons
csv, video, barcodeHubs associés
FAQ
Qu'est-ce que le Z-Score ?
Le Z-Score indique de combien d'écarts-types un point de données s'éloigne de la moyenne de l'ensemble.
Quelle est la différence entre Z-Score et Z-Score Robuste ?
Le Z-Score classique utilise la moyenne et l'écart-type, tandis que le Z-Score robuste utilise la médiane et l'écart absolu à la médiane (MAD), ce qui le rend moins sensible aux valeurs extrêmes.
Que deviennent les valeurs manquantes ?
Vous pouvez choisir de les ignorer, ou de les remplacer automatiquement par la moyenne, la médiane, le mode ou zéro.
Puis-je conserver mes colonnes non numériques ?
Oui, l'option 'Conserver les colonnes originales' permet de garder vos données textuelles ou catégorielles intactes dans le résultat final.
Comment l'outil détecte-t-il les valeurs aberrantes ?
L'outil marque les valeurs dépassant le seuil d'écarts-types que vous avez défini, facilitant ainsi leur identification rapide.