Points clés
- Catégorie
- Données et tableaux
- Types d’entrée
- textarea, select, text, checkbox
- Type de sortie
- text
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Le Metteur à l'échelle des Caractéristiques est un outil essentiel pour le prétraitement de vos données, permettant de normaliser ou de standardiser vos variables numériques afin d'optimiser les performances de vos modèles d'apprentissage automatique.
Quand l’utiliser
- •Avant d'entraîner un modèle d'apprentissage automatique sensible aux échelles de données.
- •Lorsque vos variables possèdent des unités de mesure ou des ordres de grandeur très différents.
- •Pour préparer des jeux de données hétérogènes à une analyse statistique comparative.
Comment ça marche
- •Copiez et collez vos données au format CSV dans la zone de saisie dédiée.
- •Sélectionnez la méthode de mise à l'échelle appropriée, telle que Z-score, Min-Max ou Robuste.
- •Configurez les options de colonnes et le format de sortie souhaité.
- •Lancez le traitement pour obtenir vos données normalisées prêtes à l'emploi.
Cas d’usage
Exemples
1. Normalisation Min-Max pour un modèle de clustering
Data Scientist- Contexte
- Un ensemble de données contient des colonnes 'Âge' (0-100) et 'Revenu' (0-100 000). Les différences d'échelle faussent les calculs de distance.
- Problème
- Les variables à grande échelle dominent le calcul, rendant le clustering inefficace.
- Comment l’utiliser
- Sélectionner la méthode 'Metteur Min-Max', charger le CSV, et valider pour obtenir des données normalisées entre 0 et 1.
- Résultat
- Les deux variables sont désormais sur la même échelle, permettant au modèle de clustering de traiter chaque caractéristique avec le même poids.
2. Standardisation Z-score pour une régression
Analyste de données- Contexte
- Les données de capteurs présentent des distributions normales mais des moyennes et écarts-types disparates.
- Problème
- La convergence du modèle de régression est lente en raison de l'hétérogénéité des échelles.
- Comment l’utiliser
- Utiliser la méthode 'Metteur Standard (Z-score)' pour centrer les données autour de zéro avec un écart-type unitaire.
- Résultat
- Le modèle converge plus rapidement et les coefficients de régression deviennent directement comparables.
Tester avec des échantillons
csv, hashHubs associés
FAQ
Quelle méthode choisir entre Standard et Min-Max ?
Utilisez Standard (Z-score) si vos données suivent une distribution normale, et Min-Max si vous souhaitez borner vos valeurs dans un intervalle fixe, typiquement [0, 1].
Que fait le Metteur Robuste ?
Le Metteur Robuste utilise la médiane et l'écart interquartile, ce qui le rend beaucoup moins sensible aux valeurs aberrantes (outliers) que les autres méthodes.
Puis-je inverser la transformation effectuée ?
Oui, en cochant 'Transformation Inverse' et en fournissant les paramètres JSON sauvegardés lors de la première exécution.
L'outil détecte-t-il automatiquement les colonnes numériques ?
Oui, si vous laissez le champ 'Colonnes à Mettre à l'échelle' vide, l'outil identifiera et traitera automatiquement toutes les colonnes contenant des valeurs numériques.
Quels formats de sortie sont supportés ?
Vous pouvez obtenir vos résultats sous forme de fichier CSV, de structure JSON ou simplement via un rapport textuel affiché directement dans l'interface.