Metteur à l'échelle des Caractéristiques

Mettre à l'échelle et normaliser les caractéristiques en utilisant diverses méthodes pour le prétraitement d'apprentissage automatique et la standardisation des données

Tags associés

Traitement de données 125 Mise à l'échelle 14 Score Z 10 Machine Learning 9 Prétraitement de données 7

CSV Data Input *

Méthode de Mise à l'échelle *

Colonnes à Mettre à l'échelle (optionnel)

Spécifiez quelles colonnes mettre à l'échelle. Si vide, toutes les colonnes numériques seront détectées et mises à l'échelle automatiquement.

Paramètres de Mise à l'échelle (pour transformation inverse)

Requis uniquement pour la transformation inverse. Collez les paramètres de mise à l'échelle d'une exécution précédente.

Première Ligne Contient les En-têtes

Traiter la première ligne comme en-têtes de colonne

Transformation Inverse

Appliquer la transformation inverse en utilisant les paramètres fournis

Format de Sortie *

Sauvegarder les Paramètres de Mise à l'échelle

Inclure les paramètres de mise à l'échelle dans la sortie pour les transformations inverses futures

Uniquement les Données Mises à l'échelle

Ignorer l'analyse détaillée et afficher uniquement les données mises à l'échelle

Points clés

Catégorie: Données et tableaux
Types d’entrée: textarea, select, text, checkbox
Type de sortie: text
Couverture des échantillons: 4
API disponible: Yes

Vue d’ensemble

Le Metteur à l'échelle des Caractéristiques est un outil essentiel pour le prétraitement de vos données, permettant de normaliser ou de standardiser vos variables numériques afin d'optimiser les performances de vos modèles d'apprentissage automatique.

Quand l’utiliser

•Avant d'entraîner un modèle d'apprentissage automatique sensible aux échelles de données.
•Lorsque vos variables possèdent des unités de mesure ou des ordres de grandeur très différents.
•Pour préparer des jeux de données hétérogènes à une analyse statistique comparative.

Comment ça marche

•Copiez et collez vos données au format CSV dans la zone de saisie dédiée.
•Sélectionnez la méthode de mise à l'échelle appropriée, telle que Z-score, Min-Max ou Robuste.
•Configurez les options de colonnes et le format de sortie souhaité.
•Lancez le traitement pour obtenir vos données normalisées prêtes à l'emploi.

Cas d’usage

Préparation de datasets pour des algorithmes de clustering comme K-Means.

Normalisation de variables financières pour des modèles de régression linéaire.

Standardisation de mesures physiques pour des réseaux de neurones profonds.

Exemples

1. Normalisation Min-Max pour un modèle de clustering

Data Scientist

Contexte: Un ensemble de données contient des colonnes 'Âge' (0-100) et 'Revenu' (0-100 000). Les différences d'échelle faussent les calculs de distance.
Problème: Les variables à grande échelle dominent le calcul, rendant le clustering inefficace.
Comment l’utiliser: Sélectionner la méthode 'Metteur Min-Max', charger le CSV, et valider pour obtenir des données normalisées entre 0 et 1.
Résultat: Les deux variables sont désormais sur la même échelle, permettant au modèle de clustering de traiter chaque caractéristique avec le même poids.

2. Standardisation Z-score pour une régression

Analyste de données

Contexte: Les données de capteurs présentent des distributions normales mais des moyennes et écarts-types disparates.
Problème: La convergence du modèle de régression est lente en raison de l'hétérogénéité des échelles.
Comment l’utiliser: Utiliser la méthode 'Metteur Standard (Z-score)' pour centrer les données autour de zéro avec un écart-type unitaire.
Résultat: Le modèle converge plus rapidement et les coefficients de régression deviennent directement comparables.

Tester avec des échantillons

csv, hash

Exemples CSV

Fichiers CSV d'exemple avec divers types de données, tailles et niveaux de complexité

preferred input family csv

csv

Exemples de Remplacement Regex

Collection de modèles de remplacement regex courants et utiles pour la transformation de texte et le nettoyage de données

preferred input family csv

csv

Exemples de Lignes en Double

Fichiers d'échantillon avec divers types de lignes en double pour tester les outils de suppression des doublons

preferred input family csv

csv

Exemples Python

Exemples de code Python et démonstrations Hello World

preferred input family csv

csv

Hubs associés

Outils d export CSV et de conversion de tableaux

Comparez les conversions entre CSV et Excel, JSON, HTML, Markdown, XML et texte dans un meme hub pour les flux d echange tabulaire.

Outils de nettoyage et de reorganisation CSV

Regroupe dans un meme hub les outils de nettoyage CSV, filtrage, tri, regroupement, fusion, decoupage et reorganisation de tableaux pour les workflows tableur et import/export.

Outils de qualite des donnees, deduplication et detection d anomalies

Profilez des jeux de donnees CSV/JSON, comparez des versions de tableurs et reperez doublons, valeurs aberrantes, manques, ruptures relationnelles et anomalies temporelles dans un meme hub.

FAQ

Quelle méthode choisir entre Standard et Min-Max ?

Utilisez Standard (Z-score) si vos données suivent une distribution normale, et Min-Max si vous souhaitez borner vos valeurs dans un intervalle fixe, typiquement [0, 1].

Que fait le Metteur Robuste ?

Le Metteur Robuste utilise la médiane et l'écart interquartile, ce qui le rend beaucoup moins sensible aux valeurs aberrantes (outliers) que les autres méthodes.

Puis-je inverser la transformation effectuée ?

Oui, en cochant 'Transformation Inverse' et en fournissant les paramètres JSON sauvegardés lors de la première exécution.

L'outil détecte-t-il automatiquement les colonnes numériques ?

Oui, si vous laissez le champ 'Colonnes à Mettre à l'échelle' vide, l'outil identifiera et traitera automatiquement toutes les colonnes contenant des valeurs numériques.

Quels formats de sortie sont supportés ?

Vous pouvez obtenir vos résultats sous forme de fichier CSV, de structure JSON ou simplement via un rapport textuel affiché directement dans l'interface.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/feature-scaler

Paramètres de la requête

Nom du paramètre	Type	Requis	Description
csvData	textarea	Oui	-
scalingMethod	select	Oui	-
selectedColumns	text	Non	Spécifiez quelles colonnes mettre à l'échelle. Si vide, toutes les colonnes numériques seront détectées et mises à l'échelle automatiquement.
scalingParams	textarea	Non	Requis uniquement pour la transformation inverse. Collez les paramètres de mise à l'échelle d'une exécution précédente.
hasHeader	checkbox	Non	Traiter la première ligne comme en-têtes de colonne
inverseTransform	checkbox	Non	Appliquer la transformation inverse en utilisant les paramètres fournis
outputFormat	select	Oui	-
saveParams	checkbox	Non	Inclure les paramètres de mise à l'échelle dans la sortie pour les transformations inverses futures
scaledOnly	checkbox	Non	Ignorer l'analyse détaillée et afficher uniquement les données mises à l'échelle

Format de réponse

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}

Texte: Texte

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-feature-scaler": {
      "name": "feature-scaler",
      "description": "Mettre à l'échelle et normaliser les caractéristiques en utilisant diverses méthodes pour le prétraitement d'apprentissage automatique et la standardisation des données",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=feature-scaler",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]

Metteur à l'échelle des Caractéristiques

Points clés

Vue d’ensemble

Quand l’utiliser

Comment ça marche

Cas d’usage

Exemples

1. Normalisation Min-Max pour un modèle de clustering

2. Standardisation Z-score pour une régression

Tester avec des échantillons

Hubs associés

Outils associés

FAQ

Documentation de l'API

Point de terminaison de la requête

Paramètres de la requête

Format de réponse

Documentation de MCP