Points clés
- Catégorie
- Data Processing
- Types d’entrée
- textarea, text, select, checkbox, number
- Type de sortie
- text
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Le normalisateur Min-Max est un outil de traitement de données conçu pour transformer vos valeurs numériques dans une plage spécifique, généralement comprise entre 0 et 1, facilitant ainsi l'analyse comparative et la préparation de modèles de machine learning.
Quand l’utiliser
- •Préparer des jeux de données pour des algorithmes de machine learning sensibles aux échelles.
- •Harmoniser des variables ayant des unités de mesure différentes pour une analyse statistique cohérente.
- •Normaliser des données avant une visualisation graphique pour éviter les distorsions dues aux valeurs extrêmes.
Comment ça marche
- •Copiez et collez vos données au format CSV dans la zone de saisie prévue.
- •Sélectionnez les colonnes cibles à normaliser et définissez votre plage de sortie personnalisée si nécessaire.
- •Choisissez une méthode de gestion pour les valeurs manquantes (suppression ou imputation par la moyenne/médiane).
- •Lancez le traitement pour obtenir vos données normalisées avec les statistiques descriptives associées.
Cas d’usage
Exemples
1. Préparation de données pour un modèle de prédiction
Data Scientist- Contexte
- Un dataset contient des colonnes 'Âge' et 'Salaire' avec des échelles très différentes, ce qui fausse les calculs de distance du modèle.
- Problème
- Les valeurs élevées du salaire dominent l'âge, rendant le modèle inefficace.
- Comment l’utiliser
- Coller le CSV, sélectionner les colonnes 'Âge' et 'Salaire', et appliquer la normalisation 0-1.
- Configuration d’exemple
-
targetColumns: Âge, Salaire; outputRange: 0, 1; handleMissing: fill_median - Résultat
- Toutes les valeurs sont désormais comprises entre 0 et 1, permettant au modèle de traiter les deux variables avec le même poids.
Tester avec des échantillons
csvHubs associés
FAQ
Qu'est-ce que la normalisation Min-Max ?
C'est une technique qui redimensionne les données en fonction de leurs valeurs minimales et maximales pour les ramener dans un intervalle défini, souvent [0, 1].
Comment l'outil gère-t-il les valeurs manquantes ?
Vous pouvez choisir d'ignorer les lignes concernées ou de les remplir automatiquement avec la moyenne, la médiane, zéro, le minimum ou le maximum.
Puis-je conserver mes colonnes non numériques ?
Oui, l'outil permet de conserver les colonnes originales, ce qui est utile pour garder les identifiants ou les catégories associés à vos données numériques.
Est-il possible de définir une plage autre que 0-1 ?
Absolument, vous pouvez spécifier une plage de sortie personnalisée dans les options pour adapter les données à vos besoins spécifiques.
Quelles sont les statistiques incluses dans le résultat ?
L'outil peut générer un résumé statistique incluant les valeurs min, max et moyennes calculées pour chaque colonne traitée.