Points clés
- Catégorie
- Maths, dates et finance
- Types d’entrée
- textarea, number, checkbox
- Type de sortie
- json
- Couverture des échantillons
- 2
- API disponible
- Yes
Vue d’ensemble
Le Calculateur de moyenne winsorisée est un outil statistique conçu pour atténuer l'impact des valeurs aberrantes dans vos jeux de données. Contrairement à la moyenne tronquée qui supprime les extrêmes, cette méthode les remplace par les valeurs limites les plus proches avant de calculer la moyenne. C'est la solution idéale pour obtenir une estimation robuste et représentative sans réduire la taille de votre échantillon.
Quand l’utiliser
- •Lorsque votre jeu de données contient des valeurs aberrantes qui faussent la moyenne classique.
- •Quand vous souhaitez limiter l'impact des extrêmes sans réduire le nombre total d'observations de votre échantillon.
- •Pour l'analyse de données financières, économiques ou scientifiques nécessitant des indicateurs statistiques robustes.
Comment ça marche
- •Saisissez ou collez votre série de nombres dans le champ du jeu de données.
- •Définissez le pourcentage de winsorisation par queue (par exemple, 10 % pour modifier les 10 % des valeurs les plus basses et les plus hautes).
- •L'outil trie automatiquement les données et remplace les valeurs extrêmes par les bornes conservées les plus proches.
- •Il calcule ensuite la nouvelle moyenne et affiche le résultat final, avec la possibilité de consulter le jeu de données modifié.
Cas d’usage
Exemples
1. Lissage de salaires avec valeurs extrêmes
Analyste RH- Contexte
- L'analyste doit calculer le salaire moyen d'un département, mais la présence du salaire du PDG et d'un stagiaire fausse la moyenne classique.
- Problème
- Obtenir une moyenne représentative sans exclure de collaborateurs de l'effectif total.
- Comment l’utiliser
- Saisir les salaires dans le champ 'Jeu de données' et régler le pourcentage de winsorisation sur 10 %.
- Configuration d’exemple
-
Pourcentage: 10, Décimales: 2 - Résultat
- Les salaires extrêmes sont plafonnés aux valeurs adjacentes, offrant une moyenne salariale robuste et réaliste.
2. Analyse de temps de réponse serveur
Ingénieur Système- Contexte
- Les temps de réponse d'un serveur sont généralement stables, mais quelques pics de latence isolés tirent la moyenne vers le haut.
- Problème
- Calculer un temps de réponse moyen qui reflète l'expérience utilisateur typique sans supprimer les logs.
- Comment l’utiliser
- Coller les temps de réponse (ex: 10, 12, 14, 16, 18, 100) et définir un pourcentage de 20 %.
- Configuration d’exemple
-
Pourcentage: 20, Décimales: 2, Inclure le jeu winsorisé: Oui - Résultat
- Le pic de 100ms est remplacé par 18ms, et la moyenne winsorisée calculée est de 15, bien plus représentative de la réalité.
Tester avec des échantillons
barcodeHubs associés
FAQ
Qu'est-ce qu'une moyenne winsorisée ?
C'est une moyenne calculée après avoir remplacé un certain pourcentage des valeurs les plus faibles et les plus élevées par les valeurs les plus proches restantes dans l'échantillon.
Quelle est la différence avec une moyenne tronquée ?
La moyenne tronquée supprime purement et simplement les valeurs extrêmes, tandis que la moyenne winsorisée les plafonne (les remplace) pour conserver le même nombre total d'observations.
Quel pourcentage de winsorisation dois-je choisir ?
Un pourcentage de 10 % à 20 % par queue est couramment utilisé. L'outil permet d'ajuster cette valeur jusqu'à 45 % selon la dispersion de vos données.
Puis-je voir les données après modification ?
Oui, en cochant l'option 'Inclure le jeu winsorisé', l'outil affichera la liste complète des nombres après le plafonnement des extrêmes.
Comment formater mon jeu de données en entrée ?
Vous pouvez entrer vos nombres sous forme de texte brut, séparés par des virgules, des espaces ou des retours à la ligne.