Datos clave
- Categoría
- Matemáticas, fechas y finanzas
- Tipos de entrada
- textarea, number, checkbox
- Tipo de salida
- json
- Cobertura de muestras
- 2
- API disponible
- Yes
Resumen
La Calculadora de media winsorizada es una herramienta estadística diseñada para calcular promedios robustos limitando el impacto de los valores atípicos. En lugar de eliminar los datos extremos, los reemplaza por los valores más cercanos dentro de un rango percentil definido, permitiendo obtener una medida de tendencia central más representativa sin reducir el tamaño de la muestra original.
Cuándo usarlo
- •Cuando necesitas calcular un promedio en conjuntos de datos que contienen valores atípicos extremos que distorsionan la media tradicional.
- •Cuando deseas reducir el impacto de las anomalías estadísticas sin eliminar ninguna observación de tu muestra.
- •Al analizar datos financieros, económicos o científicos donde ocurren picos inusuales pero es crucial mantener el tamaño total de la muestra.
Cómo funciona
- •Introduce tu conjunto de datos numéricos separados por comas en el campo principal.
- •Define el porcentaje de winsorización por cola (por ejemplo, 10%) para establecer los límites inferior y superior.
- •La herramienta ordena los datos y reemplaza automáticamente los valores extremos por los límites retenidos más cercanos.
- •Finalmente, calcula y devuelve la media winsorizada junto con el conjunto de datos modificado si así lo solicitas.
Casos de uso
Ejemplos
1. Cálculo de salario promedio robusto
Analista de Recursos Humanos- Contexto
- Está analizando los salarios de un departamento donde la mayoría gana entre 40k y 60k, pero el director gana 250k.
- Problema
- El salario del director eleva artificialmente la media, dando una falsa impresión del sueldo típico del equipo.
- Cómo usarlo
- Introduce los salarios en el conjunto de datos y aplica un porcentaje de winsorización del 10%.
- Configuración de ejemplo
-
Dataset: 40000, 42000, 45000, 48000, 50000, 52000, 55000, 58000, 60000, 250000 | winsorPercent: 10 - Resultado
- El valor de 250,000 se reemplaza por 60,000 (el límite superior), resultando en una media winsorizada mucho más representativa de la realidad del departamento.
2. Limpieza de datos de sensores de temperatura
Ingeniero de Datos- Contexto
- Recopila lecturas de temperatura por hora. Un fallo en el sensor registró 100°C en un ambiente que normalmente está a 20°C.
- Problema
- Necesita calcular la temperatura media del día sin eliminar el registro defectuoso para no alterar la longitud de la serie temporal.
- Cómo usarlo
- Pega las lecturas en la calculadora, ajusta los decimales a 2 y marca la opción para incluir el conjunto winsorizado.
- Configuración de ejemplo
-
Dataset: 19, 20, 21, 19.5, 20.5, 22, 18, 100 | winsorPercent: 15 | decimalPlaces: 2 - Resultado
- El pico de 100°C se limita al valor máximo normal (22°C), estabilizando el promedio diario y mostrando el array corregido en el JSON de salida.
Probar con muestras
barcodeHubs relacionados
Preguntas frecuentes
¿Qué es la media winsorizada?
Es un promedio estadístico modificado donde los valores extremos de un conjunto de datos se reemplazan por los valores más cercanos dentro de un percentil específico, reduciendo el efecto de los atípicos.
¿En qué se diferencia de la media recortada (trimmed mean)?
Mientras que la media recortada elimina por completo los valores extremos del cálculo, la media winsorizada los sustituye por los valores límite, manteniendo intacto el número total de observaciones.
¿Qué significa el porcentaje por cola?
Indica la proporción de datos en cada extremo (inferior y superior) que será reemplazada. Por ejemplo, un 10% por cola modificará el 10% de los valores más bajos y el 10% de los más altos.
¿Cuál es el porcentaje máximo que puedo aplicar?
La calculadora permite aplicar hasta un 45% de winsorización por cola para asegurar que quede al menos un 10% de los datos centrales originales para realizar el cálculo.
¿Puedo ver cómo quedan los datos después de la winsorización?
Sí, activando la opción 'Incluir conjunto winsorizado', el resultado en formato JSON mostrará tanto la media final como la lista de números con los extremos ya sustituidos.