Fatos principais
- Categoria
- Matemática, datas e finanças
- Tipos de entrada
- textarea, number, checkbox
- Tipo de saída
- json
- Cobertura de amostras
- 2
- API disponível
- Yes
Visão geral
A Calculadora de Média Winsorizada é uma ferramenta estatística projetada para calcular a média de um conjunto de dados limitando a influência de valores extremos (outliers). Em vez de descartar os dados atípicos, ela os substitui pelos valores mais próximos dentro de um limite percentual definido, garantindo uma estimativa central mais robusta e representativa sem reduzir o tamanho original da amostra.
Quando usar
- •Quando você precisa calcular uma média representativa em conjuntos de dados que contêm valores atípicos extremos (outliers).
- •Quando é necessário manter o tamanho original da amostra em vez de excluir dados, ao contrário do que ocorre na média truncada.
- •Ao analisar dados financeiros, salariais ou de tempo de resposta, onde picos anômalos podem distorcer a média tradicional.
Como funciona
- •Insira seu conjunto de dados numéricos no campo de texto principal.
- •Defina o percentual winsorizado por cauda (por exemplo, 10%) para determinar a proporção de extremos que será substituída.
- •A ferramenta ordena os dados e substitui os valores extremos inferiores e superiores pelos limites retidos mais próximos.
- •Por fim, calcula a média do novo conjunto de dados modificado e exibe o resultado com a precisão de casas decimais escolhida.
Casos de uso
Exemplos
1. Cálculo de média salarial robusta
Analista de RH- Contexto
- Um analista precisa calcular a média salarial de uma equipe de 10 pessoas, mas o salário do CEO puxa a média tradicional muito para cima.
- Problema
- Encontrar uma média salarial que represente melhor a equipe sem excluir o CEO da contagem total de funcionários.
- Como usar
- Insira os salários no campo de dados, defina o percentual winsorizado para 10% e calcule.
- Configuração de exemplo
-
Dataset: 2000, 2200, 2500, 2600, 2800, 3000, 3200, 3500, 4000, 50000 | Percentual: 10 - Resultado
- O salário de 50.000 é substituído por 4.000 (o limite superior), e o de 2.000 por 2.200. A nova média reflete a realidade da equipe de forma mais precisa.
2. Análise de tempo de resposta de API
Engenheiro de Software- Contexto
- Ao analisar logs de latência de uma API, a maioria das requisições leva cerca de 50ms, mas algumas falhas de rede causam picos de 5000ms.
- Problema
- Calcular a latência média típica limitando o impacto dos picos de rede sem descartar os logs da amostra.
- Como usar
- Cole os tempos de resposta em milissegundos, ajuste o percentual para 12.5% e marque para incluir o conjunto winsorizado.
- Configuração de exemplo
-
Dataset: 45, 48, 50, 51, 52, 55, 60, 5000 | Percentual: 12.5 | Casas decimais: 2 - Resultado
- O pico de 5000ms é reduzido para 60ms, resultando em uma média de latência estável e realista para relatórios de desempenho.
Testar com amostras
barcodeHubs relacionados
FAQ
Qual a diferença entre média winsorizada e média truncada?
A média truncada (ou aparada) remove completamente os valores extremos da amostra. Já a média winsorizada substitui esses valores pelos limites mais próximos, mantendo o número total de observações.
O que significa o percentual winsorizado por cauda?
É a porcentagem de dados em cada extremidade (menores e maiores valores) que será substituída. Um valor de 10% altera os 10% menores e os 10% maiores valores do conjunto.
Qual é o limite máximo para o percentual de corte?
A ferramenta permite configurar até 45% por cauda, garantindo que pelo menos 10% dos dados centrais originais sejam mantidos para o cálculo da média.
Posso ver o conjunto de dados após a winsorização?
Sim. Basta marcar a opção 'Incluir conjunto winsorizado' para visualizar os dados com os valores extremos já substituídos no resultado final em formato JSON.
Como devo formatar os dados de entrada?
Você pode colar os números separados por vírgulas, espaços ou quebras de linha diretamente no campo de texto do conjunto de dados.