Fatos principais
- Categoria
- Data Analysis
- Tipos de entrada
- textarea, select, text, number, checkbox
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Detector de Outliers é uma ferramenta de análise estatística projetada para identificar valores anômalos em conjuntos de dados numéricos, utilizando métodos robustos como IQR, Z-score e Z-score modificado para garantir a precisão dos seus resultados.
Quando usar
- •Identificar erros de entrada de dados que distorcem as médias e desvios padrão.
- •Detectar comportamentos anômalos em séries temporais ou métricas de desempenho.
- •Limpar conjuntos de dados antes de realizar modelagens estatísticas ou treinamentos de machine learning.
Como funciona
- •Insira seus dados numéricos na área de texto, selecionando o delimitador correspondente (vírgula, espaço ou ponto e vírgula).
- •Escolha o método estatístico de detecção, como IQR ou Z-score, e ajuste o limiar de sensibilidade conforme a necessidade do seu conjunto de dados.
- •Selecione o formato de saída desejado, como tabela ou JSON, e processe os dados para visualizar os valores identificados como outliers.
Casos de uso
Exemplos
1. Limpeza de Dados de Vendas
Analista de Dados- Contexto
- Um analista possui uma lista de valores de vendas diárias e precisa remover valores extremos causados por erros de sistema.
- Problema
- Valores muito altos ou baixos estão distorcendo a média de vendas mensal.
- Como usar
- Cole os valores das vendas, selecione o método 'IQR' e escolha o formato de saída 'Tabela' para visualizar quais registros são outliers.
- Configuração de exemplo
-
Método: IQR, Sensibilidade: 1.5, Formato: Tabela - Resultado
- O sistema gera uma tabela destacando os valores que estão fora do intervalo interquartil, permitindo a remoção rápida dos erros.
2. Monitoramento de Latência de Servidor
Engenheiro de DevOps- Contexto
- O engenheiro monitora a latência de resposta de uma API e precisa identificar picos que indicam instabilidade.
- Problema
- Picos isolados de latência estão escondidos em milhares de registros de log.
- Como usar
- Insira os tempos de resposta, utilize o 'Z-score Modificado' para lidar com a mediana e gere um relatório em formato 'JSON'.
- Configuração de exemplo
-
Método: Z-score Modificado, Sensibilidade: 2.0, Formato: JSON - Resultado
- O formato JSON lista precisamente os timestamps dos picos de latência, facilitando a investigação técnica.
Testar com amostras
markdown, qrHubs relacionados
FAQ
O que é um outlier?
Um outlier é um ponto de dados que se desvia significativamente das demais observações, podendo indicar variabilidade natural ou erros de medição.
Qual método devo escolher?
O IQR é ideal para dados não distribuídos normalmente, enquanto o Z-score funciona melhor para dados com distribuição normal.
O que o limiar de sensibilidade faz?
Ele define o rigor da detecção; valores menores tornam o detector mais sensível, identificando mais pontos como anomalias.
Posso usar delimitadores personalizados?
Sim, selecione a opção 'Personalizado' no campo de delimitador e insira o caractere específico que separa seus dados.
Os dados são armazenados?
Não, o processamento é realizado localmente e os dados não são salvos em nossos servidores.