Fatos principais
- Categoria
- Data Processing
- Tipos de entrada
- textarea, select, text, checkbox, number
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Normalizador Z-Score é uma ferramenta essencial para padronizar conjuntos de dados numéricos, ajustando-os para que possuam média zero e desvio padrão unitário. Este processo é fundamental para garantir que variáveis em diferentes escalas possam ser comparadas de forma justa, sendo amplamente utilizado em modelos de machine learning e análises estatísticas rigorosas.
Quando usar
- •Preparar dados para algoritmos de machine learning sensíveis à escala, como KNN ou SVM.
- •Comparar métricas que utilizam unidades de medida distintas, como altura em metros e peso em quilogramas.
- •Identificar valores atípicos (outliers) em um conjunto de dados através da análise de desvios padrão.
Como funciona
- •Cole seus dados em formato CSV na área de entrada ou carregue o arquivo correspondente.
- •Selecione as colunas que deseja normalizar ou deixe em branco para que o sistema detecte automaticamente os campos numéricos.
- •Escolha entre o método Z-Score padrão ou o Z-Score Robusto, caso seus dados contenham muitos valores discrepantes.
- •Configure opções adicionais, como o tratamento de valores ausentes e a detecção de anomalias, e clique em processar para obter o resultado.
Casos de uso
Exemplos
1. Preparação de Dados para Machine Learning
Cientista de Dados- Contexto
- Um conjunto de dados de imóveis contém colunas com valores de preços na casa dos milhões e números de quartos entre 1 e 5.
- Problema
- A diferença de escala impede que o modelo de aprendizado de máquina aprenda corretamente, dando peso excessivo ao preço.
- Como usar
- Importar o CSV, selecionar as colunas 'preco' e 'quartos', e aplicar a normalização Z-Score padrão.
- Configuração de exemplo
-
standardizationType: zscore, handleMissing: fill_mean - Resultado
- Ambas as colunas são transformadas para uma escala comum, permitindo que o modelo processe as informações com pesos equilibrados.
2. Detecção de Anomalias em Sensores
Engenheiro de Manutenção- Contexto
- Dados de sensores de temperatura de uma máquina industrial apresentam flutuações constantes.
- Problema
- Identificar picos de temperatura que indiquem falhas iminentes sem ser afetado por ruídos comuns.
- Como usar
- Carregar os dados do sensor, ativar a detecção de anomalias e definir o limiar de 2.5 desvios padrão.
- Configuração de exemplo
-
detectOutliers: true, outlierThreshold: 2.5 - Resultado
- A ferramenta gera uma lista de registros que excedem o limiar, destacando exatamente quando a máquina operou fora dos padrões esperados.
Testar com amostras
csv, video, barcodeHubs relacionados
FAQ
O que é a normalização Z-Score?
É um método estatístico que transforma dados para que a média seja 0 e o desvio padrão seja 1, permitindo a comparação direta entre diferentes variáveis.
Qual a diferença entre Z-Score padrão e Robusto?
O Z-Score padrão usa média e desvio padrão, enquanto o Robusto usa mediana e desvio absoluto da mediana (MAD), sendo mais eficaz quando há muitos outliers.
O que acontece com colunas que não são numéricas?
A ferramenta preserva colunas não numéricas, garantindo que a estrutura original do seu conjunto de dados seja mantida após a normalização.
Como a ferramenta trata valores ausentes?
Você pode optar por pular linhas com valores ausentes ou preenchê-los automaticamente usando a média, mediana, moda ou zero.
Posso definir um intervalo específico para os dados?
Sim, a ferramenta permite o escalonamento personalizado para uma faixa alvo, caso você precise que os dados normalizados fiquem dentro de limites específicos.