Fatos principais
- Categoria
- Data Processing
- Tipos de entrada
- textarea, text, select, checkbox, number
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Normalizador Min-Max é uma ferramenta eficiente para transformar dados numéricos em uma escala fixa, geralmente entre 0 e 1, facilitando a comparação e o processamento em modelos de machine learning.
Quando usar
- •Ao preparar conjuntos de dados para algoritmos de machine learning sensíveis à escala.
- •Ao comparar variáveis que possuem unidades de medida ou magnitudes muito diferentes.
- •Ao realizar pré-processamento para melhorar a convergência de redes neurais.
Como funciona
- •Cole seus dados no formato CSV na área de entrada.
- •Selecione as colunas que deseja normalizar ou deixe em branco para detecção automática.
- •Defina a faixa de saída desejada e escolha como tratar valores ausentes.
- •Clique em processar para obter os dados normalizados com o resumo estatístico opcional.
Casos de uso
Exemplos
1. Preparação de dados para Machine Learning
Cientista de Dados- Contexto
- Um conjunto de dados contém colunas de 'idade' (0-100) e 'salário' (20k-200k). A diferença de escala impede que o modelo aprenda corretamente.
- Problema
- As variáveis estão em escalas muito distintas, causando viés no treinamento do modelo.
- Como usar
- Cole o CSV, selecione as colunas 'idade' e 'salário', e aplique a normalização padrão 0-1.
- Configuração de exemplo
-
targetColumns: idade, salário; outputRange: 0, 1; handleMissing: fill_median - Resultado
- Ambas as colunas são convertidas para a escala 0-1, permitindo que o modelo trate as variáveis com pesos equivalentes.
2. Normalização para Visualização
Analista de BI- Contexto
- Preciso plotar métricas de desempenho de diferentes departamentos em um único gráfico de radar.
- Problema
- As métricas possuem escalas diferentes, tornando o gráfico ilegível.
- Como usar
- Utilize a ferramenta para normalizar todas as colunas numéricas para a faixa 0-1.
- Configuração de exemplo
-
outputRange: 0, 1; includeStatistics: true - Resultado
- Todas as métricas agora variam entre 0 e 1, permitindo uma comparação visual clara e equilibrada no gráfico.
Testar com amostras
csvHubs relacionados
FAQ
O que é a normalização Min-Max?
É um método de escalonamento que transforma valores numéricos para uma faixa específica, mantendo a proporção original dos dados.
Posso usar uma faixa diferente de 0 a 1?
Sim, você pode definir uma faixa personalizada, como -1 a 1, no campo de configuração de saída.
Como a ferramenta lida com valores ausentes?
Você pode optar por pular linhas com valores ausentes ou preenchê-los usando a média, mediana, zero, mínimo ou máximo da coluna.
Colunas não numéricas são afetadas?
Não, a ferramenta preserva colunas não numéricas, garantindo que a estrutura original do seu arquivo seja mantida.
É possível ver as estatísticas dos dados?
Sim, ao ativar a opção 'Incluir Estatísticas', a ferramenta gera um resumo com os valores mínimos e máximos utilizados no cálculo.