Fatos principais
- Categoria
- Dados e tabelas
- Tipos de entrada
- textarea, select, text, checkbox
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Escalonador de Features é uma ferramenta essencial para o pré-processamento de dados, permitindo normalizar e padronizar variáveis numéricas para modelos de aprendizado de máquina. Com suporte a diversos métodos estatísticos, ele garante que seus dados estejam na escala correta para melhorar a precisão e a convergência de algoritmos preditivos.
Quando usar
- •Preparar datasets para algoritmos sensíveis à escala, como KNN, SVM ou Redes Neurais.
- •Padronizar variáveis com unidades de medida distintas para evitar que valores grandes dominem o modelo.
- •Remover o viés de outliers em conjuntos de dados através de métodos de escalonamento robustos.
Como funciona
- •Cole seus dados no formato CSV na área de entrada e selecione o método de escalonamento desejado.
- •Especifique as colunas que deseja processar ou deixe em branco para que o sistema detecte automaticamente as colunas numéricas.
- •Escolha o formato de saída (CSV ou JSON) e, se necessário, salve os parâmetros para realizar transformações inversas posteriormente.
- •Clique em processar para obter seus dados normalizados prontos para uso em seus projetos de ciência de dados.
Casos de uso
Exemplos
1. Padronização de Dados de Sensores
Cientista de Dados- Contexto
- Um conjunto de dados de sensores contém leituras de temperatura e pressão com escalas muito diferentes.
- Problema
- O modelo de aprendizado de máquina está dando peso excessivo à pressão devido aos valores numéricos maiores.
- Como usar
- Carregar o CSV, selecionar 'Escalonador Padrão (Z-score)' e processar.
- Configuração de exemplo
-
scalingMethod: standard, hasHeader: true - Resultado
- Todas as features foram centralizadas com média 0 e desvio padrão 1, permitindo que o modelo aprenda padrões de forma equilibrada.
2. Normalização Min-Max para Imagens
Engenheiro de ML- Contexto
- Pixels de uma imagem precisam ser normalizados para o intervalo [0, 1] antes de entrar na rede neural.
- Problema
- Os valores de pixel variam de 0 a 255, o que causa instabilidade no treinamento.
- Como usar
- Inserir os dados de pixel, selecionar 'Escalonador Min-Max' e exportar em formato JSON.
- Configuração de exemplo
-
scalingMethod: minmax, outputFormat: json - Resultado
- Dados convertidos com sucesso para o intervalo [0, 1], prontos para a camada de entrada da rede neural.
Testar com amostras
csv, hashHubs relacionados
FAQ
Qual método de escalonamento devo escolher?
O Z-score é ideal para dados com distribuição normal, enquanto o Min-Max é melhor quando você precisa de um intervalo fixo, como [0, 1].
O que é a transformação inversa?
É o processo de converter os dados escalonados de volta para a escala original, utilizando os parâmetros salvos durante a primeira execução.
Posso processar apenas colunas específicas?
Sim, você pode listar os nomes das colunas desejadas separadas por vírgula no campo de configuração de colunas.
Como o escalonamento robusto lida com outliers?
Ele utiliza a mediana e o intervalo interquartil (MAD) em vez da média e desvio padrão, tornando-o menos sensível a valores extremos.
O que acontece se eu não selecionar colunas?
A ferramenta detectará automaticamente todas as colunas que contêm valores numéricos e aplicará o escalonamento nelas.