Escalonador de Features

Fatos principais

Categoria: Dados e tabelas
Tipos de entrada: textarea, select, text, checkbox
Tipo de saída: text
Cobertura de amostras: 4
API disponível: Yes

Visão geral

O Escalonador de Features é uma ferramenta essencial para o pré-processamento de dados, permitindo normalizar e padronizar variáveis numéricas para modelos de aprendizado de máquina. Com suporte a diversos métodos estatísticos, ele garante que seus dados estejam na escala correta para melhorar a precisão e a convergência de algoritmos preditivos.

Quando usar

•Preparar datasets para algoritmos sensíveis à escala, como KNN, SVM ou Redes Neurais.
•Padronizar variáveis com unidades de medida distintas para evitar que valores grandes dominem o modelo.
•Remover o viés de outliers em conjuntos de dados através de métodos de escalonamento robustos.

Como funciona

•Cole seus dados no formato CSV na área de entrada e selecione o método de escalonamento desejado.
•Especifique as colunas que deseja processar ou deixe em branco para que o sistema detecte automaticamente as colunas numéricas.
•Escolha o formato de saída (CSV ou JSON) e, se necessário, salve os parâmetros para realizar transformações inversas posteriormente.
•Clique em processar para obter seus dados normalizados prontos para uso em seus projetos de ciência de dados.

Casos de uso

Normalização de dados financeiros para modelos de previsão de séries temporais.

Padronização de atributos de sensores IoT para detecção de anomalias.

Preparação de datasets de marketing para segmentação de clientes via clustering.

Exemplos

1. Padronização de Dados de Sensores

Cientista de Dados

Contexto: Um conjunto de dados de sensores contém leituras de temperatura e pressão com escalas muito diferentes.
Problema: O modelo de aprendizado de máquina está dando peso excessivo à pressão devido aos valores numéricos maiores.
Como usar: Carregar o CSV, selecionar 'Escalonador Padrão (Z-score)' e processar.
Configuração de exemplo: scalingMethod: standard, hasHeader: true
Resultado: Todas as features foram centralizadas com média 0 e desvio padrão 1, permitindo que o modelo aprenda padrões de forma equilibrada.

2. Normalização Min-Max para Imagens

Engenheiro de ML

Contexto: Pixels de uma imagem precisam ser normalizados para o intervalo [0, 1] antes de entrar na rede neural.
Problema: Os valores de pixel variam de 0 a 255, o que causa instabilidade no treinamento.
Como usar: Inserir os dados de pixel, selecionar 'Escalonador Min-Max' e exportar em formato JSON.
Configuração de exemplo: scalingMethod: minmax, outputFormat: json
Resultado: Dados convertidos com sucesso para o intervalo [0, 1], prontos para a camada de entrada da rede neural.

Testar com amostras

csv, hash

Exemplos CSV

Arquivos CSV de exemplo com vários tipos de dados, tamanhos e níveis de complexidade

preferred input family csv

csv

Exemplos de Substituição de Regex

Coleção de padrões de substituição de regex comuns e úteis para transformação de texto e limpeza de dados

preferred input family csv

csv

Exemplos de Linhas Duplicadas

Arquivos de exemplo com vários tipos de linhas duplicadas para testar ferramentas de remoção de duplicatas

preferred input family csv

csv

Exemplos Python

Exemplos de código Python e demonstrações Hello World

preferred input family csv

csv

Hubs relacionados

Ferramentas de exportacao CSV e conversao de tabelas

Compare conversoes entre CSV e Excel, JSON, HTML, Markdown, XML e texto em um unico hub para fluxos de intercambio tabular.

Ferramentas de limpeza e reorganizacao de CSV

Reune em um so hub ferramentas para limpar CSV, filtrar, ordenar, agrupar, juntar, dividir e reorganizar tabelas para fluxos de planilha e importacao/exportacao.

Ferramentas de qualidade de dados, deduplicacao e deteccao de anomalias

Perfilhe datasets CSV/JSON, compare versoes de planilhas e encontre duplicatas, outliers, faltas de dados, quebras relacionais e anomalias de series temporais em um unico hub.

FAQ

Qual método de escalonamento devo escolher?

O Z-score é ideal para dados com distribuição normal, enquanto o Min-Max é melhor quando você precisa de um intervalo fixo, como [0, 1].

O que é a transformação inversa?

É o processo de converter os dados escalonados de volta para a escala original, utilizando os parâmetros salvos durante a primeira execução.

Posso processar apenas colunas específicas?

Sim, você pode listar os nomes das colunas desejadas separadas por vírgula no campo de configuração de colunas.

Como o escalonamento robusto lida com outliers?

Ele utiliza a mediana e o intervalo interquartil (MAD) em vez da média e desvio padrão, tornando-o menos sensível a valores extremos.

O que acontece se eu não selecionar colunas?

A ferramenta detectará automaticamente todas as colunas que contêm valores numéricos e aplicará o escalonamento nelas.

Nome do parâmetro	Tipo	Requerido	Descrição
csvData	textarea	Sim	-
scalingMethod	select	Sim	-
selectedColumns	text	Não	Especifique quais colunas escalonar. Se vazio, todas as colunas numéricas serão detectadas e escalonadas automaticamente.
scalingParams	textarea	Não	Apenas necessário para transformação inversa. Cole os parâmetros de escalonamento de uma execução anterior.
hasHeader	checkbox	Não	Tratar primeira linha como cabeçalhos de coluna
inverseTransform	checkbox	Não	Aplicar transformação inversa usando parâmetros fornecidos
outputFormat	select	Sim	-
saveParams	checkbox	Não	Incluir parâmetros de escalonamento na saída para futuras transformações inversas
scaledOnly	checkbox	Não	Ignorar análise detalhada e gerar apenas os dados escalonados

Fatos principais

Visão geral

Quando usar

Como funciona

Casos de uso

Exemplos

1. Padronização de Dados de Sensores

2. Normalização Min-Max para Imagens

Testar com amostras

Hubs relacionados

FAQ

Documentação da API

Ponto final da solicitação

Parâmetros da solicitação

Formato de resposta

Documentação de MCP

Escalonador de Features

Fatos principais

Visão geral

Quando usar

Como funciona

Casos de uso

Exemplos

1. Padronização de Dados de Sensores

2. Normalização Min-Max para Imagens

Testar com amostras

Hubs relacionados

Ferramentas relacionadas

FAQ

Documentação da API

Ponto final da solicitação

Parâmetros da solicitação

Formato de resposta

Documentação de MCP