Fatos principais
- Categoria
- Data Processing
- Tipos de entrada
- textarea, select, checkbox
- Tipo de saída
- text
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Limitador de Faixa de Dados é uma ferramenta essencial para padronizar conjuntos de dados numéricos, permitindo que você recorte, filtre ou marque valores que excedem limites predefinidos, garantindo a integridade e a qualidade das suas informações.
Quando usar
- •Ao limpar dados de sensores que apresentam leituras erráticas ou fora do intervalo físico possível.
- •Ao preparar datasets para modelos de machine learning que exigem valores normalizados dentro de faixas específicas.
- •Ao aplicar regras de negócio em relatórios financeiros para identificar ou corrigir valores que violam limites operacionais.
Como funciona
- •Cole seus dados no formato CSV na área de entrada ou deixe que a ferramenta detecte automaticamente as colunas numéricas.
- •Defina as faixas mínima e máxima desejadas para cada coluna através do campo de configuração JSON.
- •Escolha a estratégia de manejo (recortar, filtrar ou marcar) e processe os dados para obter o resultado limpo e o relatório estatístico das alterações.
Casos de uso
Exemplos
1. Limpeza de Dados de Sensores de Temperatura
Engenheiro de Dados- Contexto
- Um sensor de temperatura industrial envia leituras CSV, mas ocasionalmente registra picos irreais devido a falhas elétricas.
- Problema
- Os valores fora da faixa de -10°C a 50°C estão corrompendo a média diária.
- Como usar
- Cole o CSV, configure o JSON para a coluna 'temperatura' com min: -10 e max: 50, e selecione a estratégia 'clip'.
- Configuração de exemplo
-
{"temperatura": {"min": -10, "max": 50}} - Resultado
- Todas as leituras acima de 50°C foram ajustadas para 50°C, e abaixo de -10°C para -10°C, estabilizando a análise estatística.
2. Validação de Faixa Salarial
Analista de RH- Contexto
- Uma planilha de salários contém erros de digitação com valores absurdamente altos ou baixos.
- Problema
- Identificar e filtrar registros que não condizem com a política salarial da empresa.
- Como usar
- Utilize a estratégia 'filter' com limites definidos para o salário mínimo e teto da categoria.
- Configuração de exemplo
-
{"salario": {"min": 1500, "max": 30000}} - Resultado
- O sistema removeu automaticamente todas as linhas com salários fora da faixa permitida, gerando um relatório com os registros descartados.
Testar com amostras
json, csv, videoHubs relacionados
FAQ
O que acontece se eu escolher a estratégia de recorte?
Valores abaixo do mínimo serão ajustados para o limite inferior, e valores acima do máximo serão ajustados para o limite superior.
Posso aplicar limites diferentes para colunas diferentes?
Sim, a configuração JSON permite especificar limites individuais para cada coluna, garantindo flexibilidade total.
Como funciona a opção de marcar valores modificados?
Ao ativar esta opção, a ferramenta adiciona flags ou colunas auxiliares que indicam quais células foram alteradas pelo processo.
A ferramenta remove linhas inteiras?
Sim, se você selecionar a estratégia de 'Filtrar', as linhas que contiverem qualquer valor fora da faixa especificada serão removidas do conjunto de dados.
É possível manter os dados originais?
Sim, ao marcar a opção 'Preservar Colunas Originais', a ferramenta mantém os valores iniciais com o sufixo '_original' para comparação.