Quais formatos de arquivo são suportados?

A ferramenta aceita entrada de texto em CSV e upload de arquivos nos formatos CSV e JSON.

Qual a diferença entre oversample e undersample?

Oversample duplica as linhas da classe minoritária para igualar a majoritária, enquanto undersample corta a classe majoritária para o tamanho da minoritária.

A ferramenta altera meu arquivo original?

Não. Todo o processamento é feito de forma segura no navegador ou servidor temporário, e a ferramenta apenas gera uma pré-visualização baseada nos seus dados.

Posso exportar o dataset completo balanceado?

A ferramenta gera uma pré-visualização em JSON ou CSV baseada no limite de linhas configurado (até 50 linhas) para análise rápida e validação da estratégia.

O que acontece se eu escolher a estratégia 'none'?

A ferramenta apenas exibirá o relatório de distribuição original das classes, sem aplicar nenhuma técnica de reamostragem na pré-visualização.

Elysia Tools

Navegação

Data Analysis

Detector de desbalanceamento e reamostragem

Detecta desbalanceamento de classes em datasets CSV ou JSON, compara estrategias e previsualiza uma saida balanceada

Detalhes

O que esta ferramenta ajuda você a fazer

Cole um dataset CSV ou envie um arquivo CSV/JSON e depois informe a coluna de rotulo. A ferramenta conta cada classe, mede a razao de desbalanceamento, sugere se oversampling ou undersampling e mais seguro e gera uma pre-visualizacao balanceada.

Como usar:

Entrada do dataset: cole CSV para uma leitura rapida
Arquivo de dados: envie CSV ou JSON
Coluna de rotulo: escolha a classe alvo
Estrategia de reamostragem: none, oversample ou undersample
Formato de exportacao: visualize em JSON ou CSV
Linhas de visualizacao: limita quantas linhas balanceadas aparecem

Notas:

Oversample duplica linhas minoritarias ate o tamanho da classe majoritaria
Undersample corta a classe majoritaria ate o tamanho da minoritaria
O relatorio compara as duas estrategias
Isso ajuda a decidir se vale a pena adotar SMOTE depois

Execução

Executar esta ferramenta

Preencha o formulário, execute a ferramenta e veja o resultado no mesmo lugar.

Execuções de exemplo preparadas

Clique em um exemplo para preencher o formulário automaticamente. Arquivos ainda precisam ser enviados.

1 exemplos

Inspecionar um dataset de fraude 95:5

Mede o desbalanceamento, compara estrategias e exporta uma pre-visualizacao balanceada.

<div>Original distribution</div>

Entradas

Preencha os campos necessários e execute a ferramenta.

6 opções

ArquivosEnvie os arquivos de origem para este fluxo.1

Arquivo de dadosfileOpcional

Tamanho máximo por arquivo: 20 MBTipos aceitos: text/csv, application/json, text/plain, .csv, .json

ConteúdoCole ou digite os valores principais.2

Entrada do datasettextareaOpcionalColuna de rotulotextObrigatório

ConfiguraçõesAjuste formatos, intervalos, números e modos.3

Estrategia de reamostragemselectOpcionalFormato de exportacaoselectOpcionalLinhas de visualizacaonumberOpcional

Resultado

Pronto para executar

Depois de executar, arquivos, texto, dados estruturados ou saída em streaming aparecerão aqui.

Exemplos

Exemplos compatíveis com esta ferramenta

Relacionado

Detector de desbalanceamento e reamostragem

O que esta ferramenta ajuda você a fazer

Executar esta ferramenta

Execuções de exemplo preparadas

Entradas

Resultado

Exemplos compatíveis com esta ferramenta

Continue com ferramentas e temas relacionados

Execuções de exemplo preparadas

Entradas

Resultado

Veja quando usar esta ferramenta, o que ela suporta e como os usuários a aplicam.

Fatos principais

Visão geral

Quando usar

Como funciona

Casos de uso

Exemplos

1. Balanceamento de dataset de fraudes financeiras

2. Ajuste de classes em diagnósticos médicos

Perguntas frequentes

Exemplos CSV

Exemplos Python

Exemplos de Rastreamento Distribuído

Exemplos JWT

Detector de anomalias em series temporais

Perfilador de qualidade de datasets

Detector de conflitos de prefixo e abreviacao em mock data

Analisador de previsao e sazonalidade

Ferramentas de intercambio JSON e traducao de formatos

Ferramentas de conversão de caixa, codificação e normalização de texto

Ferramentas de inspecao, diff e transformacao JSON

Ferramentas de exportacao CSV e conversao de tabelas