Cole um CSV em "Entrada do dataset" ou envie um arquivo CSV/JSON. O profiler inspeciona cada coluna e entrega uma visao rapida de qualidade antes de BI, ETL ou ML.
O que e verificado:
- Valores faltantes por coluna
- Linhas duplicadas ou combinacoes duplicadas com base nas colunas informadas em "Colunas para duplicados"
- Inferencia de tipo da coluna: number, boolean, date, string ou empty
- Outliers numericos usando uma regra no estilo IQR
- Drift de formato em colunas de texto/data, como datas misturadas ou codigos junto com texto livre
Como preencher os campos:
- Entrada do dataset: cole CSV diretamente para um perfil rapido
- Arquivo de dados: envie CSV ou JSON se o dataset for maior ou ja estiver salvo
- Colunas para duplicados: opcional; informe chaves separadas por virgula como id,email para detectar duplicados por chave de negocio
- Linhas de amostra: controla quantas linhas exemplo aparecem no relatorio
Como ler o relatorio:
- Quality score e um resumo rapido de 0 a 100; mais faltantes, duplicados e sinais anomalos reduzem a pontuacao
- Missing mostra quantas celulas vazias/null foram encontradas na coluna
- Distinct mostra quantos valores unicos aparecem
- Anomalies destaca outliers numericos
- Format drift marca colunas com valores estruturalmente inconsistentes
Escopo atual:
- CSV e JSON sao suportados
- JSON deve ser um array de objetos ou um objeto com array rows
- A pontuacao serve como sinal operacional rapido, nao como nota formal de governanca de dados