Fatos principais
- Categoria
- Matemática, datas e finanças
- Tipos de entrada
- textarea, checkbox, text, number
- Tipo de saída
- json
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
A Calculadora de Regressão Logística permite ajustar modelos de classificação binária utilizando o método de descida de gradiente para prever probabilidades e categorias com base em dados históricos fornecidos em formato CSV.
Quando usar
- •Quando você precisa prever um resultado binário, como sim/não ou 0/1, a partir de variáveis numéricas.
- •Para analisar a probabilidade de ocorrência de um evento com base em múltiplos preditores independentes.
- •Durante o treinamento rápido de modelos estatísticos simples sem a necessidade de configurar ambientes de programação complexos.
Como funciona
- •Insira os dados no formato CSV, garantindo que os preditores estejam nas primeiras colunas e o alvo binário na última coluna.
- •Configure os hiperparâmetros do modelo, como a taxa de aprendizado e o número de iterações para o algoritmo de descida de gradiente.
- •Defina o limiar de decisão (threshold) para converter as probabilidades calculadas em classes binárias específicas.
- •O sistema processa os dados e retorna a acurácia do modelo junto com a previsão para os valores de entrada opcionais.
Casos de uso
Exemplos
1. Previsão de Conversão de Leads
Analista de Marketing- Contexto
- Uma empresa deseja saber se um lead converterá em venda com base no tempo gasto no site e no número de páginas visitadas.
- Problema
- Classificar novos leads como potenciais compradores para priorizar o atendimento comercial.
- Como usar
- Insira os dados históricos de 100 leads no campo CSV e adicione os valores do novo lead (ex: 5 minutos, 10 páginas) no campo de previsão.
- Configuração de exemplo
-
Taxa de aprendizado: 0.1, Iterações: 2000, Limiar: 0.5 - Resultado
- O modelo retorna a acurácia do treinamento e indica se o novo lead pertence à classe 1 (comprador) ou 0 (não comprador).
2. Triagem de Risco de Saúde
Pesquisador Acadêmico- Contexto
- Estudo sobre a relação entre o Índice de Massa Corporal (IMC), idade e o diagnóstico de uma condição crônica.
- Problema
- Estimar a probabilidade de um paciente apresentar a condição com base em seus dados biométricos.
- Como usar
- Cole os dados CSV contendo IMC e idade como preditores e o diagnóstico (0 ou 1) como a última coluna.
- Configuração de exemplo
-
Taxa de aprendizado: 0.05, Iterações: 5000, Casas decimais: 4 - Resultado
- O sistema gera os coeficientes do modelo e a probabilidade específica para os dados de entrada fornecidos.
Testar com amostras
csv, hashHubs relacionados
FAQ
O que é o limiar (threshold)?
É o valor de corte, geralmente 0.5, que define se uma probabilidade calculada será classificada como 0 ou 1.
Como os dados CSV devem ser organizados?
As variáveis preditoras devem vir primeiro, seguidas obrigatoriamente pela variável alvo binária na última coluna.
O que faz a taxa de aprendizado?
Ela controla o tamanho do passo que o algoritmo dá em cada iteração para encontrar os coeficientes que minimizam o erro.
Posso usar variáveis de texto nos dados?
Não, a calculadora processa apenas valores numéricos; variáveis categóricas devem ser convertidas em números antes do upload.
O que é a descida de gradiente?
É um algoritmo de otimização usado para ajustar os pesos do modelo de forma iterativa até encontrar o melhor ajuste aos dados.