Datos clave
- Categoría
- Matemáticas, fechas y finanzas
- Tipos de entrada
- textarea, checkbox, text, number
- Tipo de salida
- json
- Cobertura de muestras
- 4
- API disponible
- Yes
Resumen
Esta calculadora de regresión logística permite ajustar modelos de clasificación binaria utilizando el algoritmo de descenso de gradiente para predecir probabilidades y categorías basadas en datos numéricos históricos.
Cuándo usarlo
- •Cuando necesites predecir un resultado binario como sí/no o éxito/fracaso a partir de variables independientes.
- •Para estimar la probabilidad de que ocurra un evento específico basándose en múltiples predictores numéricos.
- •Al realizar análisis estadísticos rápidos y prototipado de modelos de aprendizaje automático sin programar.
Cómo funciona
- •Introduce los datos en formato CSV, colocando los predictores en las primeras columnas y el objetivo binario (0 o 1) en la última.
- •Configura los parámetros del algoritmo, incluyendo la tasa de aprendizaje, el número de iteraciones y el umbral de decisión.
- •Opcionalmente, ingresa nuevos valores de predicción para evaluar casos específicos con el modelo entrenado.
- •El sistema ejecuta el descenso de gradiente para optimizar los coeficientes y genera un informe con la precisión y los resultados de clasificación.
Casos de uso
Ejemplos
1. Predicción de Aprobación de Exámenes
Profesor universitario- Contexto
- Un profesor tiene datos de horas de estudio y horas de sueño de sus alumnos, junto con el resultado de aprobado (1) o reprobado (0).
- Problema
- Predecir si un estudiante que estudió 2.5 horas y durmió 2.5 horas aprobará el examen.
- Cómo usarlo
- Ingresa los datos históricos en el área de CSV, activa el encabezado y define los valores de predicción como '2.5, 2.5'.
- Configuración de ejemplo
-
learningRate: 0.2, iterations: 3000, threshold: 0.5 - Resultado
- El modelo devuelve una precisión del 100% para los datos de entrenamiento y clasifica al nuevo estudiante en la categoría 1 (aprobado).
2. Análisis de Conversión de Ventas
Analista de marketing- Contexto
- La empresa registra el tiempo pasado en la web y el número de páginas visitadas para identificar si un usuario realiza una compra.
- Problema
- Determinar la probabilidad de compra de un usuario que visitó 5 páginas durante 10 minutos.
- Cómo usarlo
- Carga el historial de navegación en formato CSV y ajusta las iteraciones para asegurar la convergencia del modelo.
- Configuración de ejemplo
-
learningRate: 0.1, iterations: 5000, threshold: 0.6 - Resultado
- Se obtiene un modelo ajustado que permite predecir la conversión con un umbral de decisión personalizado de 0.6.
Probar con muestras
csv, hashHubs relacionados
Preguntas frecuentes
¿Qué formato deben tener los datos de entrada?
Deben ser valores numéricos separados por comas (CSV), donde la última columna representa la variable dependiente binaria.
¿Qué es la tasa de aprendizaje?
Es un parámetro que define el tamaño del paso que da el algoritmo en cada iteración para encontrar los coeficientes óptimos.
¿Cómo influye el umbral en el resultado?
El umbral determina el punto de corte (usualmente 0.5) para clasificar una probabilidad como clase 1 o clase 0.
¿Puedo incluir encabezados en mi CSV?
Sí, el sistema permite activar la opción 'Tiene encabezado' para ignorar la primera fila durante el cálculo.
¿Qué significa el valor de precisión (accuracy)?
Indica la proporción de predicciones correctas que el modelo realizó sobre el conjunto de datos proporcionado.