Points clés
- Catégorie
- Maths, dates et finance
- Types d’entrée
- textarea, checkbox, text, number
- Type de sortie
- json
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Ce calculateur de régression logistique permet d'ajuster un modèle de classification binaire à partir de vos données CSV en utilisant l'algorithme de descente de gradient. Il calcule automatiquement la précision du modèle et peut prédire la probabilité d'appartenance à une classe pour de nouvelles entrées spécifiques, offrant une solution rapide pour l'analyse prédictive simple.
Quand l’utiliser
- •Pour modéliser la probabilité d'un événement binaire, comme un succès ou un échec, à partir de variables numériques.
- •Lorsque vous souhaitez créer un classificateur sans écrire de code, en utilisant uniquement des données structurées en CSV.
- •Pour tester l'influence de différents paramètres sur une variable cible binaire et obtenir un score de précision immédiat.
Comment ça marche
- •Saisissez vos données au format CSV en plaçant les variables prédictives dans les premières colonnes et la cible binaire (0 ou 1) dans la dernière colonne.
- •Définissez les paramètres de l'algorithme, notamment le taux d'apprentissage pour la vitesse de convergence et le nombre d'itérations pour la précision de l'ajustement.
- •Indiquez éventuellement des valeurs de prédiction spécifiques pour tester le modèle sur de nouveaux cas de figure.
- •Le calculateur exécute la descente de gradient et retourne un objet JSON contenant la précision globale et les résultats de classification.
Cas d’usage
Exemples
1. Analyse de conversion e-commerce
Analyste Marketing- Contexte
- Une boutique en ligne souhaite savoir si un visiteur va acheter en fonction de son comportement de navigation.
- Problème
- Prédire la probabilité d'achat pour un utilisateur ayant visité 2.5 pages en moyenne.
- Comment l’utiliser
- Coller les données CSV (pages_visitees, temps_sec, achat), activer l'en-tête, et saisir '2.5, 120' dans les valeurs de prédiction.
- Configuration d’exemple
-
learningRate: 0.2, iterations: 3000, threshold: 0.5 - Résultat
- Le modèle indique une précision de 100% sur l'échantillon et prédit que l'utilisateur appartient à la classe 1 (achat).
2. Classification de performance académique
Enseignant- Contexte
- Un professeur dispose des heures d'étude et des notes de tests blancs pour prédire la réussite à un examen final.
- Problème
- Déterminer si un étudiant étudiant 3 heures par jour réussira l'examen (cible 1).
- Comment l’utiliser
- Saisir les données historiques dans le champ CSV et entrer '3' dans les valeurs de prédiction.
- Configuration d’exemple
-
learningRate: 0.1, iterations: 2000, decimalPlaces: 2 - Résultat
- Le calculateur génère un JSON confirmant la probabilité de réussite basée sur la tendance des données historiques.
Tester avec des échantillons
csv, hashHubs associés
FAQ
Quel format de données est requis pour la cible ?
La cible doit être binaire, c'est-à-dire contenir uniquement des valeurs 0 ou 1 dans la dernière colonne de votre CSV.
À quoi sert le taux d'apprentissage ?
Il détermine la taille des étapes de la descente de gradient ; une valeur trop élevée peut empêcher la convergence, tandis qu'une valeur trop basse ralentit le calcul.
Puis-je inclure des en-têtes dans mon CSV ?
Oui, il suffit de cocher l'option 'Avec ligne d'en-tête' pour que la première ligne soit ignorée lors du calcul mathématique.
Comment est calculée la précision (accuracy) ?
Elle correspond au ratio entre le nombre de prédictions correctes et le nombre total d'observations dans le jeu de données fourni.
Quel est le rôle du seuil (threshold) ?
Le seuil définit la limite de probabilité (souvent 0,5) à partir de laquelle une observation est classée dans la catégorie 1 plutôt que 0.