Points clés
- Catégorie
- Maths, dates et finance
- Types d’entrée
- number
- Type de sortie
- json
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Ce calculateur de R² ajusté permet d'évaluer la précision d'un modèle de régression linéaire en tenant compte du nombre de variables prédictives et de la taille de l'échantillon. Contrairement au R² standard, cette mesure pénalise l'ajout de variables non significatives, offrant ainsi une vision plus réaliste de la performance réelle de votre modèle statistique.
Quand l’utiliser
- •Lors de la comparaison de plusieurs modèles de régression comportant un nombre différent de variables indépendantes.
- •Pour détecter un éventuel surapprentissage (overfitting) dans un modèle complexe avec un petit échantillon.
- •Pour valider si l'ajout d'un nouveau prédicteur améliore réellement la qualité de la prédiction globale.
Comment ça marche
- •Saisissez la valeur du coefficient de détermination (R²) obtenu lors de votre analyse de régression initiale.
- •Indiquez la taille totale de votre échantillon (nombre d'observations) et le nombre de variables prédictives utilisées.
- •Définissez la précision souhaitée en ajustant le nombre de décimales pour le résultat final.
- •Le calculateur applique la formule de correction pour générer le R² ajusté, la pénalité appliquée et le pourcentage de variance expliquée.
Cas d’usage
Exemples
1. Optimisation d'un modèle de prix immobilier
Analyste de données- Contexte
- Un analyste étudie les prix des logements avec un R² de 0,85, sur un échantillon de 100 maisons en utilisant 5 variables prédictives.
- Problème
- Vérifier si le modèle reste robuste après avoir pris en compte la complexité des variables.
- Comment l’utiliser
- Entrer 0.85 pour le R², 100 pour la taille d'échantillon et 5 pour le nombre de prédicteurs.
- Résultat
- Le R² ajusté est de 0,8420, montrant une faible pénalité et confirmant que les variables choisies sont pertinentes.
2. Détection de surapprentissage marketing
Responsable Marketing- Contexte
- Une équipe teste l'impact de 12 canaux publicitaires différents sur un petit échantillon de seulement 30 campagnes.
- Problème
- Le R² affiché est de 0,70, mais l'équipe craint que ce score soit artificiellement élevé.
- Comment l’utiliser
- Saisir un R² de 0.70, une taille d'échantillon de 30 et 12 prédicteurs.
- Résultat
- Le R² ajusté chute à 0,4882, révélant que le modèle est en réalité peu fiable à cause d'un trop grand nombre de variables pour trop peu de données.
Tester avec des échantillons
math-&-numbersHubs associés
FAQ
Pourquoi le R² ajusté est-il inférieur au R² standard ?
Le R² ajusté intègre une pénalité basée sur le nombre de prédicteurs pour corriger l'augmentation artificielle du R² qui survient lors de l'ajout de variables.
Le R² ajusté peut-il être négatif ?
Oui, si le modèle est moins performant qu'une simple moyenne et que le nombre de prédicteurs est trop élevé par rapport à la taille de l'échantillon.
Quelle est la différence entre la taille d'échantillon et les prédicteurs ?
La taille d'échantillon est le nombre total de données observées, tandis que les prédicteurs sont les variables indépendantes utilisées pour expliquer le résultat.
Quand doit-on privilégier le R² ajusté ?
Il doit être privilégié dès que vous utilisez une régression multiple (plus d'une variable indépendante) pour éviter de surestimer la précision du modèle.
Comment interpréter la valeur de la pénalité ?
La pénalité représente la différence entre le R² et le R² ajusté ; plus elle est élevée, plus le modèle contient de variables superflues par rapport aux données disponibles.