Points clés
- Catégorie
- Data Analysis
- Types d’entrée
- textarea, select, checkbox
- Type de sortie
- text
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
L'Analyseur de Distribution de Données est un outil statistique complet conçu pour examiner la structure de vos jeux de données, identifier les anomalies et valider la normalité de vos échantillons grâce à des tests rigoureux.
Quand l’utiliser
- •Pour vérifier si vos données suivent une loi normale avant d'appliquer des tests paramétriques.
- •Pour identifier et isoler les valeurs aberrantes qui pourraient fausser vos résultats statistiques.
- •Pour visualiser la fréquence et la dispersion de vos données via des histogrammes et des percentiles.
Comment ça marche
- •Saisissez vos données numériques sous forme de liste séparée par des virgules ou des retours à la ligne.
- •Sélectionnez le niveau de signification souhaité (90%, 95% ou 99%) pour vos tests statistiques.
- •Activez les options de test de normalité, de détection d'aberrations ou de génération d'histogramme selon vos besoins.
- •Lancez l'analyse pour obtenir un rapport détaillé incluant les résultats des tests Anderson-Darling, Shapiro-Wilk et Jarque-Bera.
Cas d’usage
Exemples
1. Validation de la normalité des scores de test
Enseignant-chercheur- Contexte
- Un chercheur a collecté les scores de 100 étudiants et doit déterminer si la distribution est normale pour choisir le test statistique approprié.
- Problème
- Besoin de confirmer la normalité sans calcul manuel complexe.
- Comment l’utiliser
- Copier-coller la liste des scores dans l'entrée de données et activer 'Tester la normalité'.
- Configuration d’exemple
-
significanceLevel: 0.05, testNormality: true - Résultat
- Le rapport confirme si les scores suivent une loi normale, permettant de justifier l'utilisation de tests paramétriques.
2. Nettoyage de données de capteurs
Ingénieur IoT- Contexte
- Des capteurs de température envoient des données en continu, mais certains relevés sont erronés en raison d'interférences.
- Problème
- Identifier les valeurs aberrantes pour nettoyer le jeu de données avant l'entraînement d'un modèle.
- Comment l’utiliser
- Saisir les relevés de température et activer la détection des valeurs aberrantes.
- Configuration d’exemple
-
detectOutliers: true, significanceLevel: 0.01 - Résultat
- L'outil liste les valeurs aberrantes détectées par Z-score, permettant de les supprimer pour obtenir une moyenne plus précise.
Tester avec des échantillons
qrHubs associés
FAQ
Quels tests de normalité sont effectués ?
L'outil effectue les tests Anderson-Darling, Shapiro-Wilk et Jarque-Bera pour évaluer la normalité de votre distribution.
Comment les valeurs aberrantes sont-elles détectées ?
L'outil utilise plusieurs méthodes robustes, notamment l'intervalle interquartile (IQR) et le Z-score, pour identifier les points atypiques.
Puis-je analyser plusieurs colonnes de données ?
Oui, en sélectionnant l'option 'Colonnes multiples', l'outil aplatira toutes vos valeurs en un seul ensemble de données pour une analyse globale.
Que signifie le niveau de signification ?
Il représente le seuil de confiance (alpha) utilisé pour rejeter ou accepter l'hypothèse nulle lors des tests statistiques.
L'outil génère-t-il des graphiques ?
En activant l'option 'Inclure les données d'histogramme', vous obtenez les fréquences et percentiles nécessaires pour construire vos représentations graphiques.