Catégories

Analyseur de Distribution de Données

Analyse complète de distribution de données avec tests de normalité, détection de valeurs aberrantes et évaluations d'adéquation

Générer la distribution de fréquence et les informations de percentile

Effectuer les tests Anderson-Darling, Shapiro-Wilk et Jarque-Bera

Identifier les valeurs aberrantes en utilisant plusieurs méthodes (IQR, Z-score et statistiques robustes)

Points clés

Catégorie
Data Analysis
Types d’entrée
textarea, select, checkbox
Type de sortie
text
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

L'Analyseur de Distribution de Données est un outil statistique complet conçu pour examiner la structure de vos jeux de données, identifier les anomalies et valider la normalité de vos échantillons grâce à des tests rigoureux.

Quand l’utiliser

  • Pour vérifier si vos données suivent une loi normale avant d'appliquer des tests paramétriques.
  • Pour identifier et isoler les valeurs aberrantes qui pourraient fausser vos résultats statistiques.
  • Pour visualiser la fréquence et la dispersion de vos données via des histogrammes et des percentiles.

Comment ça marche

  • Saisissez vos données numériques sous forme de liste séparée par des virgules ou des retours à la ligne.
  • Sélectionnez le niveau de signification souhaité (90%, 95% ou 99%) pour vos tests statistiques.
  • Activez les options de test de normalité, de détection d'aberrations ou de génération d'histogramme selon vos besoins.
  • Lancez l'analyse pour obtenir un rapport détaillé incluant les résultats des tests Anderson-Darling, Shapiro-Wilk et Jarque-Bera.

Cas d’usage

Contrôle qualité industriel pour vérifier la stabilité des mesures de production.
Recherche académique pour valider les hypothèses de distribution avant une analyse de régression.
Analyse financière pour détecter des anomalies dans les séries de prix ou de rendements.

Exemples

1. Validation de la normalité des scores de test

Enseignant-chercheur
Contexte
Un chercheur a collecté les scores de 100 étudiants et doit déterminer si la distribution est normale pour choisir le test statistique approprié.
Problème
Besoin de confirmer la normalité sans calcul manuel complexe.
Comment l’utiliser
Copier-coller la liste des scores dans l'entrée de données et activer 'Tester la normalité'.
Configuration d’exemple
significanceLevel: 0.05, testNormality: true
Résultat
Le rapport confirme si les scores suivent une loi normale, permettant de justifier l'utilisation de tests paramétriques.

2. Nettoyage de données de capteurs

Ingénieur IoT
Contexte
Des capteurs de température envoient des données en continu, mais certains relevés sont erronés en raison d'interférences.
Problème
Identifier les valeurs aberrantes pour nettoyer le jeu de données avant l'entraînement d'un modèle.
Comment l’utiliser
Saisir les relevés de température et activer la détection des valeurs aberrantes.
Configuration d’exemple
detectOutliers: true, significanceLevel: 0.01
Résultat
L'outil liste les valeurs aberrantes détectées par Z-score, permettant de les supprimer pour obtenir une moyenne plus précise.

Tester avec des échantillons

qr

Hubs associés

FAQ

Quels tests de normalité sont effectués ?

L'outil effectue les tests Anderson-Darling, Shapiro-Wilk et Jarque-Bera pour évaluer la normalité de votre distribution.

Comment les valeurs aberrantes sont-elles détectées ?

L'outil utilise plusieurs méthodes robustes, notamment l'intervalle interquartile (IQR) et le Z-score, pour identifier les points atypiques.

Puis-je analyser plusieurs colonnes de données ?

Oui, en sélectionnant l'option 'Colonnes multiples', l'outil aplatira toutes vos valeurs en un seul ensemble de données pour une analyse globale.

Que signifie le niveau de signification ?

Il représente le seuil de confiance (alpha) utilisé pour rejeter ou accepter l'hypothèse nulle lors des tests statistiques.

L'outil génère-t-il des graphiques ?

En activant l'option 'Inclure les données d'histogramme', vous obtenez les fréquences et percentiles nécessaires pour construire vos représentations graphiques.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/distribution-analyzer

Paramètres de la requête

Nom du paramètre Type Requis Description
dataInput textarea Oui -
dataFormat select Oui -
significanceLevel select Oui -
includeHistogram checkbox Non Générer la distribution de fréquence et les informations de percentile
testNormality checkbox Non Effectuer les tests Anderson-Darling, Shapiro-Wilk et Jarque-Bera
detectOutliers checkbox Non Identifier les valeurs aberrantes en utilisant plusieurs méthodes (IQR, Z-score et statistiques robustes)

Format de réponse

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Texte: Texte

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-distribution-analyzer": {
      "name": "distribution-analyzer",
      "description": "Analyse complète de distribution de données avec tests de normalité, détection de valeurs aberrantes et évaluations d'adéquation",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=distribution-analyzer",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]