Points clés
- Catégorie
- Data Processing
- Types d’entrée
- textarea, text, select, number, checkbox
- Type de sortie
- text
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
L'Interpolateur de Données est un outil professionnel conçu pour traiter les lacunes dans vos jeux de données CSV en utilisant des méthodes mathématiques avancées. Il permet de restaurer l'intégrité de vos séries temporelles ou de vos mesures scientifiques en générant des valeurs cohérentes basées sur les tendances existantes.
Quand l’utiliser
- •Lorsque vos fichiers CSV contiennent des cellules vides dues à des erreurs de capteurs ou de saisie.
- •Pour préparer des séries temporelles complètes avant d'effectuer des analyses statistiques ou des prévisions.
- •Pour lisser des courbes de données en remplaçant les données manquantes par des valeurs estimées mathématiquement.
Comment ça marche
- •Importez vos données au format CSV et sélectionnez les colonnes cibles à traiter.
- •Choisissez la méthode d'interpolation adaptée à votre besoin, comme l'interpolation linéaire, polynomiale ou par spline.
- •Configurez les paramètres optionnels tels que la direction du remplissage ou la limite de taille des lacunes.
- •Lancez le traitement pour obtenir un fichier propre avec, si souhaité, un rapport détaillé des modifications effectuées.
Cas d’usage
Exemples
1. Restauration de données météo
Analyste de données- Contexte
- Un fichier CSV contient des relevés de température quotidiens avec des trous aléatoires dus à une panne de capteur.
- Problème
- Les lacunes empêchent le calcul correct des moyennes mensuelles.
- Comment l’utiliser
- Charger le CSV, définir la colonne 'date' comme index, choisir la méthode 'linéaire' et activer la génération de rapport.
- Configuration d’exemple
-
interpolationMethod: linear, indexColumn: date, generateReport: true - Résultat
- Les valeurs manquantes sont comblées par une progression linéaire entre les points connus, permettant une analyse complète.
2. Lissage de courbes de performance
Ingénieur système- Contexte
- Des logs de performance serveur présentent des pics manquants lors de pics de charge.
- Problème
- Les données manquantes créent des ruptures dans les graphiques de suivi.
- Comment l’utiliser
- Utiliser la méthode 'spline' pour obtenir une courbe lisse et cohérente sur les périodes de données manquantes.
- Configuration d’exemple
-
interpolationMethod: spline, maxGapSize: 3 - Résultat
- La courbe de performance est continue, facilitant la visualisation des tendances de charge sans interruption visuelle.
Tester avec des échantillons
csv, imageHubs associés
FAQ
Quelles méthodes d'interpolation sont disponibles ?
L'outil propose plusieurs méthodes dont l'interpolation linéaire, polynomiale, spline, cubique, ainsi que des méthodes de remplissage comme le 'forward fill' ou le 'backward fill'.
Puis-je conserver mes données originales ?
Oui, en activant l'option 'Conserver les colonnes originales', l'outil créera des colonnes suffixées par '_original' pour comparer les résultats.
L'outil peut-il gérer les dates ?
Absolument, vous pouvez spécifier une colonne d'index (date ou temps) pour garantir que l'interpolation respecte l'ordre chronologique de vos données.
Comment savoir quelles valeurs ont été modifiées ?
L'option 'Marquer les valeurs interpolées' ajoute automatiquement des colonnes de suivi pour identifier précisément les points qui ont été générés par l'outil.
Y a-t-il une limite à la taille des trous dans les données ?
Oui, vous pouvez définir une 'Taille maximale de lacune' pour éviter d'interpoler sur des segments trop longs où les données seraient trop incertaines.