Catégories

Déduplicateur CSV

Supprimer les lignes en double basées sur des colonnes

0 85 100

Points clés

Catégorie
Data Processing
Types d’entrée
textarea, select, checkbox, range
Type de sortie
text
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

Le Déduplicateur CSV est un outil en ligne efficace conçu pour nettoyer vos jeux de données en identifiant et en supprimant automatiquement les lignes en double basées sur des colonnes spécifiques.

Quand l’utiliser

  • Nettoyer des listes de contacts fusionnées provenant de plusieurs sources.
  • Supprimer les entrées redondantes dans des exports de bases de données.
  • Préparer des fichiers CSV propres avant une importation dans un CRM ou un logiciel d'analyse.

Comment ça marche

  • Collez vos données CSV dans la zone de saisie prévue à cet effet.
  • Spécifiez les colonnes à utiliser pour identifier les doublons (ex: email, téléphone).
  • Choisissez votre stratégie de conservation (premier, dernier ou enregistrement le plus complet).
  • Lancez le traitement pour obtenir instantanément votre fichier nettoyé.

Cas d’usage

Fusion de listes d'abonnés à une newsletter provenant de différentes plateformes.
Nettoyage de fichiers de prospection commerciale pour éviter les doublons d'appels.
Standardisation de bases de données clients après une migration système.

Exemples

1. Nettoyage d'une liste de prospects

Responsable Marketing
Contexte
Vous avez fusionné deux fichiers de prospection et craignez que certains prospects soient présents dans les deux listes.
Problème
Supprimer les doublons basés sur l'adresse email pour éviter d'envoyer deux fois le même email.
Comment l’utiliser
Collez le CSV, indiquez 'email' dans les colonnes de déduplication et sélectionnez 'Garder le premier enregistrement'.
Résultat
Le fichier résultant contient uniquement des adresses email uniques, prêtes pour votre campagne.

2. Fusion de données clients incomplètes

Analyste de données
Contexte
Vous disposez de plusieurs exports clients où certaines lignes ont des numéros de téléphone manquants.
Problème
Fusionner les entrées en double pour obtenir une fiche client complète.
Comment l’utiliser
Utilisez la stratégie 'Garder l'enregistrement le plus complet' sur la colonne 'ID_Client'.
Résultat
L'outil fusionne les informations pour ne garder qu'une seule ligne par client, en privilégiant celle qui contient le plus de données renseignées.

Tester avec des échantillons

csv, video, barcode

Hubs associés

FAQ

Quelles colonnes dois-je choisir pour la déduplication ?

Choisissez les colonnes qui définissent l'unicité d'une ligne, comme une adresse email, un identifiant client ou une combinaison nom et prénom.

Puis-je conserver l'ordre original de mes données ?

Oui, l'option 'Préserver l'ordre original' est activée par défaut pour garantir que vos données restent dans leur séquence initiale.

Comment fonctionne la stratégie 'Enregistrement le plus complet' ?

Cette option analyse les lignes en double et conserve celle qui contient le plus de cellules remplies, idéale pour fusionner des données partielles.

La déduplication est-elle sensible à la casse ?

Par défaut, elle ne l'est pas, mais vous pouvez activer l'option 'Correspondance sensible à la casse' si vous souhaitez distinguer les majuscules des minuscules.

La correspondance floue est-elle précise ?

La correspondance floue permet de détecter des doublons malgré des fautes de frappe légères. Vous pouvez ajuster le seuil de précision de 0 à 100 selon vos besoins.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/data-deduplicator

Paramètres de la requête

Nom du paramètre Type Requis Description
inputData textarea Oui -
deduplicationColumns textarea Non -
strategy select Non -
fuzzyMatching checkbox Non -
fuzzyThreshold range Non -
caseSensitive checkbox Non -
trimValues checkbox Non -
preserveOriginalOrder checkbox Non -

Format de réponse

{
  "result": "Processed text content",
  "error": "Error message (optional)",
  "message": "Notification message (optional)",
  "metadata": {
    "key": "value"
  }
}
Texte: Texte

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-data-deduplicator": {
      "name": "data-deduplicator",
      "description": "Supprimer les lignes en double basées sur des colonnes",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=data-deduplicator",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]