Processeur Batch XLSX S3

Traite des xlsx en stockage objet par lot

Lit, nettoie, filtre et exporte avec option de re-upload.

Exemples de résultats

1 Exemples

Traitement XLSX S3 en lot

Nettoie et filtre plusieurs xlsx puis retourne zip

xlsx-s3-batch-processor-example1.zip Voir fichier
Voir paramètres d'entrée
{ "region": "us-east-1", "bucket": "my-data-bucket", "objectKeys": "input/a.xlsx\ninput/b.xlsx", "filterColumn": "status", "filterOperator": "equals", "filterValue": "paid", "outputFormat": "xlsx" }

Points clés

Catégorie
Conversion et encodage
Types d’entrée
text, textarea, number, select, checkbox
Type de sortie
file
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

Le Processeur Batch XLSX S3 est un outil puissant conçu pour automatiser le nettoyage, le filtrage et la conversion de fichiers Excel stockés dans vos buckets S3, permettant une gestion efficace de grands volumes de données.

Quand l’utiliser

  • Lorsque vous devez filtrer des milliers de lignes sur plusieurs fichiers XLSX stockés dans le cloud.
  • Pour standardiser le format de vos données (nettoyage des espaces, suppression des lignes vides) avant une intégration.
  • Pour automatiser l'extraction de sous-ensembles de données spécifiques depuis des rapports volumineux vers un format exploitable.

Comment ça marche

  • Connectez votre bucket S3 en fournissant vos identifiants d'accès et la région correspondante.
  • Spécifiez les clés des objets (fichiers) à traiter et définissez vos règles de filtrage par colonne.
  • Configurez les options de nettoyage, comme la suppression des espaces inutiles ou des lignes vides.
  • Choisissez votre format de sortie (XLSX, CSV ou JSON) et lancez le traitement pour obtenir vos fichiers prêts à l'emploi.

Cas d’usage

Centralisation et nettoyage de rapports financiers mensuels dispersés dans plusieurs dossiers S3.
Extraction automatique de données clients spécifiques à partir de fichiers de ventes bruts pour alimenter un CRM.
Conversion massive de fichiers Excel hérités vers un format JSON structuré pour des applications web modernes.

Exemples

1. Filtrage de factures payées

Analyste de données
Contexte
Des centaines de fichiers de facturation sont stockés sur S3, mais seuls les paiements validés doivent être extraits pour la comptabilité.
Problème
Extraire uniquement les lignes où le statut est 'paid' parmi plusieurs fichiers XLSX.
Comment l’utiliser
Saisissez les chemins des fichiers dans 'Objet Keys', configurez le filtre sur la colonne 'status' avec l'opérateur 'equals' et la valeur 'paid'.
Configuration d’exemple
filterColumn: 'status', filterOperator: 'equals', filterValue: 'paid', outputFormat: 'xlsx'
Résultat
Un fichier ZIP contenant les versions filtrées et nettoyées de vos factures est généré instantanément.

Tester avec des échantillons

csv, xlsx, xls

Hubs associés

FAQ

Quels formats de fichiers sont supportés en sortie ?

Vous pouvez exporter vos données traitées aux formats XLSX, CSV ou JSON.

Est-il possible de ré-uploader les fichiers traités sur S3 ?

Oui, en activant l'option 'Televerser Traites Fichiers retour', les fichiers seront automatiquement renvoyés vers votre bucket avec le préfixe défini.

Puis-je utiliser un endpoint S3 personnalisé ?

Absolument, le champ 'S3 Endpoint' vous permet de configurer des services de stockage compatibles S3 autres qu'AWS.

Comment le filtrage est-il appliqué ?

Vous sélectionnez une colonne, un opérateur (comme 'égal à' ou 'supérieur à') et une valeur cible pour isoler uniquement les données pertinentes.

L'outil peut-il nettoyer les données automatiquement ?

Oui, vous pouvez activer les options de suppression des espaces blancs et des lignes vides pour garantir la propreté de vos datasets.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/xlsx-s3-batch-processor

Paramètres de la requête

Nom du paramètre Type Requis Description
endpoint text Non -
region text Non -
bucket text Oui -
accessKeyId text Oui -
secretAccessKey text Oui -
sessionToken text Non -
objectKeys textarea Oui -
sheetName text Non -
headerRow number Non -
filterColumn text Non -
filterOperator select Non -
filterValue text Non -
outputFormat select Non -
csvDelimiter text Non -
trimWhitespace checkbox Non -
removeEmptyRows checkbox Non -
uploadBack checkbox Non -
outputPrefix text Non -

Format de réponse

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Fichier: Fichier

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-xlsx-s3-batch-processor": {
      "name": "xlsx-s3-batch-processor",
      "description": "Traite des xlsx en stockage objet par lot",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=xlsx-s3-batch-processor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]