Points clés
- Catégorie
- Format Conversion
- Types d’entrée
- file, text, number, select, checkbox
- Type de sortie
- file
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
L'Exportateur XLSX Parquet est un outil spécialisé conçu pour convertir vos fichiers Excel en formats de données structurées, tels que Parquet et NDJSON, facilitant ainsi leur intégration directe dans vos pipelines de données et entrepôts analytiques.
Quand l’utiliser
- •Préparer des données Excel pour une ingestion dans un lac de données ou un entrepôt cloud.
- •Convertir des feuilles de calcul volumineuses en formats optimisés pour le traitement Big Data.
- •Standardiser des données tabulaires pour des flux de travail ETL automatisés.
Comment ça marche
- •Téléchargez votre fichier Excel et spécifiez la feuille cible ainsi que la ligne contenant vos en-têtes.
- •Choisissez le mode de sortie souhaité : Parquet, NDJSON, ou une archive ZIP contenant les deux formats.
- •Activez les options de nettoyage des noms de champs et la conversion des cellules vides en valeurs nulles pour garantir la compatibilité de votre schéma.
- •Lancez la conversion pour obtenir instantanément vos fichiers prêts à l'emploi.
Cas d’usage
Exemples
1. Conversion de rapports de ventes pour Data Warehouse
Ingénieur de données- Contexte
- Une équipe commerciale fournit des rapports de ventes hebdomadaires au format XLSX, mais le système d'analyse nécessite du Parquet.
- Problème
- Convertir manuellement les fichiers Excel est inefficace et source d'erreurs de typage.
- Comment l’utiliser
- Charger le fichier 'workbook-sales.xlsx', sélectionner le mode 'Parquet' et activer le nettoyage des noms de champs.
- Configuration d’exemple
-
{"outputMode": "parquet", "useSanitizedFieldNames": true} - Résultat
- Un fichier Parquet propre et typé, prêt à être chargé dans l'entrepôt de données via le pipeline.
Tester avec des échantillons
json, xml, xlsxHubs associés
FAQ
Quels formats de sortie sont supportés ?
L'outil supporte le format Parquet, le format NDJSON, ou une archive ZIP combinant les deux.
L'outil détecte-t-il automatiquement les types de données ?
Oui, l'exportateur infère automatiquement les types de données à partir du contenu de vos colonnes Excel.
Puis-je traiter des fichiers Excel avec plusieurs feuilles ?
Oui, vous pouvez spécifier le nom de la feuille exacte que vous souhaitez convertir dans les paramètres.
Que deviennent les cellules vides dans le fichier de sortie ?
Par défaut, l'option 'Convertir Vide en Nul' transforme les cellules vides en valeurs nulles, ce qui est idéal pour les bases de données.
Y a-t-il une limite de taille pour les fichiers Excel ?
L'outil accepte des fichiers jusqu'à 100 Mo pour garantir une performance optimale lors de la conversion.