Points clés
- Catégorie
- Images, audio et vidéo
- Types d’entrée
- file, select, text, checkbox
- Type de sortie
- html
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Cet outil extrait automatiquement les images de vos documents PDF et les associe aux légendes correspondantes en analysant la structure spatiale et sémantique du fichier. Il génère ensuite un rapport HTML interactif permettant de visualiser, naviguer et récupérer facilement toutes les ressources visuelles et leurs contextes textuels.
Quand l’utiliser
- •Pour récupérer des figures et leurs descriptions dans des rapports techniques ou scientifiques volumineux.
- •Pour archiver les éléments visuels d'un manuel d'utilisation sans perdre le lien avec le texte explicatif.
- •Pour créer rapidement un catalogue d'images navigable à partir d'un document de présentation ou d'un portfolio PDF.
Comment ça marche
- •L'outil analyse le fichier PDF pour identifier les ressources graphiques et les blocs de texte environnants.
- •Il utilise l'arbre de structure du document pour lier chaque image à la légende la plus proche sur la page.
- •Les images sont converties au format PNG ou JPEG selon vos préférences de qualité et de poids.
- •Un fichier HTML est généré, regroupant les images extraites, leurs légendes associées et les numéros de page.
Cas d’usage
Exemples
1. Extraction de figures scientifiques
Chercheur académique- Contexte
- Un chercheur dispose d'une thèse de 200 pages contenant de nombreux graphiques et diagrammes complexes.
- Problème
- Il doit isoler chaque graphique avec sa légende exacte pour préparer une présentation sans effectuer de captures d'écran manuelles.
- Comment l’utiliser
- Télécharger le PDF de la thèse, sélectionner le format PNG et activer l'option 'Utiliser l'arbre de structure'.
- Résultat
- Un rapport HTML listant chaque graphique avec sa légende numérotée (ex: 'Figure 12 : Analyse des spectres') prête à être copiée.
2. Inventaire de catalogue immobilier
Agent immobilier- Contexte
- Une agence reçoit des brochures PDF contenant des photos de propriétés avec des descriptions courtes situées juste en dessous.
- Problème
- Extraire les photos pour les réseaux sociaux tout en conservant le texte descriptif associé pour chaque bien.
- Comment l’utiliser
- Charger le catalogue PDF, spécifier les pages des annonces et choisir le format JPEG pour un poids réduit.
- Résultat
- Un index HTML permettant de visualiser chaque photo de maison avec son descriptif correspondant, facilitant la publication sur le web.
Tester avec des échantillons
html, pdf, imageHubs associés
FAQ
Quels formats d'image sont supportés pour l'export ?
Vous pouvez choisir d'exporter les images extraites au format PNG ou JPEG.
Puis-je limiter l'extraction à certaines pages ?
Oui, vous pouvez spécifier des pages individuelles ou des plages de pages, par exemple '1, 3, 5-10'.
À quoi sert l'option 'Utiliser l'arbre de structure' ?
Elle permet d'utiliser les balises internes du PDF pour identifier plus précisément les légendes liées aux images.
Le rapport final est-il téléchargeable ?
Oui, l'outil génère un fichier HTML complet contenant les images et les textes associés.
L'outil peut-il extraire des images de PDF protégés ?
Le fichier PDF doit être déverrouillé et accessible sans mot de passe pour permettre l'extraction des données.