Extracteur dimages et captions PDF

Extrait les images PDF, associe les captions voisines et genere un index HTML navigable

Apres le chargement dun PDF, loutil exporte les ressources visuelles, analyse le JSON structure et associe a chaque image les captions les plus proches selon la page et la position avant de produire un rapport HTML.

Exemples de résultats

1 Exemples

Extraire les images PDF et leurs captions

Le sample reel a produit un rapport HTML navigable avec images et captions.

pdf-image-caption-extractor-example1.html Voir fichier
Voir paramètres d'entrée
{ "pdfFile": "/public/samples/pdf/pdf-image-caption-extractor-source-example1.pdf", "imageFormat": "png", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Points clés

Catégorie
Images, audio et vidéo
Types d’entrée
file, select, text, checkbox
Type de sortie
html
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

Cet outil extrait automatiquement les images de vos documents PDF et les associe aux légendes correspondantes en analysant la structure spatiale et sémantique du fichier. Il génère ensuite un rapport HTML interactif permettant de visualiser, naviguer et récupérer facilement toutes les ressources visuelles et leurs contextes textuels.

Quand l’utiliser

  • Pour récupérer des figures et leurs descriptions dans des rapports techniques ou scientifiques volumineux.
  • Pour archiver les éléments visuels d'un manuel d'utilisation sans perdre le lien avec le texte explicatif.
  • Pour créer rapidement un catalogue d'images navigable à partir d'un document de présentation ou d'un portfolio PDF.

Comment ça marche

  • L'outil analyse le fichier PDF pour identifier les ressources graphiques et les blocs de texte environnants.
  • Il utilise l'arbre de structure du document pour lier chaque image à la légende la plus proche sur la page.
  • Les images sont converties au format PNG ou JPEG selon vos préférences de qualité et de poids.
  • Un fichier HTML est généré, regroupant les images extraites, leurs légendes associées et les numéros de page.

Cas d’usage

Extraction de schémas techniques et de leurs légendes pour alimenter une base de connaissances.
Récupération de photos de produits et de leurs descriptions pour un site e-commerce à partir d'un catalogue.
Audit de documents de design pour vérifier la cohérence entre les illustrations et les titres de figures.

Exemples

1. Extraction de figures scientifiques

Chercheur académique
Contexte
Un chercheur dispose d'une thèse de 200 pages contenant de nombreux graphiques et diagrammes complexes.
Problème
Il doit isoler chaque graphique avec sa légende exacte pour préparer une présentation sans effectuer de captures d'écran manuelles.
Comment l’utiliser
Télécharger le PDF de la thèse, sélectionner le format PNG et activer l'option 'Utiliser l'arbre de structure'.
Résultat
Un rapport HTML listant chaque graphique avec sa légende numérotée (ex: 'Figure 12 : Analyse des spectres') prête à être copiée.

2. Inventaire de catalogue immobilier

Agent immobilier
Contexte
Une agence reçoit des brochures PDF contenant des photos de propriétés avec des descriptions courtes situées juste en dessous.
Problème
Extraire les photos pour les réseaux sociaux tout en conservant le texte descriptif associé pour chaque bien.
Comment l’utiliser
Charger le catalogue PDF, spécifier les pages des annonces et choisir le format JPEG pour un poids réduit.
Résultat
Un index HTML permettant de visualiser chaque photo de maison avec son descriptif correspondant, facilitant la publication sur le web.

Tester avec des échantillons

html, pdf, image

Hubs associés

FAQ

Quels formats d'image sont supportés pour l'export ?

Vous pouvez choisir d'exporter les images extraites au format PNG ou JPEG.

Puis-je limiter l'extraction à certaines pages ?

Oui, vous pouvez spécifier des pages individuelles ou des plages de pages, par exemple '1, 3, 5-10'.

À quoi sert l'option 'Utiliser l'arbre de structure' ?

Elle permet d'utiliser les balises internes du PDF pour identifier plus précisément les légendes liées aux images.

Le rapport final est-il téléchargeable ?

Oui, l'outil génère un fichier HTML complet contenant les images et les textes associés.

L'outil peut-il extraire des images de PDF protégés ?

Le fichier PDF doit être déverrouillé et accessible sans mot de passe pour permettre l'extraction des données.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/pdf-image-caption-extractor

Paramètres de la requête

Nom du paramètre Type Requis Description
pdfFile file (Téléchargement requis) Oui -
imageFormat select Non -
pages text Non -
useStructTree checkbox Non -

Les paramètres de type fichier doivent être téléchargés d'abord via POST /upload/pdf-image-caption-extractor pour obtenir filePath, puis filePath doit être passé au champ de fichier correspondant.

Format de réponse

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-pdf-image-caption-extractor": {
      "name": "pdf-image-caption-extractor",
      "description": "Extrait les images PDF, associe les captions voisines et genere un index HTML navigable",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-image-caption-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Prend en charge les liens de fichiers URL ou la codification Base64 pour les paramètres de fichier.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]