Extracteur de plage de pages PDF

Extrait uniquement une plage de pages PDF et lexporte en Markdown, JSON ou texte

Apres avoir charge un PDF, saisissez une expression de pages comme 1,3,5-7 et loutil traitera uniquement ces pages. Cest pratique pour les longs rapports, manuels, articles ou contrats quand seul un extrait est necessaire.

Exemples de résultats

1 Exemples

Extraire seulement les deux premieres pages

Le sample reel a exporte les pages 1-2 en Markdown reutilisable.

pdf-page-range-extractor-example1.md Voir fichier
Voir paramètres d'entrée
{ "pdfFile": "/public/samples/pdf/financial-report-example1.pdf", "exportFormat": "markdown", "pages": "1-2", "useStructTree": true, "keepLineBreaks": true, "includePageSeparators": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Points clés

Catégorie
Développement et Web
Types d’entrée
file, select, text, checkbox
Type de sortie
file
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

L'Extracteur de plage de pages PDF est un outil pratique permettant de cibler et d'extraire des pages spécifiques d'un document PDF pour les convertir en Markdown, JSON ou texte brut. Idéal pour traiter de longs rapports, des manuels ou des contrats, il vous suffit de définir les numéros de pages souhaités (par exemple, 1,3,5-7) pour isoler rapidement l'information pertinente sans avoir à traiter l'intégralité du fichier.

Quand l’utiliser

  • Extraire un chapitre spécifique ou une annexe d'un long manuel technique.
  • Isoler les clauses clés d'un contrat juridique volumineux pour une analyse rapide.
  • Préparer des extraits de rapports financiers pour alimenter des systèmes d'intelligence artificielle.

Comment ça marche

  • Téléversez votre fichier PDF dans l'outil.
  • Saisissez la plage de pages à extraire en utilisant des virgules ou des tirets (ex: 1,3,5-7).
  • Choisissez le format d'exportation souhaité (Markdown, JSON ou Texte) et ajustez les options de formatage.
  • Lancez l'extraction pour télécharger le fichier contenant uniquement les pages sélectionnées.

Cas d’usage

Conversion ciblée de sections de thèses ou d'articles de recherche pour des citations.
Extraction de tableaux financiers situés sur des pages précises d'un bilan annuel.
Création de résumés de documents légaux en ne conservant que les pages de signatures et de conditions.

Exemples

1. Extraction d'un résumé financier

Analyste financier
Contexte
Un analyste doit récupérer uniquement le bilan et le compte de résultat situés aux pages 4 et 5 d'un rapport annuel de 100 pages.
Problème
Convertir tout le document est inutile et pollue les données avec du texte marketing.
Comment l’utiliser
Téléversez le rapport PDF, saisissez 4-5 dans le champ Pages, et choisissez l'export Markdown.
Configuration d’exemple
Pages: 4-5, Format: Markdown, Conserver les sauts de ligne: Oui
Résultat
Un fichier Markdown propre contenant uniquement les données financières des pages 4 et 5, prêt à être analysé.

2. Isolement de clauses contractuelles

Assistant juridique
Contexte
Un assistant doit extraire les pages 1, 15 et 22 d'un contrat de prestation de services pour les intégrer dans un logiciel de gestion.
Problème
Copier-coller manuellement le texte depuis le PDF entraîne des erreurs de formatage et une perte de temps.
Comment l’utiliser
Chargez le contrat PDF, indiquez 1,15,22 dans la sélection des pages, et sélectionnez l'export JSON.
Configuration d’exemple
Pages: 1,15,22, Format: JSON, Inclure des séparateurs de page: Oui
Résultat
Un fichier JSON structuré contenant le texte exact des trois pages spécifiées, facilement importable dans la base de données.

Tester avec des échantillons

json, markdown, pdf

Hubs associés

FAQ

Quels formats d'exportation sont pris en charge ?

Vous pouvez exporter les pages extraites au format Markdown, JSON ou texte brut.

Comment formater la sélection des pages ?

Utilisez des virgules pour les pages individuelles et des tirets pour les plages continues, par exemple 1,3,5-7.

L'outil conserve-t-il la structure originale du document ?

Oui, en activant l'option Utiliser l'arbre de structure, l'outil tente de préserver la hiérarchie et la mise en page du PDF.

Puis-je garder les sauts de ligne d'origine ?

Absolument, une option Conserver les sauts de ligne est disponible pour maintenir le formatage du texte.

Est-il possible de séparer visuellement les pages dans le fichier exporté ?

Oui, vous pouvez cocher l'option Inclure des séparateurs de page pour identifier facilement où commence et se termine chaque page.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/pdf-page-range-extractor

Paramètres de la requête

Nom du paramètre Type Requis Description
pdfFile file (Téléchargement requis) Oui -
exportFormat select Non -
pages text Oui -
useStructTree checkbox Non -
keepLineBreaks checkbox Non -
includePageSeparators checkbox Non -

Les paramètres de type fichier doivent être téléchargés d'abord via POST /upload/pdf-page-range-extractor pour obtenir filePath, puis filePath doit être passé au champ de fichier correspondant.

Format de réponse

{
  "filePath": "/public/processing/randomid.ext",
  "fileName": "output.ext",
  "contentType": "application/octet-stream",
  "size": 1024,
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Fichier: Fichier

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-pdf-page-range-extractor": {
      "name": "pdf-page-range-extractor",
      "description": "Extrait uniquement une plage de pages PDF et lexporte en Markdown, JSON ou texte",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-page-range-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Prend en charge les liens de fichiers URL ou la codification Base64 pour les paramètres de fichier.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]