Extracteur de texte barre PDF

Detecte le texte barre dans les PDF de revision et genere un rapport pour contrats et brouillons

Apres le chargement dun PDF, loutil active la detection de texte barre dOpenDataLoader et extrait le texte supprime ou marque pour revision depuis JSON et Markdown afin de verifier rapidement les differences.

Exemples de résultats

1 Exemples

Extraire les clauses barrees dun PDF relu

Le sample reel liste les textes barres pour une verification rapide.

pdf-strikethrough-review-extractor-example1.html Voir fichier
Voir paramètres d'entrée
{ "pdfFile": "/public/samples/pdf/pdf-strikethrough-review-extractor-source-example1.pdf", "pages": "", "useStructTree": true }

Click to upload file or drag and drop file here

Maximum file size: 10MB Supported formats: application/pdf

Points clés

Catégorie
Développement et Web
Types d’entrée
file, text, checkbox
Type de sortie
html
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

L'Extracteur de texte barré PDF est un outil spécialisé conçu pour identifier et extraire automatiquement les segments de texte marqués d'une ligne de suppression dans vos documents PDF. En s'appuyant sur la détection avancée d'OpenDataLoader, il génère un rapport clair des modifications, facilitant ainsi l'analyse des révisions contractuelles, des brouillons éditoriaux et des documents de conformité sans avoir à parcourir manuellement chaque page.

Quand l’utiliser

  • Lors de la révision de contrats juridiques pour identifier précisément les clauses supprimées par une contrepartie.
  • Pour auditer des documents de conformité où les anciennes règles ont été barrées au profit de nouvelles versions.
  • Dans un flux de travail éditorial pour extraire les corrections et les suppressions suggérées dans un manuscrit.

Comment ça marche

  • Téléchargez votre fichier PDF contenant du texte barré ou des annotations de révision.
  • Spécifiez les pages à analyser et choisissez d'utiliser l'arbre de structure pour une détection contextuelle précise.
  • L'outil active l'algorithme OpenDataLoader pour isoler les caractères et mots formatés avec un trait de suppression.
  • Un rapport HTML est généré, listant l'intégralité du texte supprimé pour une vérification rapide.

Cas d’usage

Comparaison de versions de contrats pour lister les suppressions effectuées par le service juridique.
Extraction de corrections dans des épreuves de mise en page avant la publication finale.
Audit de politiques internes pour archiver les anciennes mentions invalidées par un trait de suppression.

Exemples

1. Analyse de révision contractuelle

Juriste d'entreprise
Contexte
Un juriste reçoit une version annotée d'un contrat de 50 pages où plusieurs clauses ont été barrées par la partie adverse.
Problème
Identifier manuellement chaque suppression est chronophage et présente un risque d'oubli important.
Comment l’utiliser
Charger le contrat PDF, sélectionner toutes les pages et activer l'option 'Utiliser l'arbre de structure'.
Résultat
Un rapport HTML listant chaque phrase barrée, permettant une validation immédiate des changements sans lecture intégrale.

2. Nettoyage de manuscrit éditorial

Éditeur de presse
Contexte
Un auteur a envoyé un PDF de son article avec des ratures numériques pour indiquer les passages à supprimer avant impression.
Problème
L'éditeur doit transmettre la liste exacte des coupes définitives au service de mise en page.
Comment l’utiliser
Téléverser le PDF de l'article et lancer l'extraction sur les pages spécifiques du manuscrit.
Résultat
Une liste propre de tous les textes supprimés, prête à être utilisée pour finaliser la version de publication.

Tester avec des échantillons

pdf, text, file

Hubs associés

FAQ

Quels types de fichiers sont supportés ?

L'outil traite exclusivement les fichiers au format PDF.

Puis-je limiter l'extraction à certaines pages ?

Oui, vous pouvez définir des pages spécifiques ou des plages de pages comme '1, 3, 5-7' dans les options.

À quoi sert l'option 'Arbre de structure' ?

Elle utilise les métadonnées internes du PDF pour améliorer la précision de la détection du texte barré.

Le texte barré manuellement avec un crayon est-il détecté ?

L'outil détecte le texte possédant l'attribut de formatage 'barré' ou marqué via les outils de révision PDF standards.

Sous quel format le résultat est-il fourni ?

Le résultat est exporté sous forme d'un rapport HTML structuré.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/pdf-strikethrough-review-extractor

Paramètres de la requête

Nom du paramètre Type Requis Description
pdfFile file (Téléchargement requis) Oui -
pages text Non -
useStructTree checkbox Non -

Les paramètres de type fichier doivent être téléchargés d'abord via POST /upload/pdf-strikethrough-review-extractor pour obtenir filePath, puis filePath doit être passé au champ de fichier correspondant.

Format de réponse

{
  "result": "
Processed HTML content
", "error": "Error message (optional)", "message": "Notification message (optional)", "metadata": { "key": "value" } }
HTML: HTML

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-pdf-strikethrough-review-extractor": {
      "name": "pdf-strikethrough-review-extractor",
      "description": "Detecte le texte barre dans les PDF de revision et genere un rapport pour contrats et brouillons",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-strikethrough-review-extractor",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Prend en charge les liens de fichiers URL ou la codification Base64 pour les paramètres de fichier.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]