Points clés
- Catégorie
- Documents et PDF
- Types d’entrée
- file, select, checkbox
- Type de sortie
- json
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Cet outil de comparaison de PDF vous permet d'analyser deux documents page par page pour identifier précisément les modifications textuelles. En extrayant le texte de chaque fichier, il compare les contenus par mot, par ligne ou par caractère, et calcule un score de similarité globale pour repérer instantanément les ajouts, suppressions et modifications.
Quand l’utiliser
- •Lors de la révision de contrats ou de documents juridiques pour vérifier les modifications entre deux versions de PDF.
- •Pour valider les corrections apportées à un rapport ou un document technique après une phase de relecture.
- •Pour comparer des fichiers PDF générés automatiquement afin de s'assurer de la cohérence du texte extrait.
Comment ça marche
- •Téléversez le fichier PDF original et le fichier PDF modifié dans les champs prévus à cet effet.
- •Sélectionnez le mode de comparaison (par mot, par ligne ou par caractère) et configurez la sensibilité à la casse et la gestion des espaces.
- •Lancez l'analyse pour extraire le texte et générer un rapport JSON contenant le taux de similarité globale et le détail des différences.
Cas d’usage
Exemples
1. Comparaison de deux versions d'un contrat de travail
Responsable des ressources humaines- Contexte
- Un contrat de travail a été modifié par un collaborateur externe et renvoyé au format PDF. Le responsable RH doit s'assurer que seules les clauses convenues ont été modifiées.
- Problème
- Identifier rapidement les mots ajoutés ou supprimés dans le document de 5 pages sans le relire entièrement.
- Comment l’utiliser
- Charger le contrat initial dans 'PDF original', la version retournée dans 'PDF modifié', choisir le mode de comparaison 'Par mot' et valider.
- Configuration d’exemple
-
{ "comparisonMode": "word", "caseSensitive": false, "ignoreWhitespace": true } - Résultat
- Un rapport JSON est généré, indiquant une similarité globale de 98% et listant précisément les mots modifiés à la page 3.
2. Vérification de la mise à jour d'un manuel technique
Rédacteur technique- Contexte
- Après la mise à jour d'une notice d'utilisation, le rédacteur doit valider que les lignes de consignes de sécurité n'ont pas été altérées par erreur.
- Problème
- Comparer rigoureusement le texte ligne par ligne pour détecter tout décalage ou modification involontaire.
- Comment l’utiliser
- Importer l'ancien manuel et le nouveau manuel PDF, sélectionner le mode de comparaison 'Par ligne' et activer la sensibilité à la casse.
- Configuration d’exemple
-
{ "comparisonMode": "line", "caseSensitive": true, "ignoreWhitespace": false } - Résultat
- L'outil confirme une similarité de 94% et met en évidence les deux lignes modifiées dans la section de sécurité.
Tester avec des échantillons
pdf, text, fileHubs associés
FAQ
Quels formats de fichiers sont acceptés ?
L'outil accepte uniquement les fichiers au format PDF.
Comment fonctionne le mode de comparaison ?
Vous pouvez comparer le texte extrait des PDF par mot, par ligne ou par caractère individuel.
L'outil compare-t-il les images ou la mise en page ?
Non, l'outil extrait et compare uniquement le contenu textuel des documents PDF.
Peut-on ignorer les différences de majuscules ou d'espaces ?
Oui, vous pouvez activer ou désactiver la sensibilité à la casse et choisir d'ignorer les espaces dans les options.
Quel est le résultat fourni par l'outil ?
L'outil génère un rapport au format JSON indiquant le nombre de pages de chaque fichier et le pourcentage de similarité globale.