Points clés
- Catégorie
- Documents et PDF
- Types d’entrée
- file, checkbox, number
- Type de sortie
- json
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Cet outil en ligne vous permet d'analyser précisément le contenu textuel de vos fichiers PDF en comptant le nombre de mots latins, de caractères CJK, de phrases, de lignes et de paragraphes. Il génère un rapport détaillé incluant une répartition par page et la liste des mots les plus fréquents pour faciliter vos travaux de traduction, de rédaction ou d'édition.
Quand l’utiliser
- •Lorsque vous devez estimer le coût d'une traduction basée sur le nombre exact de mots latins ou de caractères CJK d'un document PDF.
- •Avant de soumettre un article ou un rapport académique au format PDF pour vérifier qu'il respecte les limites strictes de caractères ou de mots.
- •Pour analyser la densité lexicale et identifier les termes récurrents dans un document volumineux grâce à la liste des mots fréquents.
Comment ça marche
- •Téléchargez votre fichier PDF (jusqu'à 100 Mo) dans la zone d'importation sécurisée.
- •Configurez les options d'analyse, comme l'activation du détail par page ou la définition du nombre de mots fréquents à lister.
- •Lancez l'analyse pour extraire et compter instantanément les mots, caractères, phrases et paragraphes.
- •Visualisez ou téléchargez le rapport statistique complet généré au format JSON.
Cas d’usage
Exemples
1. Estimation du coût de traduction d'un rapport annuel
Traducteur indépendant- Contexte
- Un traducteur reçoit un rapport annuel au format PDF et doit fournir un devis basé sur le nombre exact de mots.
- Problème
- Le PDF contient des tableaux et du texte mixte, rendant l'estimation manuelle impossible.
- Comment l’utiliser
- Il importe le fichier PDF, active l'option 'Détail par page' et définit le nombre de mots fréquents à 10.
- Configuration d’exemple
-
includePageBreakdown: true, topFrequentWords: 10 - Résultat
- Il obtient un rapport JSON indiquant 72 mots latins répartis sur 6 pages, lui permettant de calculer son tarif au mot près.
2. Vérification de la longueur d'une publication scientifique
Chercheur universitaire- Contexte
- Un chercheur doit soumettre un article scientifique au format PDF et doit s'assurer qu'il ne dépasse pas la limite de mots autorisée.
- Problème
- Le document contient des graphiques et des références qui faussent le comptage standard des traitements de texte.
- Comment l’utiliser
- Il télécharge son PDF final et désactive l'option des mots fréquents pour se concentrer uniquement sur le volume global.
- Configuration d’exemple
-
includePageBreakdown: false, topFrequentWords: 0 - Résultat
- L'outil fournit le nombre exact de mots latins et de caractères avec espaces, confirmant la conformité du document avec les règles de la revue.
Tester avec des échantillons
pdf, fileHubs associés
FAQ
L'outil prend-il en charge les langues asiatiques (chinois, japonais, coréen) ?
Oui, il compte séparément les caractères CJK et les mots latins pour une précision maximale.
Puis-je obtenir les statistiques page par page ?
Oui, en cochant l'option 'Détail par page', vous obtiendrez la répartition des mots pour chaque page du PDF.
Quelle est la taille maximale de fichier PDF acceptée ?
Vous pouvez analyser des fichiers PDF individuels d'une taille maximale de 100 Mo.
Comment sont comptés les mots fréquents ?
L'outil liste les mots les plus répétés dans le document selon le nombre (de 0 à 100) que vous avez configuré.
Mes documents PDF sont-ils conservés sur vos serveurs ?
Non, les fichiers sont traités de manière sécurisée et ne sont pas stockés de façon permanente.