Compteur de mots PDF

Compte les mots, caractères, phrases et caractères CJK dans les documents PDF

Rapport détaillé : mots latins, caractères CJK, caractères, phrases, lignes, paragraphes, détail par page et mots fréquents.

Exemples de résultats

1 Exemples

Compter les mots d'un PDF multipage

Mots, caractères et statistiques par page.

{
  "totalWords": 72,
  "latinWords": 72,
  "cjkCharacters": 0,
  "charactersWithSpaces": 420,
  "pages": 6
}
Voir paramètres d'entrée
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "includePageBreakdown": true, "topFrequentWords": 10 }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Nombre de mots fréquents à lister (0 pour désactiver)

Points clés

Catégorie
Documents et PDF
Types d’entrée
file, checkbox, number
Type de sortie
json
Couverture des échantillons
4
API disponible
Yes

Vue d’ensemble

Cet outil en ligne vous permet d'analyser précisément le contenu textuel de vos fichiers PDF en comptant le nombre de mots latins, de caractères CJK, de phrases, de lignes et de paragraphes. Il génère un rapport détaillé incluant une répartition par page et la liste des mots les plus fréquents pour faciliter vos travaux de traduction, de rédaction ou d'édition.

Quand l’utiliser

  • Lorsque vous devez estimer le coût d'une traduction basée sur le nombre exact de mots latins ou de caractères CJK d'un document PDF.
  • Avant de soumettre un article ou un rapport académique au format PDF pour vérifier qu'il respecte les limites strictes de caractères ou de mots.
  • Pour analyser la densité lexicale et identifier les termes récurrents dans un document volumineux grâce à la liste des mots fréquents.

Comment ça marche

  • Téléchargez votre fichier PDF (jusqu'à 100 Mo) dans la zone d'importation sécurisée.
  • Configurez les options d'analyse, comme l'activation du détail par page ou la définition du nombre de mots fréquents à lister.
  • Lancez l'analyse pour extraire et compter instantanément les mots, caractères, phrases et paragraphes.
  • Visualisez ou téléchargez le rapport statistique complet généré au format JSON.

Cas d’usage

Facturation de projets de traduction en comptant précisément les mots latins et les caractères asiatiques (CJK).
Vérification de la conformité des manuscrits et thèses universitaires par rapport aux exigences de longueur des éditeurs.
Analyse sémantique rapide d'un rapport d'activité grâce à l'extraction des mots les plus fréquents.

Exemples

1. Estimation du coût de traduction d'un rapport annuel

Traducteur indépendant
Contexte
Un traducteur reçoit un rapport annuel au format PDF et doit fournir un devis basé sur le nombre exact de mots.
Problème
Le PDF contient des tableaux et du texte mixte, rendant l'estimation manuelle impossible.
Comment l’utiliser
Il importe le fichier PDF, active l'option 'Détail par page' et définit le nombre de mots fréquents à 10.
Configuration d’exemple
includePageBreakdown: true, topFrequentWords: 10
Résultat
Il obtient un rapport JSON indiquant 72 mots latins répartis sur 6 pages, lui permettant de calculer son tarif au mot près.

2. Vérification de la longueur d'une publication scientifique

Chercheur universitaire
Contexte
Un chercheur doit soumettre un article scientifique au format PDF et doit s'assurer qu'il ne dépasse pas la limite de mots autorisée.
Problème
Le document contient des graphiques et des références qui faussent le comptage standard des traitements de texte.
Comment l’utiliser
Il télécharge son PDF final et désactive l'option des mots fréquents pour se concentrer uniquement sur le volume global.
Configuration d’exemple
includePageBreakdown: false, topFrequentWords: 0
Résultat
L'outil fournit le nombre exact de mots latins et de caractères avec espaces, confirmant la conformité du document avec les règles de la revue.

Tester avec des échantillons

pdf, file

Hubs associés

FAQ

L'outil prend-il en charge les langues asiatiques (chinois, japonais, coréen) ?

Oui, il compte séparément les caractères CJK et les mots latins pour une précision maximale.

Puis-je obtenir les statistiques page par page ?

Oui, en cochant l'option 'Détail par page', vous obtiendrez la répartition des mots pour chaque page du PDF.

Quelle est la taille maximale de fichier PDF acceptée ?

Vous pouvez analyser des fichiers PDF individuels d'une taille maximale de 100 Mo.

Comment sont comptés les mots fréquents ?

L'outil liste les mots les plus répétés dans le document selon le nombre (de 0 à 100) que vous avez configuré.

Mes documents PDF sont-ils conservés sur vos serveurs ?

Non, les fichiers sont traités de manière sécurisée et ne sont pas stockés de façon permanente.

Documentation de l'API

Point de terminaison de la requête

POST /fr/api/tools/pdf-word-count

Paramètres de la requête

Nom du paramètre Type Requis Description
sourceFile file (Téléchargement requis) Oui -
includePageBreakdown checkbox Non -
topFrequentWords number Non Nombre de mots fréquents à lister (0 pour désactiver)

Les paramètres de type fichier doivent être téléchargés d'abord via POST /upload/pdf-word-count pour obtenir filePath, puis filePath doit être passé au champ de fichier correspondant.

Format de réponse

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Données JSON: Données JSON

Documentation de MCP

Ajoutez cet outil à votre configuration de serveur MCP:

{
  "mcpServers": {
    "elysiatools-pdf-word-count": {
      "name": "pdf-word-count",
      "description": "Compte les mots, caractères, phrases et caractères CJK dans les documents PDF",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-word-count",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Vous pouvez chaîner plusieurs outils, par ex.: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, max 20 outils.

Prend en charge les liens de fichiers URL ou la codification Base64 pour les paramètres de fichier.

Si vous rencontrez des problèmes, veuillez nous contacter à [email protected]