Conteo de Palabras PDF

Cuenta palabras, caracteres, oraciones y caracteres CJK en documentos PDF

Informe detallado: palabras latinas, caracteres CJK, caracteres, oraciones, líneas, párrafos, desglose por página y palabras frecuentes.

Resultados de ejemplo

1 Ejemplos

Contar palabras de un PDF multipágina

Obtiene palabras, caracteres y estadísticas por página.

{
  "totalWords": 72,
  "latinWords": 72,
  "cjkCharacters": 0,
  "charactersWithSpaces": 420,
  "pages": 6
}
Ver parámetros de entrada
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "includePageBreakdown": true, "topFrequentWords": 10 }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Número de palabras frecuentes a listar (0 para desactivar)

Datos clave

Categoría
Documentos y PDF
Tipos de entrada
file, checkbox, number
Tipo de salida
json
Cobertura de muestras
4
API disponible
Yes

Resumen

Esta herramienta de conteo de palabras en PDF analiza de forma precisa tus documentos para extraer estadísticas detalladas como el número de palabras latinas, caracteres CJK, oraciones, líneas, párrafos y la frecuencia de palabras, ofreciendo además un desglose detallado por página.

Cuándo usarlo

  • Al preparar presupuestos de traducción basados en el número exacto de palabras o caracteres de un documento PDF.
  • Al verificar que un manuscrito o ensayo en formato PDF cumpla con los límites estrictos de palabras u oraciones requeridos.
  • Al analizar documentos multilingües que contienen una mezcla de caracteres latinos y caracteres CJK (chino, japonés o coreano).

Cómo funciona

  • Sube el archivo PDF que deseas analizar desde tu dispositivo.
  • Configura si deseas incluir el desglose por página y define la cantidad de palabras más frecuentes que quieres listar.
  • Haz clic en procesar para extraer el texto y calcular las métricas de lectura.
  • Obtén un informe detallado en formato JSON con el conteo de palabras, caracteres con espacios, oraciones y estadísticas de frecuencia.

Casos de uso

Traductores profesionales que necesitan calcular tarifas exactas basadas en el volumen de palabras latinas o caracteres CJK.
Editores y autores que validan la extensión de capítulos y la densidad de palabras clave en borradores en formato PDF.
Investigadores académicos que analizan la estructura de artículos científicos mediante el conteo de oraciones, párrafos y líneas.

Ejemplos

1. Análisis de presupuesto para traducción de manual técnico

Traductor independiente
Contexto
Un cliente envió un manual técnico en formato PDF de varias páginas y requiere una cotización rápida basada en el número de palabras.
Problema
El traductor necesita saber la cantidad exacta de palabras latinas y el desglose por página para estimar el tiempo de entrega.
Cómo usarlo
Sube el archivo PDF del manual, activa la opción de desglose por página y establece el límite de palabras frecuentes en 15.
Configuración de ejemplo
{
  "includePageBreakdown": true,
  "topFrequentWords": 15
}
Resultado
Obtiene un reporte estructurado que confirma el total de palabras latinas y el volumen exacto de texto en cada página para calcular el presupuesto.

2. Verificación de manuscrito académico con caracteres CJK

Investigador universitario
Contexto
Un investigador ha redactado un artículo en PDF que combina texto en español y citas en japonés (caracteres CJK).
Problema
La revista científica exige un conteo diferenciado de palabras latinas y caracteres CJK para validar la extensión del artículo.
Cómo usarlo
Carga el PDF del artículo en la herramienta y ejecuta el análisis con los parámetros por defecto.
Configuración de ejemplo
{
  "includePageBreakdown": false,
  "topFrequentWords": 0
}
Resultado
El sistema genera un informe que separa con precisión el número de palabras latinas del total de caracteres CJK.

Probar con muestras

pdf, file

Hubs relacionados

Preguntas frecuentes

¿Qué tipo de caracteres puede contar esta herramienta?

Cuenta palabras latinas, caracteres CJK (chino, japonés y coreano), caracteres totales con y sin espacios, oraciones, líneas y párrafos.

¿Es posible ver el conteo de palabras de cada página por separado?

Sí, al activar la opción de desglose por página, la herramienta detalla las estadísticas de forma individual para cada página del PDF.

¿Cómo funciona la lista de palabras frecuentes?

Muestra las palabras más repetidas en el documento según el número límite que configures en las opciones.

¿Existe un límite de tamaño para el archivo PDF?

Sí, el tamaño máximo permitido para el archivo PDF es de 100 MB.

¿El análisis incluye el texto dentro de imágenes escaneadas?

No, la herramienta extrae y cuenta únicamente el texto digital nativo del documento PDF.

Documentación de la API

Punto final de la solicitud

POST /es/api/tools/pdf-word-count

Parámetros de la solicitud

Nombre del parámetro Tipo Requerido Descripción
sourceFile file (Subida requerida) -
includePageBreakdown checkbox No -
topFrequentWords number No Número de palabras frecuentes a listar (0 para desactivar)

Los parámetros de tipo archivo necesitan ser subidos primero vía POST /upload/pdf-word-count para obtener filePath, luego pasar filePath al campo de archivo correspondiente.

Formato de respuesta

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Datos JSON: Datos JSON

Documentación de MCP

Agregue este herramienta a su configuración de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-word-count": {
      "name": "pdf-word-count",
      "description": "Cuenta palabras, caracteres, oraciones y caracteres CJK en documentos PDF",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-word-count",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Puede encadenar múltiples herramientas, por ejemplo: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máximo 20 herramientas.

Soporte para enlaces de archivos URL o codificación Base64 para parámetros de archivo.

Si encuentra algún problema, por favor, póngase en contacto con nosotros en [email protected]