Datos clave
- Categoría
- Documentos y PDF
- Tipos de entrada
- file, checkbox, number
- Tipo de salida
- json
- Cobertura de muestras
- 4
- API disponible
- Yes
Resumen
Esta herramienta de conteo de palabras en PDF analiza de forma precisa tus documentos para extraer estadísticas detalladas como el número de palabras latinas, caracteres CJK, oraciones, líneas, párrafos y la frecuencia de palabras, ofreciendo además un desglose detallado por página.
Cuándo usarlo
- •Al preparar presupuestos de traducción basados en el número exacto de palabras o caracteres de un documento PDF.
- •Al verificar que un manuscrito o ensayo en formato PDF cumpla con los límites estrictos de palabras u oraciones requeridos.
- •Al analizar documentos multilingües que contienen una mezcla de caracteres latinos y caracteres CJK (chino, japonés o coreano).
Cómo funciona
- •Sube el archivo PDF que deseas analizar desde tu dispositivo.
- •Configura si deseas incluir el desglose por página y define la cantidad de palabras más frecuentes que quieres listar.
- •Haz clic en procesar para extraer el texto y calcular las métricas de lectura.
- •Obtén un informe detallado en formato JSON con el conteo de palabras, caracteres con espacios, oraciones y estadísticas de frecuencia.
Casos de uso
Ejemplos
1. Análisis de presupuesto para traducción de manual técnico
Traductor independiente- Contexto
- Un cliente envió un manual técnico en formato PDF de varias páginas y requiere una cotización rápida basada en el número de palabras.
- Problema
- El traductor necesita saber la cantidad exacta de palabras latinas y el desglose por página para estimar el tiempo de entrega.
- Cómo usarlo
- Sube el archivo PDF del manual, activa la opción de desglose por página y establece el límite de palabras frecuentes en 15.
- Configuración de ejemplo
-
{ "includePageBreakdown": true, "topFrequentWords": 15 } - Resultado
- Obtiene un reporte estructurado que confirma el total de palabras latinas y el volumen exacto de texto en cada página para calcular el presupuesto.
2. Verificación de manuscrito académico con caracteres CJK
Investigador universitario- Contexto
- Un investigador ha redactado un artículo en PDF que combina texto en español y citas en japonés (caracteres CJK).
- Problema
- La revista científica exige un conteo diferenciado de palabras latinas y caracteres CJK para validar la extensión del artículo.
- Cómo usarlo
- Carga el PDF del artículo en la herramienta y ejecuta el análisis con los parámetros por defecto.
- Configuración de ejemplo
-
{ "includePageBreakdown": false, "topFrequentWords": 0 } - Resultado
- El sistema genera un informe que separa con precisión el número de palabras latinas del total de caracteres CJK.
Probar con muestras
pdf, fileHubs relacionados
Preguntas frecuentes
¿Qué tipo de caracteres puede contar esta herramienta?
Cuenta palabras latinas, caracteres CJK (chino, japonés y coreano), caracteres totales con y sin espacios, oraciones, líneas y párrafos.
¿Es posible ver el conteo de palabras de cada página por separado?
Sí, al activar la opción de desglose por página, la herramienta detalla las estadísticas de forma individual para cada página del PDF.
¿Cómo funciona la lista de palabras frecuentes?
Muestra las palabras más repetidas en el documento según el número límite que configures en las opciones.
¿Existe un límite de tamaño para el archivo PDF?
Sí, el tamaño máximo permitido para el archivo PDF es de 100 MB.
¿El análisis incluye el texto dentro de imágenes escaneadas?
No, la herramienta extrae y cuenta únicamente el texto digital nativo del documento PDF.