Contador de palavras PDF

Conta palavras, caracteres, frases e caracteres CJK em documentos PDF

Relatório detalhado: palavras latinas, caracteres CJK, caracteres, frases, linhas, parágrafos, detalhamento por página e palavras frequentes.

Exemplos de resultados

1 Exemplos

Contar palavras de um PDF multipágina

Palavras, caracteres e estatísticas por página.

{
  "totalWords": 72,
  "latinWords": 72,
  "cjkCharacters": 0,
  "charactersWithSpaces": 420,
  "pages": 6
}
Ver parâmetros de entrada
{ "sourceFile": "/public/samples/pdf/sample-multipage.pdf", "includePageBreakdown": true, "topFrequentWords": 10 }

Click to upload file or drag and drop file here

Maximum file size: 100MB Supported formats: application/pdf

Número de palavras frequentes a listar (0 para desativar)

Fatos principais

Categoria
Documentos e PDF
Tipos de entrada
file, checkbox, number
Tipo de saída
json
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Contador de palavras PDF é uma ferramenta online que analisa seus documentos PDF para fornecer estatísticas detalhadas de texto, incluindo a contagem de palavras latinas, caracteres CJK, frases, linhas, parágrafos e a frequência de palavras mais comuns.

Quando usar

  • Quando você precisa verificar o limite de palavras ou caracteres de um artigo, tese ou relatório acadêmico em formato PDF.
  • Para analisar documentos multilíngues que contêm caracteres CJK (chinês, japonês e coreano) e palavras latinas misturadas.
  • Para obter um detalhamento estatístico por página e identificar as palavras mais frequentes em um documento PDF.

Como funciona

  • Carregue o seu arquivo PDF diretamente na ferramenta.
  • Escolha se deseja incluir o detalhamento por página e defina a quantidade de palavras frequentes que deseja listar.
  • Clique em processar para extrair o texto e gerar o relatório estatístico em formato JSON com a contagem exata de palavras, caracteres e frases.

Casos de uso

Tradutores que precisam calcular o orçamento de tradução com base no número exato de palavras latinas ou caracteres CJK em um PDF.
Estudantes e pesquisadores que precisam validar se o seu artigo científico atende aos limites de palavras exigidos por periódicos.
Criadores de conteúdo e editores que desejam analisar a densidade de palavras-chave e a frequência de termos em e-books ou relatórios.

Exemplos

1. Contagem de palavras para orçamento de tradução

Tradutor freelancer
Contexto
Um tradutor recebeu um manual técnico em PDF e precisa enviar um orçamento baseado na quantidade exata de palavras latinas.
Problema
O PDF possui muitas páginas e o tradutor precisa saber o número exato de palavras e as palavras mais frequentes para identificar termos técnicos repetitivos.
Como usar
Carregou o arquivo PDF do manual, ativou o detalhamento por página e definiu o limite de palavras frequentes para 15.
Configuração de exemplo
{"includePageBreakdown": true, "topFrequentWords": 15}
Resultado
Obteve um relatório detalhado mostrando 72 palavras latinas no total e a lista dos termos mais frequentes para planejar o glossário.

2. Validação de artigo acadêmico multilíngue

Pesquisador acadêmico
Contexto
Um pesquisador escreveu um artigo contendo citações em chinês e texto principal em português, e precisa submetê-lo a uma revista científica.
Problema
A revista exige um limite estrito de caracteres e palavras, diferenciando caracteres CJK de palavras latinas.
Como usar
Enviou o PDF do artigo para a ferramenta mantendo as configurações padrão de análise.
Configuração de exemplo
{"includePageBreakdown": true, "topFrequentWords": 10}
Resultado
O sistema retornou a contagem exata de caracteres CJK e palavras latinas, permitindo ajustar o texto antes do envio.

Testar com amostras

pdf, file

Hubs relacionados

FAQ

Como a ferramenta conta caracteres CJK?

A ferramenta identifica e conta individualmente os caracteres de chinês, japonês e coreano, separando-os das palavras latinas para garantir precisão em textos multilíngues.

Posso ver a contagem de palavras de cada página separadamente?

Sim, basta ativar a opção de detalhamento por página para visualizar as estatísticas individuais de cada página do PDF.

O que é a lista de palavras frequentes?

É um recurso que identifica e exibe as palavras que mais se repetem no documento, ajudando a analisar a densidade de palavras-chave.

Existe um limite de tamanho para o arquivo PDF?

Sim, a ferramenta suporta arquivos PDF com tamanho máximo de até 100 MB.

A ferramenta conta espaços em branco?

Sim, o relatório inclui a contagem total de caracteres com espaços incluídos.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/pdf-word-count

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
sourceFile file (Upload necessário) Sim -
includePageBreakdown checkbox Não -
topFrequentWords number Não Número de palavras frequentes a listar (0 para desativar)

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/pdf-word-count para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Dados JSON: Dados JSON

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-pdf-word-count": {
      "name": "pdf-word-count",
      "description": "Conta palavras, caracteres, frases e caracteres CJK em documentos PDF",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=pdf-word-count",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]