Validador lint de robots.txt

Analisa a sintaxe do robots.txt, destaca regras arriscadas e testa URLs importantes antes da publicacao

Exemplos de resultados

1 Exemplos

Encontre uma regra Disallow mal formada antes de publicar

Valida um rascunho de robots.txt e testa URLs importantes como /admin e /blog antes do deploy.

{
  "summary": {
    "errorCount": 1,
    "testedUrlCount": 3
  }
}
Ver parâmetros de entrada
{ "robotsText": "User-agent: *\nDisallow /admin\nAllow: /admin/help", "siteOrigin": "https://example.com", "testUrls": "/admin\n/admin/help\n/blog" }

Click to upload file or drag and drop file here

Maximum file size: 0MB Supported formats: text/plain, application/octet-stream, .txt

Fatos principais

Categoria
Segurança e validação
Tipos de entrada
textarea, file, text
Tipo de saída
json
Cobertura de amostras
4
API disponível
Yes

Visão geral

O Validador lint de robots.txt permite analisar a sintaxe das diretivas do seu arquivo robots.txt, identificar regras arriscadas ou incorretas e testar a acessibilidade de URLs específicas para rastreadores antes de publicar as alterações no seu site.

Quando usar

  • Antes de publicar um novo arquivo robots.txt ou atualizar regras de rastreamento existentes.
  • Ao diagnosticar problemas de indexação no Googlebot ou outros crawlers de mecanismos de busca.
  • Para testar se URLs críticas, como páginas de checkout ou painéis administrativos, estão corretamente bloqueadas ou permitidas.

Como funciona

  • Insira o conteúdo do seu robots.txt diretamente na área de texto ou faça o upload do arquivo .txt.
  • Defina a origem do site (ex: https://example.com) e insira as URLs que deseja testar contra as regras definidas.
  • O validador analisa a sintaxe linha por linha, sinaliza erros de formatação e exibe o status de permissão para cada URL de teste.

Casos de uso

Validação de sintaxe de rascunhos de robots.txt antes do deploy em produção.
Simulação de comportamento de rastreamento para caminhos dinâmicos e parâmetros de URL.
Verificação de conformidade de sitemaps declarados no arquivo robots.txt.

Exemplos

1. Corrigindo regra de Disallow malformada

Especialista em SEO
Contexto
Um especialista em SEO está preparando um novo arquivo robots.txt para um e-commerce, mas quer garantir que a sintaxe de bloqueio do painel administrativo esteja correta.
Problema
Uma regra de Disallow sem dois-pontos ou mal formatada pode fazer com que os crawlers indexem páginas confidenciais.
Como usar
Insira o texto do robots.txt no campo de texto, defina a origem como https://lojaexemplo.com e adicione /admin nas URLs de teste.
Configuração de exemplo
robotsText: "User-agent: *\nDisallow /admin\nAllow: /admin/help"\nsiteOrigin: "https://lojaexemplo.com"\ntestUrls: "/admin\n/admin/help"
Resultado
O validador aponta um erro de sintaxe na linha do Disallow (falta de dois-pontos) e mostra que a URL /admin não foi bloqueada corretamente devido ao erro.

2. Testando bloqueio de checkout e caminhos dinâmicos

Desenvolvedor Web
Contexto
Um desenvolvedor precisa garantir que páginas de finalização de compra e carrinhos de compras não sejam rastreadas por robôs de busca.
Problema
Garantir que a regra de exclusão impeça o rastreamento de URLs como /checkout/success sem bloquear acidentalmente a página inicial.
Como usar
Faça o upload do arquivo robots.txt atual, configure a origem do site e liste as URLs /checkout/success e / no campo de teste.
Configuração de exemplo
robotsText: "User-agent: *\nDisallow: /checkout/\nAllow: /"\nsiteOrigin: "https://meusite.com"\ntestUrls: "/checkout/success\n/"
Resultado
O relatório JSON confirma que /checkout/success está bloqueado com sucesso e a página inicial / permanece acessível para rastreamento.

Testar com amostras

text, file

Hubs relacionados

FAQ

O que é um validador lint de robots.txt?

É uma ferramenta que analisa a sintaxe do arquivo robots.txt para garantir que os rastreadores de busca interpretem as diretivas corretamente.

Posso testar URLs específicas com esta ferramenta?

Sim, basta inserir as URLs no campo de teste para verificar se elas seriam bloqueadas ou permitidas pelas regras informadas.

O que acontece se eu não definir a origem do site?

A ferramenta utiliza a origem padrão configurada para resolver caminhos relativos durante a validação das URLs de teste.

A ferramenta suporta o upload direto de arquivos robots.txt?

Sim, você pode fazer o upload direto de um arquivo .txt para validação rápida.

Como o validador identifica erros de sintaxe?

Ele analisa a estrutura de diretivas como User-agent, Disallow, Allow e Sitemap, apontando erros de digitação ou formatação inválida.

Documentação da API

Ponto final da solicitação

POST /pt/api/tools/robots-txt-lint-validator

Parâmetros da solicitação

Nome do parâmetro Tipo Requerido Descrição
robotsText textarea Não -
robotsFile file (Upload necessário) Não -
siteOrigin text Sim -
testUrls textarea Não -

Os parâmetros de tipo arquivo precisam ser carregados primeiro via POST /upload/robots-txt-lint-validator para obter filePath, depois filePath deve ser passado ao campo de arquivo correspondente.

Formato de resposta

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Dados JSON: Dados JSON

Documentação de MCP

Adicione este ferramenta à sua configuração de servidor MCP:

{
  "mcpServers": {
    "elysiatools-robots-txt-lint-validator": {
      "name": "robots-txt-lint-validator",
      "description": "Analisa a sintaxe do robots.txt, destaca regras arriscadas e testa URLs importantes antes da publicacao",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=robots-txt-lint-validator",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Você pode encadear várias ferramentas, ex: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máx 20 ferramentas.

Suporta links de arquivos URL ou codificação Base64 para parâmetros de arquivo.

Se você encontrar algum problema, por favor, entre em contato conosco em [email protected]