Validador lint de robots.txt

Fatos principais

Categoria: Segurança e validação
Tipos de entrada: textarea, file, text
Tipo de saída: json
Cobertura de amostras: 4
API disponível: Yes

Visão geral

O Validador lint de robots.txt permite analisar a sintaxe das diretivas do seu arquivo robots.txt, identificar regras arriscadas ou incorretas e testar a acessibilidade de URLs específicas para rastreadores antes de publicar as alterações no seu site.

Quando usar

•Antes de publicar um novo arquivo robots.txt ou atualizar regras de rastreamento existentes.
•Ao diagnosticar problemas de indexação no Googlebot ou outros crawlers de mecanismos de busca.
•Para testar se URLs críticas, como páginas de checkout ou painéis administrativos, estão corretamente bloqueadas ou permitidas.

Como funciona

•Insira o conteúdo do seu robots.txt diretamente na área de texto ou faça o upload do arquivo .txt.
•Defina a origem do site (ex: https://example.com) e insira as URLs que deseja testar contra as regras definidas.
•O validador analisa a sintaxe linha por linha, sinaliza erros de formatação e exibe o status de permissão para cada URL de teste.

Casos de uso

Validação de sintaxe de rascunhos de robots.txt antes do deploy em produção.

Simulação de comportamento de rastreamento para caminhos dinâmicos e parâmetros de URL.

Verificação de conformidade de sitemaps declarados no arquivo robots.txt.

Exemplos

1. Corrigindo regra de Disallow malformada

Especialista em SEO

Contexto: Um especialista em SEO está preparando um novo arquivo robots.txt para um e-commerce, mas quer garantir que a sintaxe de bloqueio do painel administrativo esteja correta.
Problema: Uma regra de Disallow sem dois-pontos ou mal formatada pode fazer com que os crawlers indexem páginas confidenciais.
Como usar: Insira o texto do robots.txt no campo de texto, defina a origem como https://lojaexemplo.com e adicione /admin nas URLs de teste.
Configuração de exemplo: robotsText: "User-agent: *\nDisallow /admin\nAllow: /admin/help"\nsiteOrigin: "https://lojaexemplo.com"\ntestUrls: "/admin\n/admin/help"
Resultado: O validador aponta um erro de sintaxe na linha do Disallow (falta de dois-pontos) e mostra que a URL /admin não foi bloqueada corretamente devido ao erro.

2. Testando bloqueio de checkout e caminhos dinâmicos

Desenvolvedor Web

Contexto: Um desenvolvedor precisa garantir que páginas de finalização de compra e carrinhos de compras não sejam rastreadas por robôs de busca.
Problema: Garantir que a regra de exclusão impeça o rastreamento de URLs como /checkout/success sem bloquear acidentalmente a página inicial.
Como usar: Faça o upload do arquivo robots.txt atual, configure a origem do site e liste as URLs /checkout/success e / no campo de teste.
Configuração de exemplo: robotsText: "User-agent: *\nDisallow: /checkout/\nAllow: /"\nsiteOrigin: "https://meusite.com"\ntestUrls: "/checkout/success\n/"
Resultado: O relatório JSON confirma que /checkout/success está bloqueado com sucesso e a página inicial / permanece acessível para rastreamento.