Fatos principais
- Categoria
- Segurança e validação
- Tipos de entrada
- textarea, file, text
- Tipo de saída
- json
- Cobertura de amostras
- 4
- API disponível
- Yes
Visão geral
O Validador lint de robots.txt permite analisar a sintaxe das diretivas do seu arquivo robots.txt, identificar regras arriscadas ou incorretas e testar a acessibilidade de URLs específicas para rastreadores antes de publicar as alterações no seu site.
Quando usar
- •Antes de publicar um novo arquivo robots.txt ou atualizar regras de rastreamento existentes.
- •Ao diagnosticar problemas de indexação no Googlebot ou outros crawlers de mecanismos de busca.
- •Para testar se URLs críticas, como páginas de checkout ou painéis administrativos, estão corretamente bloqueadas ou permitidas.
Como funciona
- •Insira o conteúdo do seu robots.txt diretamente na área de texto ou faça o upload do arquivo .txt.
- •Defina a origem do site (ex: https://example.com) e insira as URLs que deseja testar contra as regras definidas.
- •O validador analisa a sintaxe linha por linha, sinaliza erros de formatação e exibe o status de permissão para cada URL de teste.
Casos de uso
Exemplos
1. Corrigindo regra de Disallow malformada
Especialista em SEO- Contexto
- Um especialista em SEO está preparando um novo arquivo robots.txt para um e-commerce, mas quer garantir que a sintaxe de bloqueio do painel administrativo esteja correta.
- Problema
- Uma regra de Disallow sem dois-pontos ou mal formatada pode fazer com que os crawlers indexem páginas confidenciais.
- Como usar
- Insira o texto do robots.txt no campo de texto, defina a origem como https://lojaexemplo.com e adicione /admin nas URLs de teste.
- Configuração de exemplo
-
robotsText: "User-agent: *\nDisallow /admin\nAllow: /admin/help"\nsiteOrigin: "https://lojaexemplo.com"\ntestUrls: "/admin\n/admin/help" - Resultado
- O validador aponta um erro de sintaxe na linha do Disallow (falta de dois-pontos) e mostra que a URL /admin não foi bloqueada corretamente devido ao erro.
2. Testando bloqueio de checkout e caminhos dinâmicos
Desenvolvedor Web- Contexto
- Um desenvolvedor precisa garantir que páginas de finalização de compra e carrinhos de compras não sejam rastreadas por robôs de busca.
- Problema
- Garantir que a regra de exclusão impeça o rastreamento de URLs como /checkout/success sem bloquear acidentalmente a página inicial.
- Como usar
- Faça o upload do arquivo robots.txt atual, configure a origem do site e liste as URLs /checkout/success e / no campo de teste.
- Configuração de exemplo
-
robotsText: "User-agent: *\nDisallow: /checkout/\nAllow: /"\nsiteOrigin: "https://meusite.com"\ntestUrls: "/checkout/success\n/" - Resultado
- O relatório JSON confirma que /checkout/success está bloqueado com sucesso e a página inicial / permanece acessível para rastreamento.
Testar com amostras
text, fileHubs relacionados
FAQ
O que é um validador lint de robots.txt?
É uma ferramenta que analisa a sintaxe do arquivo robots.txt para garantir que os rastreadores de busca interpretem as diretivas corretamente.
Posso testar URLs específicas com esta ferramenta?
Sim, basta inserir as URLs no campo de teste para verificar se elas seriam bloqueadas ou permitidas pelas regras informadas.
O que acontece se eu não definir a origem do site?
A ferramenta utiliza a origem padrão configurada para resolver caminhos relativos durante a validação das URLs de teste.
A ferramenta suporta o upload direto de arquivos robots.txt?
Sim, você pode fazer o upload direto de um arquivo .txt para validação rápida.
Como o validador identifica erros de sintaxe?
Ele analisa a estrutura de diretivas como User-agent, Disallow, Allow e Sitemap, apontando erros de digitação ou formatação inválida.