Points clés
- Catégorie
- Sécurité et validation
- Types d’entrée
- textarea, file, text
- Type de sortie
- json
- Couverture des échantillons
- 4
- API disponible
- Yes
Vue d’ensemble
Ce validateur de fichier robots.txt analyse la syntaxe de vos directives de crawl, identifie les erreurs de formatage et teste l'accès de vos URLs clés avant leur mise en ligne. Il vous permet de vérifier instantanément si vos règles d'autorisation et vos déclarations de sitemap sont correctement structurées pour les moteurs de recherche.
Quand l’utiliser
- •Avant de déployer une nouvelle version de votre fichier robots.txt en production pour éviter de bloquer accidentellement votre site.
- •Lors de l'audit SEO technique d'un site web pour vérifier la validité des directives de crawl existantes.
- •Pour tester si des URLs spécifiques, comme des pages d'administration ou des tunnels de conversion, sont correctement bloquées ou autorisées.
Comment ça marche
- •Saisissez le contenu de votre robots.txt dans la zone de texte ou importez directement votre fichier au format texte.
- •Renseignez l'URL d'origine de votre site et ajoutez la liste des URLs de test que vous souhaitez évaluer.
- •Lancez l'analyse pour obtenir un rapport JSON détaillé contenant les erreurs de syntaxe détectées et le statut d'accès pour chaque URL testée.
Cas d’usage
Exemples
1. Correction d'une règle Disallow mal formatée
Consultant SEO- Contexte
- Un consultant prépare la mise en ligne d'un nouveau robots.txt mais craint d'avoir fait une erreur de syntaxe sur une règle d'exclusion critique.
- Problème
- Une directive Disallow a été écrite sans le caractère deux-points requis, ce qui risque de rendre la règle inopérante pour les robots.
- Comment l’utiliser
- Coller le texte du robots.txt dans le champ dédié, renseigner l'origine du site et ajouter /admin dans les URLs de test.
- Configuration d’exemple
-
robotsText: User-agent: *\nDisallow /admin\nAllow: /admin/help\nsiteOrigin: https://example.com\ntestUrls: /admin - Résultat
- L'outil signale immédiatement une erreur de syntaxe sur la ligne Disallow et indique que l'URL /admin n'est pas bloquée comme prévu.
2. Vérification du blocage des pages de panier d'achat
Développeur Web- Contexte
- Un développeur souhaite s'assurer que les robots d'indexation ne visitent pas les pages de panier et de paiement d'une boutique en ligne.
- Problème
- S'assurer que les règles d'exclusion bloquent correctement les chemins dynamiques contenant /cart et /checkout.
- Comment l’utiliser
- Saisir le robots.txt du site, définir l'origine et lister les URLs de test correspondantes.
- Configuration d’exemple
-
robotsText: User-agent: *\nDisallow: /cart/*\nDisallow: /checkout/*\nsiteOrigin: https://shop.example.com\ntestUrls: /cart/view\n/checkout/pay - Résultat
- Le rapport confirme que les deux URLs de test sont bien bloquées par les directives correspondantes sans aucune erreur de syntaxe.
Tester avec des échantillons
text, fileHubs associés
FAQ
Pourquoi mon fichier robots.txt génère-t-il des erreurs ?
Les erreurs proviennent généralement de directives mal orthographiées, comme l'omission des deux-points après Disallow, ou de chemins d'accès mal formatés.
Puis-je tester des URLs spécifiques avec cet outil ?
Oui, vous pouvez lister vos URLs de test pour vérifier si elles sont bloquées ou autorisées par vos règles.
L'outil prend-il en charge l'importation de fichiers ?
Oui, vous pouvez charger directement un fichier robots.txt au format .txt pour l'analyser.
Qu'est-ce que l'option Origine du site ?
Elle définit le domaine de base utilisé pour résoudre et tester vos URLs relatives lors de la validation.
Le validateur vérifie-t-il la déclaration du Sitemap ?
Oui, il contrôle la syntaxe de la directive Sitemap pour s'assurer qu'elle est correctement formatée.