Datos clave
- Categoría
- Seguridad y validación
- Tipos de entrada
- textarea, file, text
- Tipo de salida
- json
- Cobertura de muestras
- 4
- API disponible
- Yes
Resumen
El Validador lint de robots.txt es una herramienta técnica diseñada para analizar la sintaxis de tus archivos robots.txt, identificar directivas mal estructuradas o potencialmente peligrosas y verificar si URLs específicas están bloqueadas o permitidas para los rastreadores web antes de publicar los cambios en producción.
Cuándo usarlo
- •Antes de implementar un nuevo archivo robots.txt en el servidor de producción para evitar la desindexación accidental de páginas clave.
- •Al auditar la configuración de SEO técnico de un sitio web para detectar directivas mal formateadas o rutas conflictivas.
- •Durante la migración de un sitio web o reestructuración de directorios para comprobar que las reglas de rastreo sigan funcionando correctamente.
Cómo funciona
- •Pega el contenido de tu archivo robots.txt en el área de texto o sube directamente el archivo .txt.
- •Define el origen del sitio web (por ejemplo, https://example.com) y añade una lista de URLs de prueba que deseas verificar.
- •El validador analiza la sintaxis línea por línea, buscando errores comunes como la falta de dos puntos en las directivas o rutas mal definidas.
- •Obtén un reporte detallado en formato JSON con el recuento de errores detectados y el estado de acceso para cada URL de prueba.
Casos de uso
Ejemplos
1. Detección de error de sintaxis en regla Disallow
Especialista en SEO Técnico- Contexto
- Un especialista en SEO está preparando una actualización del archivo robots.txt para un sitio de comercio electrónico y quiere asegurarse de que no haya errores de formato.
- Problema
- El borrador del archivo contiene una regla mal escrita 'Disallow /admin' (sin dos puntos), lo que podría causar que los motores de búsqueda ignoren la directiva.
- Cómo usarlo
- Pega el borrador del texto en el validador, ingresa el origen del sitio y añade las URLs /admin y /blog para probar el comportamiento.
- Configuración de ejemplo
-
{ "robotsText": "User-agent: *\nDisallow /admin\nAllow: /admin/help", "siteOrigin": "https://example.com", "testUrls": "/admin\n/admin/help\n/blog" } - Resultado
- El validador identifica un error de sintaxis en la línea 2 debido a la falta de dos puntos y muestra que la URL /admin no está bloqueada correctamente.
2. Verificación de acceso a rutas críticas de blog
Desarrollador Web- Contexto
- Un desarrollador web necesita bloquear el acceso de los rastreadores a los entornos de prueba, pero debe garantizar que el contenido del blog público siga siendo accesible.
- Problema
- Confirmar que las reglas aplicadas no bloqueen accidentalmente la ruta /blog/ al intentar restringir /staging/.
- Cómo usarlo
- Sube el archivo robots.txt del servidor, define el origen del sitio y añade /blog/articulo-1 y /staging/dashboard en la lista de URLs de prueba.
- Configuración de ejemplo
-
{ "robotsText": "User-agent: *\nDisallow: /staging/\nAllow: /blog/", "siteOrigin": "https://example.com", "testUrls": "/blog/articulo-1\n/staging/dashboard" } - Resultado
- El validador confirma cero errores de sintaxis y verifica que /blog/articulo-1 está permitido, mientras que /staging/dashboard está correctamente bloqueado.
Probar con muestras
text, fileHubs relacionados
Preguntas frecuentes
¿Qué tipo de errores detecta este validador de robots.txt?
Detecta errores de sintaxis como directivas mal escritas (por ejemplo, omitir los dos puntos en 'Disallow'), agentes de usuario no definidos y rutas de sitemap mal estructuradas.
¿Puedo probar si una URL específica está bloqueada?
Sí, puedes ingresar una lista de URLs de prueba junto con el origen de tu sitio para verificar si las directivas Allow o Disallow las afectan.
¿Es necesario subir un archivo físico para realizar la validación?
No, puedes pegar el texto directamente en el campo correspondiente o subir un archivo .txt si lo prefieres.
¿Qué significa el campo 'Origen del sitio' en la configuración?
Es la URL base de tu sitio web (por ejemplo, https://example.com) que se utiliza para resolver y validar correctamente las rutas relativas y absolutas de prueba.
¿El validador soporta la directiva Sitemap?
Sí, analiza la sintaxis de la directiva Sitemap para asegurar que contenga una URL absoluta válida.