Validador lint de robots.txt

Analiza la sintaxis de robots.txt, detecta reglas riesgosas y prueba URLs importantes antes de publicar

Resultados de ejemplo

1 Ejemplos

Detecta una regla Disallow mal escrita antes de publicar

Valida un borrador de robots.txt y prueba URLs clave como /admin y /blog antes de lanzarlo.

{
  "summary": {
    "errorCount": 1,
    "testedUrlCount": 3
  }
}
Ver parámetros de entrada
{ "robotsText": "User-agent: *\nDisallow /admin\nAllow: /admin/help", "siteOrigin": "https://example.com", "testUrls": "/admin\n/admin/help\n/blog" }

Click to upload file or drag and drop file here

Maximum file size: 0MB Supported formats: text/plain, application/octet-stream, .txt

Datos clave

Categoría
Seguridad y validación
Tipos de entrada
textarea, file, text
Tipo de salida
json
Cobertura de muestras
4
API disponible
Yes

Resumen

El Validador lint de robots.txt es una herramienta técnica diseñada para analizar la sintaxis de tus archivos robots.txt, identificar directivas mal estructuradas o potencialmente peligrosas y verificar si URLs específicas están bloqueadas o permitidas para los rastreadores web antes de publicar los cambios en producción.

Cuándo usarlo

  • Antes de implementar un nuevo archivo robots.txt en el servidor de producción para evitar la desindexación accidental de páginas clave.
  • Al auditar la configuración de SEO técnico de un sitio web para detectar directivas mal formateadas o rutas conflictivas.
  • Durante la migración de un sitio web o reestructuración de directorios para comprobar que las reglas de rastreo sigan funcionando correctamente.

Cómo funciona

  • Pega el contenido de tu archivo robots.txt en el área de texto o sube directamente el archivo .txt.
  • Define el origen del sitio web (por ejemplo, https://example.com) y añade una lista de URLs de prueba que deseas verificar.
  • El validador analiza la sintaxis línea por línea, buscando errores comunes como la falta de dos puntos en las directivas o rutas mal definidas.
  • Obtén un reporte detallado en formato JSON con el recuento de errores detectados y el estado de acceso para cada URL de prueba.

Casos de uso

Prevención de desindexación masiva al validar que la regla 'Disallow: /' no se aplique por error a todos los rastreadores.
Depuración de directivas complejas de Allow y Disallow para subdirectorios específicos como paneles de administración o pasarelas de pago.
Verificación rápida de la sintaxis del archivo robots.txt generado automáticamente por plugins de CMS antes de su publicación.

Ejemplos

1. Detección de error de sintaxis en regla Disallow

Especialista en SEO Técnico
Contexto
Un especialista en SEO está preparando una actualización del archivo robots.txt para un sitio de comercio electrónico y quiere asegurarse de que no haya errores de formato.
Problema
El borrador del archivo contiene una regla mal escrita 'Disallow /admin' (sin dos puntos), lo que podría causar que los motores de búsqueda ignoren la directiva.
Cómo usarlo
Pega el borrador del texto en el validador, ingresa el origen del sitio y añade las URLs /admin y /blog para probar el comportamiento.
Configuración de ejemplo
{
  "robotsText": "User-agent: *\nDisallow /admin\nAllow: /admin/help",
  "siteOrigin": "https://example.com",
  "testUrls": "/admin\n/admin/help\n/blog"
}
Resultado
El validador identifica un error de sintaxis en la línea 2 debido a la falta de dos puntos y muestra que la URL /admin no está bloqueada correctamente.

2. Verificación de acceso a rutas críticas de blog

Desarrollador Web
Contexto
Un desarrollador web necesita bloquear el acceso de los rastreadores a los entornos de prueba, pero debe garantizar que el contenido del blog público siga siendo accesible.
Problema
Confirmar que las reglas aplicadas no bloqueen accidentalmente la ruta /blog/ al intentar restringir /staging/.
Cómo usarlo
Sube el archivo robots.txt del servidor, define el origen del sitio y añade /blog/articulo-1 y /staging/dashboard en la lista de URLs de prueba.
Configuración de ejemplo
{
  "robotsText": "User-agent: *\nDisallow: /staging/\nAllow: /blog/",
  "siteOrigin": "https://example.com",
  "testUrls": "/blog/articulo-1\n/staging/dashboard"
}
Resultado
El validador confirma cero errores de sintaxis y verifica que /blog/articulo-1 está permitido, mientras que /staging/dashboard está correctamente bloqueado.

Probar con muestras

text, file

Hubs relacionados

Preguntas frecuentes

¿Qué tipo de errores detecta este validador de robots.txt?

Detecta errores de sintaxis como directivas mal escritas (por ejemplo, omitir los dos puntos en 'Disallow'), agentes de usuario no definidos y rutas de sitemap mal estructuradas.

¿Puedo probar si una URL específica está bloqueada?

Sí, puedes ingresar una lista de URLs de prueba junto con el origen de tu sitio para verificar si las directivas Allow o Disallow las afectan.

¿Es necesario subir un archivo físico para realizar la validación?

No, puedes pegar el texto directamente en el campo correspondiente o subir un archivo .txt si lo prefieres.

¿Qué significa el campo 'Origen del sitio' en la configuración?

Es la URL base de tu sitio web (por ejemplo, https://example.com) que se utiliza para resolver y validar correctamente las rutas relativas y absolutas de prueba.

¿El validador soporta la directiva Sitemap?

Sí, analiza la sintaxis de la directiva Sitemap para asegurar que contenga una URL absoluta válida.

Documentación de la API

Punto final de la solicitud

POST /es/api/tools/robots-txt-lint-validator

Parámetros de la solicitud

Nombre del parámetro Tipo Requerido Descripción
robotsText textarea No -
robotsFile file (Subida requerida) No -
siteOrigin text -
testUrls textarea No -

Los parámetros de tipo archivo necesitan ser subidos primero vía POST /upload/robots-txt-lint-validator para obtener filePath, luego pasar filePath al campo de archivo correspondiente.

Formato de respuesta

{
  "key": {...},
  "metadata": {
    "key": "value"
  },
  "error": "Error message (optional)",
  "message": "Notification message (optional)"
}
Datos JSON: Datos JSON

Documentación de MCP

Agregue este herramienta a su configuración de servidor MCP:

{
  "mcpServers": {
    "elysiatools-robots-txt-lint-validator": {
      "name": "robots-txt-lint-validator",
      "description": "Analiza la sintaxis de robots.txt, detecta reglas riesgosas y prueba URLs importantes antes de publicar",
      "baseUrl": "https://elysiatools.com/mcp/sse?toolId=robots-txt-lint-validator",
      "command": "",
      "args": [],
      "env": {},
      "isActive": true,
      "type": "sse"
    }
  }
}

Puede encadenar múltiples herramientas, por ejemplo: `https://elysiatools.com/mcp/sse?toolId=png-to-webp,jpg-to-webp,gif-to-webp`, máximo 20 herramientas.

Soporte para enlaces de archivos URL o codificación Base64 para parámetros de archivo.

Si encuentra algún problema, por favor, póngase en contacto con nosotros en [email protected]