Ключевые факты
- Категория
- Безопасность и валидация
- Типы входных данных
- textarea, file, text
- Тип результата
- json
- Покрытие примерами
- 4
- API доступен
- Yes
Обзор
Линтер и валидатор robots.txt позволяет быстро проверить синтаксис директив для поисковых роботов, выявить критические ошибки разметки и протестировать доступность ключевых URL-адресов вашего сайта перед публикацией файла на сервере.
Когда использовать
- •Перед загрузкой нового или обновленного файла robots.txt на рабочий сервер для предотвращения случайного закрытия сайта от индексации.
- •При падении органического трафика для проверки корректности текущих правил Allow и Disallow.
- •Во время миграции сайта или изменения структуры URL для тестирования доступности критически важных разделов для краулеров.
Как это работает
- •Вставьте текст robots.txt напрямую в поле ввода или загрузите готовый текстовый файл с вашего устройства.
- •Укажите адрес вашего сайта (Origin) и добавьте список тестовых URL-адресов, доступность которых необходимо проверить.
- •Запустите анализ, чтобы получить подробный отчет в формате JSON с указанием синтаксических ошибок и статуса доступа для каждого тестового URL.
Сценарии использования
Примеры
1. Исправление синтаксической ошибки в правиле Disallow
SEO-специалист- Контекст
- Специалист подготовил новый файл robots.txt для интернет-магазина, но хочет убедиться, что правила написаны без ошибок.
- Проблема
- В директиве Disallow пропущено двоеточие, из-за чего правило может быть проигнорировано роботами.
- Как использовать
- Вставьте текст robots.txt в поле ввода, укажите адрес сайта https://myshop.com и добавьте тестовый URL /admin для проверки.
- Пример конфигурации
-
robotsText: "User-agent: *\nDisallow /admin\nAllow: /admin/help", siteOrigin: "https://myshop.com", testUrls: "/admin" - Результат
- Валидатор обнаружил 1 синтаксическую ошибку (пропущенное двоеточие после Disallow) и вывел отчет в формате JSON.
2. Проверка доступности разделов блога при блокировке админки
Веб-разработчик- Контекст
- Разработчик настраивает robots.txt для нового корпоративного портала и хочет закрыть панель управления, сохранив доступ к статьям.
- Проблема
- Нужно убедиться, что правила блокировки /private/ не затрагивают публичные адреса вроде /blog/.
- Как использовать
- Загрузите файл robots.txt, укажите домен https://company.ru и введите список URL: /private/dashboard и /blog/news в поле тестовых адресов.
- Пример конфигурации
-
robotsText: "User-agent: *\nDisallow: /private/\nAllow: /blog/", siteOrigin: "https://company.ru", testUrls: "/private/dashboard\n/blog/news" - Результат
- Инструмент подтвердил успешную блокировку /private/dashboard и свободный доступ роботов к /blog/news.
Проверить на примерах
text, fileСвязанные хабы
FAQ
Зачем проверять robots.txt перед публикацией?
Ошибки в синтаксисе, такие как пропущенное двоеточие или неверный путь, могут заблокировать индексацию всего сайта или открыть конфиденциальные разделы для поисковиков.
Можно ли загрузить файл robots.txt напрямую?
Да, инструмент поддерживает как прямую вставку текста, так и загрузку файлов в формате .txt.
Что делает проверка тестовых URL?
Она сопоставляет указанные адреса с правилами в вашем robots.txt и показывает, будут ли они заблокированы (Disallow) или разрешены (Allow) для краулеров.
Поддерживает ли валидатор директиву Sitemap?
Да, инструмент проверяет корректность указания путей к картам сайта в директиве Sitemap.
Каков формат вывода результатов проверки?
Результаты предоставляются в структурированном формате JSON, содержащем количество ошибок и детальный статус проверки каждого URL.