🛠 Все
🗺️

Sitemap.xml Analyzer

Парсит карту сайта, валидирует, считает URL, разбивает по хостам и расширениям. Опционально — статусы 5 случайных URL.

Когда нужен

Проверить, что после миграции/редизайна твой sitemap не содержит битых URL или редиректов. Найти, почему Google индексирует мало страниц (битый sitemap = пропуск). Сравнить структуру своего и конкурента.

Как использовать

Введи URL — обычно example.com/sitemap.xml. Если основной — индекс, увидишь список дочерних. Открой каждый дочерний, посмотри URL, включи "Проверить 5 случайных" — увидишь статусы.

Что искать в выдаче

Несколько хостов — нарушение протокола, Google игнорирует. Битые URL (не проходят валидацию) — реклама твоей небрежности, Google понижает доверие. 404 в sampling — каждая страница не индексируется, бюджет краулинга утекает. 302 редиректы в sitemap — лучше дать сразу финальный URL. lastmod = сегодняшняя дата у всех (фейковая) — Google со временем игнорирует такой сигнал свежести.

Частые вопросы

Что проверяет анализатор?
Парсит sitemap.xml, считает URL, показывает первые 20 строк, разбивку по хостам и расширениям, ищет проблемы (несколько хостов, битые URL, пустой sitemap). Опционально — статусы 5 случайных URL.
Поддерживает ли sitemap-индекс?
Да. Если введён URL индекса (sitemap_index.xml) — покажет список дочерних sitemap. Проверить каждый можно отдельно, введя его URL.
Почему только 5 URL для sampling?
Чтобы не DOS-ить чужой сайт. Если sitemap содержит 10000 URL и каждый аналитик проверит — сайт упадёт. 5 случайных дают репрезентативную выборку.
Что если в sitemap несколько хостов?
Это ошибка по стандарту: один sitemap может содержать только URL одного хоста. Гугл может неправильно проиндексировать. Анализатор это покажет.
Поддержка gzip sitemap (.xml.gz)?
Пока нет — нужно дать прямой URL .xml. Извлеки и положи рядом распакованный, или раскрой sitemap-индекс и работай с подсайтмапами.
Какой максимальный размер sitemap по стандарту?
50 000 URL ИЛИ 50 МБ (несжатого XML). Если sайт больше — обязательно дробить на несколько sitemap и собирать через sitemap-индекс. Анализатор отказывается работать с файлами больше 5 МБ — нечего гонять монстров через браузер.
Стоит ли указывать <priority> и <changefreq>?
В 2026 году — НЕТ. Google официально перестал учитывать оба этих поля с 2017 года, Yandex — позже. Они только засоряют XML. Важны только loc и (правильный, не фейковый) lastmod.