🛠 Все
🤖

AI Bots Checker + Генератор llms.txt

Какие нейросети допущены на сайт: GPTBot, ClaudeBot, PerplexityBot, Google-Extended и ещё 20+. Плюс генератор llms.txt — нового стандарта «карты сайта для AI».

🔍 Проверить доступ AI-ботов
📝 Сгенерировать llms.txt

    

Зачем проверять доступ AI-ботов

В 2026 году поисковый трафик уходит в ChatGPT, Perplexity и Google AI Overviews. Если AI-боты к тебе не пускают — тебя не процитируют, конец видимости. Если пускают неуправляемо — обучается твоему контенту. Этот инструмент показывает реальную картину: кому открыто, кому закрыто, кто не упомянут (= по умолчанию открыт).

Что такое llms.txt

Появился в 2026 году как ответ на проблему: LLM плохо понимают структуру сайта из HTML с рекламой и виджетами. llms.txt — это краткая «карта сайта на простом языке», которую боты читают и используют для ответов. Содержит: название сайта, описание, ссылки на основные разделы и документы, FAQ. Уже поддерживается Perplexity, OpenAI, Anthropic.

Как использовать инструмент

(1) Введи URL — увидишь матрицу доступа всех AI-ботов. (2) Заполни форму генератора — получишь готовый llms.txt с правильной разметкой. (3) Скачай и положи в корень своего сайта. Без серверной обработки — robots.txt тянется напрямую из браузера, ничего никуда не отправляется.

Частые вопросы

Что такое AI-боты и зачем их пускать или не пускать?
Это сканеры OpenAI, Anthropic, Google, Perplexity и др., которые читают сайт чтобы обучаться или искать ответы для своих чат-ботов. Пуская их — ты получаешь шанс быть процитированным в ChatGPT/Perplexity (трафик и видимость). Не пуская — экономишь crawl-бюджет и закрываешь контент от обучения моделей.
Что такое llms.txt?
Новый стандарт (по аналогии с robots.txt и sitemap.xml) — текстовый файл в корне сайта, который рассказывает нейросетям о структуре сайта на понятном для них языке: какие разделы основные, какие документы важны, краткое описание. Помогает быть точно процитированным.
Каких AI-ботов проверяет инструмент?
25+ агентов: OpenAI (GPTBot, ChatGPT-User, OAI-SearchBot), Anthropic (ClaudeBot, anthropic-ai, Claude-Web), Google (Google-Extended, GoogleOther), Perplexity (PerplexityBot, Perplexity-User), Meta, Apple, ByteDance, Common Crawl (CCBot), Cohere, Mistral, Amazon, YouBot, Andi, Diffbot и др.
Где разместить llms.txt после генерации?
Скачать → загрузить в корень сайта так, чтобы открывалось по адресу example.com/llms.txt. На Laravel — положить в public/llms.txt. На WordPress — в корневую папку через FTP. На Tilda — через "Дополнительные настройки" или редирект.
Стоит ли пускать GPTBot? Я слышал он "ворует контент"
Это решение бизнеса. ПЛЮС: 800 млн пользователей ChatGPT — если бот не пущен, тебя не процитируют, не дадут трафик. МИНУС: твой контент идёт в обучающую выборку. Большинство контент-сайтов пускают (Forbes, NYT, Wired открыты), закрываются только премиум-издания с paywall.
Чем отличаются ClaudeBot и anthropic-ai?
ClaudeBot — современный (с 2026) для поиска и цитирования. anthropic-ai — старый user-agent, иногда ещё используется. Для полноты закрывать/открывать оба, плюс Claude-Web.
Что значит "User-Agent: *" в robots.txt применительно к AI?
Звёздочка касается ВСЕХ ботов, включая AI. Если в общем правиле "Disallow: /" — закрыт сайт от всех, включая AI. Если хочешь точечно: разреши всё для * но запрети для GPTBot/ClaudeBot отдельным блоком.