Как создать robots.txt и sitemap.xml через Cursor AI: пошаговая инструкция для новичка

Сайт уже собран в Cursor и залит на хостинг, а в Яндексе по-прежнему ноль страниц. Знакомая боль: в гугле десятки SEO-гайдов без привязки к вашему лендингу, страшно написать Disallow и закрыть всё одной строкой, а разница между robots.txt и sitemap.xml туманна. За один вечер вы соберите два текстовых файла в корне, сможете открыть их в браузере как обычные ссылки и настроите отправку карты в Вебмастер и Search Console.

robots.txt говорит роботу, куда можно заходить на обход, sitemap.xml перечисляет важные страницы. Попросите Cursor Agent собрать оба файла, залейте в корень домена и проверьте yoursite.ru/robots.txt и yoursite.ru/sitemap.xml. В robots.txt нужна строка Sitemap с полным https-URL, в карте не должно быть страниц, закрытых через Disallow.

Марина сверстала лендинг в Cursor, выложила на Vercel и через месяц увидела пустой индекс. В корне остался тестовый Disallow: / с чернового деплоя, sitemap она не создала. После гайда она попросила Agent собрать оба файла, проверила URL в Вебмастере и вместо «сайт закрыт» увидела зелёную галочку.

Контринтуитивный факт: robots.txt запрещает обход, но не гарантирует исчезновение из выдачи. Google и Яндекс пишут, что закрытая в robots.txt страница всё равно может попасть в поиск по внешним ссылкам — для удаления нужен noindex на странице. Ещё тихий конфликт: URL одновременно в sitemap и в Disallow, и трафик тает незаметно.

Разведите robots.txt и sitemap.xml без страха перед кодом

Сравнение robots.txt и sitemap.xml: таблица «что делает / чего не делает»

robots.txt — текстовая инструкция для роботов в корне сайта. sitemap.xml — карта с полными адресами страниц. Робот обходит сайт и решает, что показать в поиске; индексация — попадание страницы в базу поисковика.

На пальцах: robots.txt — табличка «сюда можно, туда нельзя». sitemap.xml — список важных комнат. Типичная ошибка — думать, что Disallow убирает страницу из выдачи. На практике он только просит не обходить URL; для удаления из поиска нужен meta noindex.

Файл	Что делает	Чего не делает
robots.txt	Разрешает или запрещает обход	Не убирает страницу из поиска сам
sitemap.xml	Передаёт список URL и даты	Не отменяет Disallow на те же адреса

Лимиты 2026 года: sitemap — до 50 000 URL и 50 МБ по Google. robots.txt только в корне хоста; Google обрезает после 500 КиБ, Яндекс — до 500 КБ без кириллицы в файле. Директива Sitemap в robots.txt принимает только абсолютный URL — это частая причина, почему робот «не видит» карту, хотя файл лежит на месте.

Честно говоря, путаница «закрыть от обхода» и «убрать из поиска» стоит тысячам сайтов месяцы без трафика. Запомните правило: Disallow для служебных папок, noindex для страниц, которые не должны светиться в выдаче вообще.

Откройте проект в Cursor и выпишите публичные страницы

Схема: открыть проект в Cursor, выписать публичные страницы и подготовить Agent

Часто Cursor тянет React и npm, когда нужны два текстовых файла. Задайте правило в .cursor/rules/: только статика в корне, без лишних фреймворков. Например, фраза «не добавляй package.json и не подключай фреймворки» в rules снимает половину типичных срывов Agent в сторону лишнего кода.

Для лендинга выпишите https-URL: главная, услуги, контакты, статьи. Не включайте /admin, /api и черновики. Для домена .рф используйте Punycode в файлах.

Шаг 1: Откройте папку с index.html в Cursor.
Шаг 2: Составьте список URL для поиска и отметьте папки для Disallow, например /api/.
Шаг 3: Запишите канонический домен с https.
Шаг 4: Переключитесь в Agent (Ctrl+I) с готовым списком.

В реальном проекте удобнее один раз попросить Agent и закоммитить файлы перед деплоем на Vercel, чем править XML руками после каждой новой страницы. На GitHub в 2026 году всё чаще встречается сборка robots и sitemap на этапе build. Вайбкодеру хватит двух промптов и проверки ссылки в браузере — как любого блока на лендинге.

Попросите Agent собрать безопасный robots.txt

Чеклист безопасного robots.txt перед деплоем: Allow, Sitemap, без глобального Disallow

Главный страх — Disallow: / и весь сайт невидим. Безопасный старт: User-agent: *, Allow: /, строка Sitemap с полным https-URL. Относительный путь в Sitemap робот не поймёт.

Промпт для Agent:
Статический сайт в папке. Создай robots.txt в корне.
User-agent: *
Allow: /
Disallow: /api/ (если папки нет — не добавляй)
Sitemap: https://МОЙ-ДОМЕН.ru/sitemap.xml
Без package.json и React. Покажи файл целиком.

Типичная ошибка: с теста на прод уезжает Disallow: /. Перед заливкой проверьте файл глазами — нет глобального запрета и кириллицы для Яндекса. При 404 на robots Google считает ограничений нет, кроме кода 429, но явный файл надёжнее. Если закрываете /admin или черновики, убедитесь, что главная и публичные разделы под Allow: /, иначе робот просто не дойдёт до контента.

Создайте sitemap.xml без URL из списка Disallow

В карту кладите только страницы, не закрытые в robots.txt. Совпадение URL в sitemap и Disallow — тихий убийца трафика в 2026 году.

Промпт для sitemap:
sitemap.xml по sitemaps.org в корне.
Все публичные HTML с полными https URL и lastmod сегодня.
Без URL из Disallow. UTF-8, до 50 URL. Покажи целиком.

Минимум: urlset и блоки url с loc. Для лендинга хватит 3-20 адресов; lastmod с датой обновления подсказывает роботу свежесть, но не даёт мгновенной переиндексации. Не дублируйте http/https и www/non-www — один канонический вариант, как на сайте. Уберите /thank-you, корзину, тесты и URL с ?utm=. После генерации сверьте список с рукописным: карта отражает то, что хотите показать клиенту, а не технический мусор репозитория.

Проверьте ссылки в браузере и отправьте карту в Вебмастер

Успех простой: оба URL открываются с кодом 200, в robots.txt есть Sitemap, панели принимают карту без «заблокировано robots.txt».

Схема:
Деплой → браузер (оба URL) → Яндекс: Анализ robots.txt + Файлы Sitemap → Google: Search Console → Sitemaps

Шаг 1: Залейте файлы в корень хостинга или через commit с автодеплоем.
Шаг 2: Откройте адреса в браузере — текст и XML, не HTML-ошибка.
Шаг 3: В Яндекс Вебмастере — Инструменты → Анализ robots.txt.
Шаг 4: Добавьте URL sitemap в разделе Файлы Sitemap.
Шаг 5: В Search Console отправьте sitemap и проверьте главную через URL Inspection.

Яндекс не обработает sitemap, если сам файл карты запрещён в robots.txt. Ошибки в панелях должны исчезнуть сразу; переобход сайта займёт дни. Критерий «всё сработало» до FAQ: оба URL отдают 200, строка Sitemap в robots.txt указывает на живую карту, в sitemap нет адресов из Disallow, Вебмастер и Search Console приняли файл без красных предупреждений о блокировке.

Избегите шести ошибок, которые режут индексацию

Disallow: / на проде после тестового деплоя.
URL в sitemap совпадает с Disallow.
Нет строки Sitemap в robots.txt.
Кириллица внутри robots.txt — Яндекс не примет.
Блокировка CSS/JS — Google хуже рендерит страницу.
Дубли http/https и www в sitemap.

Когда пара файлов работает, добавьте llms.txt для AI-агентов и сверьте meta-теги через Cursor. Общая картина GEO — в чек-листе geo-оптимизации.

Если sitemap нужно обновлять после каждой статьи, автоматизируйте через Make.com: новая строка в таблице → пересборка XML → деплой. Подробнее — в курсе Make.com и вайбкодинга; два файла через Cursor вы сделаете за вечер без разработчиков. Вопросы по связке Cursor, хостинга и вебмастеров можно разобрать в Telegram «Ковчег».

Материал проверен: Артур Хорошев, CEO Maya AI, автор курса по Make.com и вайбкодингу.
На что опираемся: лимиты sitemap и robots.txt — developers.google.com; правила Яндекса — yandex.ru/support/webmaster; конфликты sitemap vs Disallow — rankai.ai, seoable.dev; частотность «robots txt sitemap» (156), «robots txt для сайта» (244), «создать sitemap xml» (70) — Яндекс Вордстат, 29 июня 2026.

Частые вопросы

Где должен лежать файл robots.txt?

Только в корне: https://ваш-сайт.ru/robots.txt. В подпапке роботы не ищут главный файл. После деплоя откройте адрес и проверьте код 200.

Как указать sitemap в robots txt?

Строка Sitemap: https://ваш-сайт.ru/sitemap.xml с полным https. Дублируйте загрузкой карты в Вебмастер и Search Console.

Чем отличается sitemap xml от robots txt?

robots.txt управляет обходом, sitemap.xml перечисляет страницы для индексации. Первый — «куда не ходить», второй — «что важно проиндексировать».

Как проверить robots txt онлайн?

Откройте URL в браузере и зайдите в Яндекс Вебмастер: Инструменты → Анализ robots.txt. В Google — отчёт robots.txt в Search Console.

Закроет ли Disallow страницу в поиске?

Нет, только ограничит обход. Для удаления из выдачи поставьте noindex на странице или закройте индексацию в панели вебмастера.

Нужен ли sitemap для маленького лендинга?

Для 3-10 страниц карта не обязательна по правилам, но сильно упрощает жизнь: робот быстрее находит все URL, а в панели видно, если страница заблокирована robots.txt. Создать файл в Cursor — около 10 минут, дешевле месяца ожидания в пустой выдаче.

Часто задаваемые вопросы по теме (FAQ)

Для чего нужны AI-агенты и автоматизация в контенте?

AI-агенты (например, в связке с Make.com и Cursor) позволяют заменить рутинные задачи: сбор данных, написание постов, рерайт и даже автопостинг в Telegram или WordPress. Это экономит десятки часов в неделю и позволяет масштабировать бизнес без расширения штата.

Как быстро можно запустить свой контент-завод?

Базовый контент-завод (генерация текстов по RSS или из других источников) с автопостингом собирается без программирования (No-Code) за 1-2 дня. Сложные сценарии (с видео, аудио и кастомными MCP) внедряются за 1-2 недели.

Нужно ли уметь программировать?

Нет, большинство систем собираются визуально в Make.com (No-Code). Для сложных задач можно использовать вайбкодинг — генерацию кода с помощью Cursor AI через промпты на естественном языке.

Как создать robots.txt и sitemap.xml через Cursor AI: пошаговая инструкция для новичка

Важно

Ошибка

Шаг

Инсайт