Интеграция RAG с Make.com: пять шагов к оптимизации процессов
Интеграция RAG с Make.com: пять шагов к оптимизации процессов
Зима, 8:40 утра. В московском офисе бухгалтерии уже кипит чайник, а менеджер по продажам пытается одновременно отвечать в Telegram, проверять сделки в CRM и вытаскивать из Google Диска вчерашний прайс. Ещё бы полчаса сна и кнопку, которая всё это делает сама. Спойлер – такая кнопка есть, и она состоит из двух вещей: RAG, который знает, где ваша правда, и Make.com, который таскает рычаги за кулисами без лишних героизмов. В связке это уже не игрушка, а вполне взрослая схема, которая экономит часы и убирает рутину, причём без кода, без молитв к разработчикам и с уважением к здравому смыслу.
Если коротко, Retrieval-Augmented Generation – это когда умная модель не фантазирует из воздуха, а сначала идёт в ваши документы, базы и вики, достаёт факты и только потом пишет ответ. Такой подход вменяемо снижает вероятность ерунды в ответах и силами извлекает из Notion, Confluence, Google Диска или даже из вашего 1С нужные куски. А Make.com – это визуальный оркестратор: цепляете Telegram, Почту, Битрикс24, amoCRM, Яндекс 360, таблицы, вебхуки и что угодно ещё, и строите сценарий из блоков, где каждый шаг делает понятное действие. Вся эта красота работает в облаке, без серверов под столом и без вечных переписок с айтишниками на тему «когда будет». И главное – видите процессы, считаете время, ловите узкие места, а не догадываетесь, почему всё тормозит.
Зачем это бизнесу, если и так «работает»
С миру по нитке у команд в России получается любопытный винегрет: боты в Telegram, лиды с квиза на Tilda, документы в облаке, CRM живёт своей жизнью, а регламенты где-то в Notion и всё время устаревают. RAG решает ключевую боль – актуальность и проверяемость информации на лету. Нужно ответить клиенту на вопрос про условия поставки именно в Санкт-Петербурге и именно по прайсу за прошлую неделю – система не «думает», она ищет в ваших файлах, прикладывает цитаты и формирует понятный ответ. Make в этот момент следит за триггерами, тянет нужные файлы, пишет в CRM, уведомляет менеджера и, если надо, готовит счёт в МойСклад, не забывая оставить лог. Сценарий может быть сколь угодно хитрым, но собран он из простых кубиков, и это сильно успокаивает тех, кто не хочет программировать, но любит результат.
Шаг 1. Сформулируйте, ради чего вы это всё затеваете
Звучит банально, зато работает. Выберите один живой процесс, который болит сильнее всего: ответы поддержки на повторы, пресейл у менеджеров, создание отчётов по проектам или контент для блога, который у вас переезжает от дедлайна к дедлайну. Опишите входы и выходы простыми словами: клиент пишет в Telegram, мы должны за 5 минут ответить и поставить задачу в CRM, а если вопрос про доставку – дать ссылку на раздел из регламента. Дальше определите, где лежит истина: Google Диск, Notion, Confluence, корпоративный SharePoint, база знаний в Битрикс24, иногда даже в PDF в Приватной папке, что немного больно. От этого зависит, как будем «кормить» RAG: подключать облако через API, настроить вебхуки на обновления или делать ежедневные выгрузки.
Для хранилища фактов берите на выбор: Qdrant как быстрый векторный поиск, PostgreSQL с расширением pgvector, если хочется всё держать рядом и понятно, либо управляемый сервис в Яндекс Облаке или VK Cloud, если планируете масштабы. Важно не перепрыгивать через ступень – начните с маленького корпуса документов, 200-500 страниц, чтобы поймать механику. И да, сразу договоритесь о метаданных: дата, тип документа, отдел, версия, язык. Это скучно, зато RAG потом отвечает короче и точнее, а не тащит прайс из позапрошлого года, потому что кто-то обновил файл, а название оставил старым.
Иллюстрация из жизни: Make AI инструменты в работе

Шаг 2. Превратите ваши документы в кусочки, понятные машине
RAG хорошо ищет по кускам, а не по цельным докам. Поэтому документацию, регламенты, договора, каталоги стоит нарезать на фрагменты по 300-1200 символов с аккуратными границами по заголовкам и абзацам. Сканированные PDF придётся распознать, лучше сразу проверить кириллицу и таблицы, иначе потом будете ловить «кракозябры» в ответах. Каждому фрагменту приклеиваем метки: откуда пришёл, какая версия, кто ответственный, когда обновлялся. Это кажется бюрократией, но когда RAG сможет сказать «источник – Прайс_СПб_v4.pdf, раздел 2.3», вопросы доверия испаряются сами собой.
Вычислять эмбеддинги можно в вашем любимом облачном сервисе или на локальной машине, если данные чувствительные и выходить наружу нельзя. Точки интеграции с Make тут прямые: модуль наблюдает за папкой на Google Диске, Notion или Яндекс Диске, сразу после изменения гонит файл в функцию, где происходит нарезка и обновление базы. Хотите полностью без серверов – сделайте обработчик на облачных функциях, хоть в Яндекс Cloud Functions, хоть в VK Cloud Functions. Сценарий Make регулирует поток: новые документы сразу в индекс, старые по расписанию перепроверяются, а если у файла изменился только один раздел – перезаписываем только связанные фрагменты, экономя деньги и нервы.
Шаг 3. Соберите первый сценарий RAG в Make.com и запустите
Сердце всей истории – сценарий в Make.com, который связывает канал общения, поиск по знаниям и генерацию ответа. На входе чаще всего Telegram бот, форма на сайте, чат-виджет или письмо на поддержку. Первым блоком ловим сообщение, вторым – нормализуем текст и снимаем контекст: клиент, язык, тематика, серьёзность вопроса. Потом – обращаемся к вашему поисковому слою: это может быть модуль HTTP к API векторной базы, встроенный AI-инструмент Make или ваша функция, которая возвращает 3-5 релевантных фрагментов с цитатами. Далее вызываем языковую модель с инструкцией говорить по-деловому, ссылаться на источники и молчать о том, чего нет в базе. На выходе отправляем ответ в чат, прикладываем ссылку на раздел, создаём задачу в CRM и записываем лог – вопрос, найденные источники, латентная уверенность, время выполнения.
Уже на этом уровне получается живой помощник: поддержка отвечает быстрее, менеджеры перестают гадать, где поискать прайс, а команда постепенно перестаёт собирать «мудборды» из скриншотов. И чтобы не играть в кассу доверия, не поленитесь добавить кнопку «Ответ помог» прямо в чате и считать процент удовлетворённых – таких маленьких метрик вобще много не бывает. Важная мелочь – в явном виде запрещайте модели придумывать, если источников мало. Лучше честно ответить «не уверен, нужна проверка», чем бодро нагенерить и потом краснеть в переписке.
Как это выглядит с ботом в Telegram

Шаг 4. Закрутите качество и безопасность, пока всё не раздулось
Когда первые победы случились, самое время проложить рельсы. Логи нужны не для красоты: пишите в таблицу время ответа, какие фрагменты использовали, кто клиент, и оценку качества, которую оставил оператор или сам пользователь. По этим данным легко увидеть, какие документы устаревают, где у вас пробелы, и что пора переписать человеческим языком. По безопасности – разделите данные: публичные материалы и закрытые регламенты не должны смешиваться по правам, шифруйте токены и ключи в хранилище секретов, ограничивайте доступ к сценариям хотя бы по ролям. Учитывайте персональные данные: маскируйте номера телефонов и адреса в логах, не храните лишнее, даже если очень хочется «на всякий случай». И простой, но важный приём – делайте кэш для повторяющихся вопросов с коротким временем жизни, чтобы не платить лишний раз за поиск и генерацию, а заодно ускорить ответы в пиковые часы.
Ещё одна важная вещь – тестовые наборы. Возьмите 50-100 типовых вопросов, на которые у вас есть эталонные ответы, и прогоняйте сценарий раз в неделю. Сравнивайте совпадение по смыслу, длине и источникам, фиксируйте провалы. Так вы будете видеть не «кажется, стало хуже», а фактические цифры, где всё чёрным по белому. И да, правила эскалации: если уверенность ниже порога, сразу помечаем вопрос как требующий ручной проверки, делаем заметку в CRM и отправляем алерт в рабочий чат. Не геройствуйте там, где должна выступать команда.
Шаг 5. Масштабируйте на каналы и превращайте RAG в бизнес-двигатель
Когда ядро работает, добавляйте каналы и роли. Поддержка в Telegram и на сайте – есть, делаем ещё для корпоративной почты и внутреннего портала. Продажи получают пресейл-помощника: модель подтягивает актуальные кейсы, рассчитывает примерную стоимость, подсказывает, какие документы запросить, и всё это на основе ваших же проектов. Маркетинг – отдельная радость: RAG подбирает выдержки из базы знаний, а Make на их основе собирает черновик статьи для блога или Дзена, сохраняет в CMS, ставит задачу редактору и откладывает публикацию. Можно пойти дальше и автоматизировать обвязку соцсетей: короткая выжимка, креатив, превью-картинка, отложенный постинг в VK и Telegram, с трекингом ссылок и меток, чтобы потом не искать, где же был тот удачный заголовок.
На практике такой слой превращается в новую норму работы. Ещё вчера люди руками пробивались через древние файлы и спрашивали друг друга в чате «а где лежит договор за 2022», сегодня ключевая информация в ответе уже с цитатой и ссылкой. А если замахнуться на омниканал, сценарии Make без труда склеят телефонию, CRM и рассылки, вставят RAG в нужные места и не развалятся от первой же нагрузки. Узкое место тогда становится не автоматизация, а скорость, с которой команда переписывает старые документы в человеческие, но тут уж извиняйте – чудес не бывает.
Как RAG помогает создавать контент под ключ

Что под капотом: кратко и по делу
Техническая развязка выглядит так: есть индекс знаний с фрагментами и метаданными, есть слой поиска по этим векторным представлениям, и есть генератор, который по найденным кускам собирает ответ. Make склеивает это в рабочие процессы: получает запрос, дергает поиск, формирует промпт, отправляет в модель, постобрабатывает и рассылает дальше, параллельно записывая логи и метрики. Сторонние сервисы, которые в России чувствуют себя уверенно, подключаются без боли: Яндекс Облако для функций и хранилища, VK Cloud, отечественные CRM, Telegram для первых линий, 1С и МойСклад через коннекторы или вебхуки. По затратам формула простая: платите за запросы к модели и поиск, за операции в Make и чуть-чуть за инфраструктуру, но выигрываете часы людей на конкретных процессах, которые наконец-то перестают висеть мёртвым грузом.
Если хочется начать быстро и с поддержкой, у нас есть готовые сценарии, шаблоны и подробные разборы. Хотите научиться автоматизации рабочих процессов с помощью сервиса make.com и нейросетей ? Подпишитесь на наш Telegram-канал. А если нужна системная прокачка – посмотрите курс Обучение по make.com, там пошагово от нуля до уверенных сценариев с RAG. Для тех, кто любит идти быстро, есть библиотека готовых сценариев и интеграций, чтобы не собирать всё руками в ночь перед релизом – Блюпринты по make.com.
Пара заметок из практики, которые экономят нервы
Первое – чистите данные перед индексацией. Уберите мусорные страницы, версионные дубликаты, старые прайсы без архивной пометки и те PDF, где половина текста – изображения. RAG не волшебник, он честно ест то, что дали, и потом такой же честный результат возвращает. Второе – пишите системные подсказки человеческим, а не магическим языком: «отвечай коротко, ссылайся на источники, если не уверен – предложи эскалацию». Третье – ставьте промежуточные сообщения пользователю, если поиск занимает несколько секунд, и держите ощущение диалога. Четвёртое – закройте петлю обратной связи, иначе вы не увидите прогресс. И пятое, самое скучное, зато жизненно важное: заведите владельца базы знаний. Без этой роли RAG превращается в умный, но постепенно слепнущий инструмент, а оно вам не надо.
Автогенерация страниц и публикаций на сайте

FAQ
Что выбрать для хранилища знаний: Qdrant, pgvector или что-то облачное
Если хочется простоты и скорости – Qdrant отлично подходит, его можно разворачивать локально и в облаке, он дружит с кириллицей и быстрым поиском по метаданным. Если у вас уже есть PostgreSQL и команда его любит – добавляйте pgvector, получите один контур для данных и индексов, а настройки бэкапов и доступов останутся привычными. Управляемые сервисы удобны, когда не хочется возиться с поддержкой и обновлениями, а требования по хранению данных позволяют. Для особо чувствительных кейсов держите всё в периметре и вызывайте модели через приватные шлюзы. Универсального ответа нет, есть ваш бюджет, компетенции и требования по безопасности, от них и пляшите.
Как подключить Telegram к сценарию Make и встроить RAG
Создайте бота через BotFather, получите токен, подключите модуль Telegram в Make.com, настройте триггер на входящие сообщения и создайте ветку обработки. Дальше добавьте блок, который отправляет текст в ваш поисковый сервис или функцию, где возвращаются релевантные фрагменты с метаданными. Полученные фрагменты положите в системную подсказку генератору, сформируйте ответ с цитатами и верните его пользователю. Параллельно создайте запись в CRM и сохраните лог в таблицу, чтобы потом анализировать качество. Через пару итераций у вас появится полноценный рабочий бот, который говорит по делу и не уходит в свободное творчество.
Чем RAG лучше классического обучения модели на наших данных
Обучение под вас даёт стабильный стиль и устойчивость к типовым задачам, но каждый апдейт данных превращается в мини-проект, да и проверка результата занимает время. RAG же подхватывает свежие документы сразу после обновления и обоснует ответ ссылками на источники. Плюс он лучше контролируется правилами и правами доступа: закрытые разделы не попадут в ответы, если их не разрешили. На практике комбинация работает лучше всего: базовая модель, RAG для актуальности, узкая дообученная прослойка там, где нужен фирменный тон или сложная предметка. Получаете и скорость, и контроль, и меньше зависимости от редких специалистов.
Сколько это будет стоить в месяц и как это считать
Формула простая: стоимость Make зависит от числа операций, плюс оплата вызовов моделей и хранения индексов, иногда немного за облачные функции. Для поддержки из 2-3 каналов с сотнями обращений в день часто хватает среднего тарифа Make и разумной квоты на модели, экономия времени людей перекрывает расходы без драм. Сначала делайте пилот на одном процессе, фиксируйте время до и после, умножайте на среднюю ставку часов сотрудников. Когда цифры честные, решение о расширении принимается без уговоров, а бюджет защищается спокойнее.
Что с хранением персональных данных и безопасностью
Делите контуры: индексы с открытой документацией отдельно, закрытые регламенты и клиентские данные отдельно, права доступа и шифрование секретов обязательны. Маскируйте персональные данные в логах, не отправляйте лишнее в внешние модели, а если политика компании строгая – используйте локальные развёртывания и проверенные шлюзы. В Make разграничивайте права по командам и сценариям, не давайте продакшен всем подряд, а чувствительные параметры храните в переменных окружения. Делайте ревизию раз в квартал и фиксируйте, кто к чему имеет доступ, это скучно, но сильно экономит репутацию. И не забывайте о журналах аудита – без них невозможно ни расследовать инцидент, ни убедить службу безопасности, что всё под контролем.
Можно ли запустить RAG без программиста
Да, если вы готовы воспользоваться готовыми блоками и сервисами, а сложные места закрыть облачными функциями с минимальным кодом или готовыми компонентами. В Make.com есть визуальные модули для большинства шагов, а то, чего не хватает, закрывается HTTP-запросом к вашему поисковому сервису. Мы как раз для этого собрали набор учебных сценариев и шаблонов, чтобы вы не вязли в технических деталях. Посмотрите Обучение по make.com и библиотеку Блюпринты по make.com, там без лишней пыли всё по шагам. Если останутся вопросы – пишите в наш канал, поможем расшить узкие места.
Как оценивать качество ответов и не утонуть в субъективщине
Сделайте эталонный набор вопросов и ожидаемых ответов, прогоняйте его по расписанию и фиксируйте совпадение по смыслу и полноте. Введите простую шкалу обратной связи для пользователей и операторов, где «помогло» и «нужна доработка» переводятся в понятные метрики. Смотрите на источники: если RAG системно цепляет не те документы, правьте индексацию и метаданные, а не промпт. Раз в неделю разбирайте 10 сложных кейсов, переписывайте регламенты и пополняйте базу знаний. Через месяц уровень шума снижается, а стабильность ответов растёт, и это уже видно не только по ощущениям, но и по цифрам.
С чего начать, если документов много и они в разнобой
Выберите один отдел и один тип документов, лучше тот, где эффект заметен сразу, например ответы поддержки или пресейл у продажников. Наведите порядок в именованиях и версиях, настройте первичную индексацию и сделайте маленький RAG-скрипт, который отвечает на 20-30 типовых вопросов. Потом добавляйте соседние разделы, не распыляйтесь на все фронты одновременно. Через пару недель объём роботы на налаживании снижается, а эффект становится очевидным для всей команды, и это лучший аргумент для расширения. Главное – двигаться по шагам, а не пытаться объять необъятное в первый же спринт.


