Как настроить автоматизацию обработки документов с ИИ от скана до CRM?

Операционист логистики подключил «умный OCR» к папке входящих: текст из сканов появился, но в МойСклад суммы и реквизиты всё равно переносят руками. Разово прогнали счёт через ChatGPT — модель «додумала» ставку НДС 22% вместо 20%. Типичная боль первички: распознавание есть, а цепочки «скан → поля → CRM» нет. За 1–2 недели на n8n или Make можно собрать конвейер intake → OCR → LLM в JSON → валидация → проверка человеком → экспорт в учётку — без тяжёлой СЭД и без штатного разработчика.

TL;DR / Быстрый инсайт: Люди чаще ищут «ии для распознавания документов» (161 показ/мес), чем «автоматизацию электронных документов» (109) — им нужен путь до CRM, а не вендор ЭДО. Оптимален гибрид: OCR на массовых счетах, LLM/VLM на нестандартных макетах. Обязательны JSON-схема, валидация ИНН/КПП/НДС и human-in-the-loop перед 1С. Пилот на 30–50 счетах: ≥90% верных обязательных полей.

Это не обзор двадцати нейросетей и не ROI +380%. Одна мастерская: один тип документа (счета) от файла до строки в CRM. По Вордстат на июнь 2026 ядро «автоматизация обработки документов» — 599 показов/мес, рядом «ии для распознавания документов» — 161 и «автоматизация процессов обработки документов» — 141. В выдаче много ТОП-20 сервисов без JSON-схемы и очереди проверки — отсюда этот гайд.

Directum в трендах IDP 2026: VLM (модели, которые «смотрят» на страницу и понимают смысл) сильны на договорах, на массовых счетах классический OCR/IDP быстрее — нужен роутинг по типу файла. Microsoft в reference architecture описывает тот же скелет: email intake → extract → auto-check → human review → feedback. Переносимо в n8n/Make за выходные.

Выберите пилотный тип документов и KPI до покупки СЭД

Сравнительная таблица типов документов и KPI пилота до покупки СЭД

Типичная ошибка — купить ЭДО (электронный документооборот) и ждать автозаполнения CRM. ЭДО закрывает юридический обмен с контрагентом; сканы из почты и фото накладных — отдельный трек. Начните со счетов или актов: 30–50 эталонных файлов, список полей (ИНН, КПП, дата, номер, сумма, ставка и сумма НДС, банковские реквизиты). В реальном проекте без этого списка команда спорит «какие поля обязательны» вместо настройки узлов.

KPI пилота: ≥90% обязательных полей верны; низкий confidence → review, не учёт; после approve данные в CRM/Sheets/1С за ≤5 минут; журнал doc_errors для доработки промптов. В результате вы получите измеримый ориентир до покупки СЭД.

Делайте: зафиксируйте один тип документа и список полей до настройки узлов. Не делайте: покупать ЭДО, ожидая автозаполнения CRM из сканов почты.

Один тип документа и 30–50 тестовых файлов.
Список обязательных полей и правил (НДС 0/10/20%).
Система назначения: МойСклад, amoCRM, 1С или таблица.
Цель ≥90% точности, срок пилота 1–2 недели.
Журнал ошибок с первого дня.
Шаг приёмки: проверьте 10 файлов вручную до автозаписи в учёт.

Соберите intake и OCR-ветку: цепочка, а не один узел

Workflow-схема intake и OCR-ветки: цепочка узлов, а не один OCR

OCR считывает текст со скана, но не структуру. Ошибка — один OCR-узел и ручной копипаст. Архитектура n8n: intake → validation → extraction → decision → review → output → audit.

Схема:
Drive/email/webhook → archive + document_queue → роутинг → OCR/парсер PDF → текст + confidence → LLM JSON → validation → HITL или export → CRM → audit log

Триггер в n8n или Make: копия в archive, статус received в document_queue. Роутинг: текстовый PDF — парсер; скан — Google Vision, Tesseract или Mistral OCR (mistral-ocr-latest, markdown-выход и confidence scores); незнакомый layout — LLM/VLM. Webhook — это URL-адрес, на который система сама шлёт файл при загрузке: удобно для формы на сайте или бота в Telegram.

На GitHub invoice-parse OCR отделён от LLM — в 10–50 раз дешевле, чем кормить модель картинками. IDP (intelligent document processing) — «умная» обработка: не просто текст, а поля с уверенностью. n8n здесь оркестратор — дирижёр, который зовёт OCR, LLM и CRM по очереди, не переделывая всю IT-архитектуру.

Тип файла	Инструмент	Если не хватает
Текстовый PDF из ЭДО	Парсер без OCR	Кривая вёрстка — LLM по тексту
Скан счёта	Mistral OCR, Vision, Tesseract	Плохой скан — HITL
Договор	LLM/VLM + схема полей	Массовые счета — IDP

Извлеките поля в JSON: схема жёстче промпта

Чек-лист полей JSON Schema для извлечения из документов

LLM без JSON Schema «додумывает» ИНН и НДС. Схема — фиксированная форма: модель заполняет ячейки, не придумывает реквизиты. Промпт: «Только факты из текста. Не вычисляй НДС, если ставка не указана.» Узел Code парсит ответ; кэш по SHA-256 хешу файла. Используйте strict JSON и добавьте узел, который падает с ошибкой, если JSON битый.

Пример JSON Schema для счёта:
{ «invoice_number»: «string», «supplier_inn»: «string», «total_amount»: «number», «vat_rate»: «0|10|20|null», «vat_amount»: «number|null» }

На практике дешевле OCR → текст → LLM, чем картинка в модель на каждый документ. LLM (большая языковая модель, «ChatGPT в API») здесь не собеседник, а парсер: на входе сырой текст счёта, на выходе JSON для импорта. Делайте: уберите вычисление НДС из промпта. Не делайте: давать модели свободу формулировок без схемы.

Поставьте валидацию и policy gates до учёта

Confidence OCR — не единственный фильтр. InvoiceMind на GitHub: policy gates RECEIVED → VALIDATED → EXTRACTED → NEEDS_REVIEW вместо слепого доверия к score. Правила: regex ИНН (10 или 12 цифр) и КПП (9 цифр), сверка итога с суммой позиций с допуском копейки, whitelist НДС 0/10/20%, обязательные поля не пустые. Проект invoice-processing-automation отправляет в human review всё со score <0,7 с audit trail. Настройте validation до экспорта — так вы избегаете «тихих» ошибок в 1С.

Часто ломается запятая в сумме: OCR читает «15,000» как английский формат — regex ловит раньше бухгалтера. В учёт попадают только approved записи; всё остальное висит в очереди, а не в 1С.

Включите human-in-the-loop перед записью в CRM

Без человека автономный ИИ закрывает меньше 2,5% сложных неструктурированных задач — HITL (human-in-the-loop, человек в контуре) обязателен. Review-таблица в Google Sheets или лёгкий экран: колонки approve, reject, edit, комментарий, ссылка на файл в archive. Бухгалтер правит поля в одном месте; только после approve — HTTP-запрос к CRM, МойСклад или 1С.

Дубликаты отсекайте по SHA-256 хешу файла до OCR — повторная загрузка того же счёта не должна создавать вторую оплату. Reject с причиной в doc_errors («галлюцинация НДС», «ИНН не прошёл regex») — топливо для еженедельного разбора промптов. Так вы не ищете, кто занёс неверную сумму: в audit log видно файл, версию промпта и решение человека.

Интегрируйте экспорт через n8n или Make

Оркестратор связывает узлы без замены СЭД (системы электронного документооборота): триггер → validation → ветка IF approved → API CRM или строка в Sheets → Telegram/Slack при ошибке валидации или дубликате. API — «розетка» программы: отправляете JSON с полями, CRM создаёт карточку поставщика и счёт. В Make — модуль HTTP или нативная интеграция amoCRM; в n8n — Webhook и Code. Для 1С часто идут через промежуточную таблицу или готовый коннектор — главное, чтобы поля прошли validation до вызова.

Пилот на одном типе документов укладывается в 1–2 недели: не надо менять всю учётную политику. Сначала Sheets как буфер, потом прямой экспорт — так проще откатить ошибку. Запустите workflow на тестовой папке, проверьте API-ключ CRM и только потом включайте автозапись.

Похожие цепочки с OCR и HTTP разбираем в клубе по Make — блюпринты и эфира два раза в неделю, без найма разработчика.

Чек-лист запуска и критерии успеха

ПДн: обезличивание перед облачным LLM при необходимости.
Retention archive и audit по 152-ФЗ.
Еженедельный разбор review и doc_errors.
A/B OCR на «битых» сканах.
Алерты при validation fail и дубликате.
ЭТрН с 01.09.2026 — контекст для логистики, не замена счётного пайплайна.
ЭДО где закон требует; n8n — для сканов из почты.
Версия промпта и схемы в git или таблице.

Пилот удался, если: ≥90% полей верны на тестовой выборке; спорные документы не в учёте без approve; от файла до CRM ≤5 минут; журнал ошибок показывает, что чинить. Измеримо за две недели.

Редакционная проверка: материал сверил Артур Хорошев (CEO Maya AI, практик n8n/Make и IDP-workflow).
Источники цифр: показатели Яндекс Вордстат и тренды IDP 2026 перепроверены на дату исследования — 16 июня 2026 года.

Частые вопросы

Как автоматизировать счета и накладные без программиста?

Make или n8n: Drive → OCR → LLM + JSON → validation → review → API CRM. Код только в узлах regex/parse — можно сгенерировать в Cursor. Пилот на одном типе — 1–2 недели.

Чем OCR+LLM отличается от RAG для документов?

RAG отвечает на вопросы по архиву. Для счёта нужен extraction: ИНН, сумма, НДС в JSON с правилами. OCR даёт текст, LLM раскладывает по схеме, regex проверяет цифры.

Какие сервисы распознают PDF в структурированные данные?

DIY: Mistral OCR, Google Vision, Tesseract + LLM в n8n/Make. Enterprise: AI Builder (Power Automate + review). На массовых счетах хватает OCR+LLM; на договорах — гибрид с VLM.

Нужно ли ЭДО, если есть OCR?

ЭДО — где закон требует электронный обмен. OCR+workflow — скан из почты → поля в учёт. Ветки параллельны и нормальны.

Модель путает НДС — что делать?

Уберите вычисление из промпта, whitelist 0/10/20%, сверка vat_amount с total. Ошибки в doc_errors разбирайте еженедельно.

Make или n8n?

Make быстрее старт с Google Sheets и CRM в облаке. n8n гибче для self-hosted и Code. Оба подходят под intake → OCR → LLM → HITL → export.

Прогоните 30 тестовых счетов, замерьте точность, потом автозапись в учёт. Автор: Артур Хорошев. Вопросы по Make — @maya_pro.

Часто задаваемые вопросы по теме (FAQ)

Для чего нужны AI-агенты и автоматизация в контенте?

AI-агенты (например, в связке с Make.com и Cursor) позволяют заменить рутинные задачи: сбор данных, написание постов, рерайт и даже автопостинг в Telegram или WordPress. Это экономит десятки часов в неделю и позволяет масштабировать бизнес без расширения штата.

Как быстро можно запустить свой контент-завод?

Базовый контент-завод (генерация текстов по RSS или из других источников) с автопостингом собирается без программирования (No-Code) за 1-2 дня. Сложные сценарии (с видео, аудио и кастомными MCP) внедряются за 1-2 недели.

Нужно ли уметь программировать?

Нет, большинство систем собираются визуально в Make.com (No-Code). Для сложных задач можно использовать вайбкодинг — генерацию кода с помощью Cursor AI через промпты на естественном языке.

Как настроить автоматизацию обработки документов с ИИ от скана до CRM?

Важно

Ошибка

Шаг

Инсайт

Проверьте, насколько ваш контент уже готов к автопилоту

Модули для WordPress (кастомные)