Перейти к основному содержимому

Обработка документов

После загрузки каждый документ проходит фиксированную последовательность: сначала автоматическое извлечение, затем явная проверка человеком, затем решение о регистрации. Ничто не попадает в Реестр без этого решения. Это и есть правило «проверка прежде всего», которое формирует остальную часть продукта.

Используйте эту страницу как пошаговое руководство по жизненному циклу одного документа.

Конвейер обработки

  1. Файл обнаружен — через загрузку или через привязанную исходную папку.
  2. Парсер извлекает ключевые поля — контрагент, суммы, номера НДС, даты, данные по позициям и прочие метаданные.
  3. Документ переходит в состояние проверки и появляется в панели превью.
  4. Вы проверяете извлечённые данные и выбираете, что будет дальше.

Вы сохраняете контроль над тем, что попадёт в Реестр. Парсер делает черновик, а не решение.

Варианты переразбора

Превью предлагает два пути переразбора:

  • Переразбор (Canonical Route) — стабильный продакшн-экстрактор, оптимизированный под предсказуемые результаты.
  • Переразбор (ZenoLab) — экспериментальный экстрактор, доступный где включён, для проверки улучшенных парсеров на реальных документах.

Запускайте переразбор, когда:

  • качество извлечения визуально низкое,
  • исходный файл обновлён или заменён,
  • вы хотите сравнить поведение canonical и lab на одном и том же документе.

Решения, которые можно принять после разбора

Когда превью готово, действия справа позволяют:

  • Зарегистрировать (Register) — принять документ в Реестр. Перед подтверждением может потребоваться выбрать период.
  • Отметить проверенным (Mark Reviewed) — зафиксировать, что вы проверили, не регистрируя его (полезно для документов, которым не место в регистре).
  • Исключить (Exclude) — явно убрать его из дальнейшего рассмотрения. Используйте для дубликатов, спама или страниц, которым здесь не место.
  • Отправить на проверку точности (Send to Accuracy Review) — сообщить о структурированных проблемах извлечения без передачи исходных байтов (см. ниже).

В регистрах, опирающихся на Реестр, в потоках сопоставления и в экспортах появляются только зарегистрированные документы.

Поток проверки точности

Отправить на проверку точности открывает модальное окно с чек-листом. Вы:

  1. Отмечаете поля, не совпадающие с исходным документом.
  2. Добавляете свободный текст там, где интерфейс предлагает.
  3. Отправляете чек-лист.

Что передаётся в систему:

  • ключи полей, которые вы отметили,
  • анонимизированные структурные сигналы,
  • виртуальный снимок исходника, когда байты доступны локально.

Что не передаётся: исходное, нередактированное содержимое документа — как обычная практика. Поток проверки точности существует именно для того, чтобы мы могли улучшать качество разбора, не видя ваши документы целиком.

Открытие исходника

Действие Open source пытается открыть исходный файл, на который ссылается превью.

Замечания, которые часто всплывают:

  • В режиме локальной папки браузер может блокировать прямое открытие папки из соображений безопасности.
  • Safari в частности не разрешает открывать пути к локальным папкам из веб-интерфейса.
  • Если ссылка на источник не разрешается, интерфейс показывает Source link unavailable.

Когда локальный контекст устаревает, Change folder переподключает его чисто.

Что намеренно остаётся ручным

По замыслу несколько вещей никогда не происходят автоматически:

  • Корректность поля — вы решаете, верное ли число.
  • Финальный результат: зарегистрировать, отметить как проверенный или исключить.
  • Выбор периода перед регистрацией, когда периоды настроены.

Это моменты, где Zeno CY медленнее, чем инструмент полной автоматизации — и где он зарабатывает тот след аудита, который можно защитить.

См. также