Обработка сложных документов

Подсистема обработки сложных по структуре документов обеспечивает:
  • сканирование и распознавание с использованием программного обеспечения ABBYY Fine Reader Engine.
  • автоматическое определение последовательности структурных блоков в документе (структурные блоки: «исполнители», «текст», «контролеры», «срок исполнения»);
  • ручной режим определения последовательности структурных блоков;
  • автоматическое распознавание отсканированного текста и проверку орфографии;
  • сохранение электронного образа документа в многостраничном компрессированном TIFF - файле в базе данных;
  • сохранение распознанного текста для контекстно-зависимого поиска;
  • автоматическую обработку структурных элементов документа на основе справочников Системы с привязкой распознанных значений к соответствующим полям электронной карточки документа;
  • автоматическую адресацию документа исполнителям, контролерам и сотрудникам, которым документ адресуется к сведению.

Описание подсистемы

Достаточно часто существует необходимость внесения в базу данных информации о документах, которые имеют определенную структуру (несколько пунктов с заданиями, перечнем исполнителей, контролеров, сроков исполнения). Система позволяет автоматизировать этот процесс. Пропустив структурированный документ через сканер, и получив на экране его изображение, пользователь последовательно выделяет блоки на распознавание. При этом каждый блок автоматически подписывается в соответствии со структурой поручения и атрибутами полей электронной карточки структурированного документа: номер документа, на который выдано поручение; перечень исполнителей по пунктам; содержание пунктов; контролеры по каждому пункту. После распознавания текста, все данные автоматически заносятся в соответствующие поля электронной карточки структурированного документа. При этом значения полей получают однозначное соответствие со справочными данными Системы.

Отсканированный образ документа сохраняется в базе данных в многостраничном компрессированном TIFF-файле, что дает возможность вывести на экран монитора пользователя любую страницу документа и значительно сократить объем хранимой информации в базе данных.

Кроме того, Система в фоновом режиме распознает отсканированный текст для обеспечения контекстно-зависимого поиска.

Обработанный таким образом структурированный документ автоматически направляется всем его исполнителям и контролерам.