Обработка сложных документов
Подсистема обработки сложных по структуре документов обеспечивает:
- сканирование и распознавание с использованием программного обеспечения ABBYY Fine Reader Engine.
- автоматическое определение последовательности структурных блоков в документе (структурные блоки: «исполнители», «текст», «контролеры», «срок исполнения»);
- ручной режим определения последовательности структурных блоков;
- автоматическое распознавание отсканированного текста и проверку орфографии;
- сохранение электронного образа документа в многостраничном компрессированном TIFF - файле в базе данных;
- сохранение распознанного текста для контекстно-зависимого поиска;
- автоматическую обработку структурных элементов документа на основе справочников Системы с привязкой распознанных значений к соответствующим полям электронной карточки документа;
- автоматическую адресацию документа исполнителям, контролерам и сотрудникам, которым документ адресуется к сведению.
Описание подсистемы
Достаточно часто существует необходимость внесения в базу данных информации о документах, которые имеют определенную структуру (несколько пунктов с заданиями, перечнем исполнителей, контролеров, сроков исполнения). Система позволяет автоматизировать этот процесс. Пропустив структурированный документ через сканер, и получив на экране его изображение, пользователь последовательно выделяет блоки на распознавание. При этом каждый блок автоматически подписывается в соответствии со структурой поручения и атрибутами полей электронной карточки структурированного документа: номер документа, на который выдано поручение; перечень исполнителей по пунктам; содержание пунктов; контролеры по каждому пункту. После распознавания текста, все данные автоматически заносятся в соответствующие поля электронной карточки структурированного документа. При этом значения полей получают однозначное соответствие со справочными данными Системы.
Отсканированный образ документа сохраняется в базе данных в многостраничном компрессированном TIFF-файле, что дает возможность вывести на экран монитора пользователя любую страницу документа и значительно сократить объем хранимой информации в базе данных.
Кроме того, Система в фоновом режиме распознает отсканированный текст для обеспечения контекстно-зависимого поиска.
Обработанный таким образом структурированный документ автоматически направляется всем его исполнителям и контролерам.