Электронный документооборотРефераты >> Программирование и компьютеры >> Электронный документооборот
Наличие утилит просмотра документов разных форматов
В состав большинства EDMS-систем входят утилиты для просмотра документов (так называемые viewers), понимающие многие десятки форматов файлов. С их помощью очень удобно работать, в частности, с графическими файлами (например, с файлами чертежей в САПР). Помимо базового комплекта утилит просмотра (входящего в каждую EDMS-систему), у третьих фирм можно приобрести дополнительные утилиты, хорошо интегрируемые с EDMS-системами.
Возможность аннотирования документов
При организации групповой работы над документами обычно весьма полезна возможность их аннотирования. Так как в некоторых случаях пользователи лишены прав на внесение каких-либо изменений в документ в процессе его согласования, то они могут воспользоваться возможностью его аннотирования. В большинстве EDMS-систем аннотирование реализуется за счет включения в карточку документа атрибута для аннотации и передачи пользователям прав на редактирование такого поля карточки. Но такое решение не всегда приемлемо (особенно при аннотировании графического документа). В связи с этим в некоторых EDMS-системах реализована так называемая функция «красного карандаша», с помощью которой можно графически указать недостатки на самом изображении. Программные средства, в которых реализована функция «красного карандаша», широко предлагаются третьими фирмами.
Поддержка различных клиентских программ
Клиентами большинства EDMS-систем могут быть ПК с ОС MS Windows 95, Windows NT. В некоторых EDMS-системах допускается также использование платформ UNIX и Macintosh. Кроме того, все современные EDMS-системы позволяют работать с документами через стандартные Web-браузеры. Так как Web-браузеры могут быть размещены на разнообразных клиентских платформах, то это облегчает решение проблемы обеспечения работы EDMS-систем в гетерогенных сетевых средах. При использовании Интернет-технологий у EDMS-систем появляется еще один серверный компонент, отвечающий за доступ к документам через Web-браузер.
Системы управления выводом документов
Одним из особых сегментов современного рынка систем управления документооборотом (СУД) являются так называемые системы управления выводом документов (output management systems — OMS), основным предназначением которых является генерация выходных документов. Ряд OMS-систем отвечает только за распределение и доставку выходных документов (в электронном виде — в форматах HTML, XML и PDF). Очень часто OMS-системы интегрированы с программными пакетами сканирования документов и изображений. Полезной возможностью некоторых OMS-систем является и взаимодействие с унаследованными системами.
В некоторых OMS-системах дополнительно реализована возможность архивации и долговременного хранения выходных отчетов и документов. В связи с этим, многие из OMS-систем классифицируются Gartner Group как интегрированные системы архивации и поиска документов (IDARS — integrated document archive and retrieval systems). Однако главной причиной популярности OMS-систем все же является занимаемая ими рыночная ниша — генерация документов и отчетов в информационных системах предприятий и организаций, построенных с использованием ERP-систем. По мнению аналитиков Gartner Group, одним из слабых мест современных ERP-систем является плохое управление генерацией выходных документов (разработчики ERP-систем больше сосредоточены на повышении функциональности ключевых модулей своего ПО, чем на «второстепенных» вопросах обеспечения генерации выходных отчетов, не имеющих, по их мнению, хороших рыночных возможностей). Именно этот недостаток ERP-систем и послужил основным фактором появления и быстрого развития рынка OMS-систем.
Информационно – поисковые технологии для электронного делопроизводства.
В системах должны быть предусмотрены развитые возможности индексирования, хранения и поиска документов, включая полнотекстовое индексирование.
Индексирование документов означает:
· реквизитную индексацию;
· ручное управление структурами хранения документов;
· настройку состава полей, типа и длины контрольных карточек документа в архиве;
· автоматическую полнотекстовую индексацию документов;
· автоматическое распознавание формата файла электронного документа;
· индексацию текста документа сразу при его вводе;
· морфологический анализ индексируемых текстов для приведения помещаемых в индекс слов к канонической форме (нормализация текста в индексе);
· наличие стоп – словарей при полнотекстовой индексации и обеспечение их настройки;
· выделение из текста сложных (составных) терминов и понятий;
· поддержку и настройку словарей и тезауруса;
· технологию реквизитной разметки документов;
· настройку набора реквизитов;
· возможность различных режимов реквизитной разметки документов (ручной, автоматический, полуавтоматический);
· интеграцию с произвольными программами создания, просмотра и изменения электронных документов.
Хранение документов включает в себя возможность:
· работы с библиотеками магнитооптических дисков, магнитных лент, компакт – дисков для хранения больших объемов информации;
· управление внешними носителями;
· хранение электронных документов произвольного формата, аннотированных текстов, по которым производится поиск;
· хранения в системе для каждой страницы как исходного изображения, так и распознанного текста.
Поиск предусматривает:
· наличие стандартного языка запросов к БД;
· реквизитный поиск документов;
· полнотекстовый поиск, точность поиска;
· поиск по именам документов и аннотациям;
· формирование сложных запросов с использованием логических операций;
· контекстный поиск и меру близости слов при поиске;
· адекватность результата поиска запросу;
· морфологический анализ при построении запроса;
· возможность работы с системой удаленных пользователей.
Поиск может быть составным и включать несколько поисковых атрибутов из перечисленных выше типов. Результатом поиска служат образ найденных документов и содержание аннотаций, построенных в процессе индексирования или его ручного атрибутирования. Найденные образы могут быть распечатаны или переданы по корпоративной сети для просмотра с другого рабочего места.
Запрос строится путем заполнения шаблона ключевыми словами, содержание которых пользователь может задавать произвольно. Поиск документов по запросу осуществляется на двух уровнях: сначала происходит поиск в справочнике данных, а по ссылкам ищется (при задании пользователем соответствующих атрибутов) сам документ. Как правило, хранение документов осуществляется автономно из – за больших объемов архива и необходимости использования оптических накопителей информации. Такая архитектура, кроме всего, позволяет минимизировать время, затрачиваемое на физический доступ к документам в режиме множественных запросов, а также обеспечивает доступ данных из неоднородных (гетерогенных) сетей.
Следует отметить, что образ документа может храниться как в текстовом, так и в графическом формате. В последнем случае он, как правило, является результатом использования OCR– технологий.