Оцифровка архивных документов в формате PDF/A

Организация хранения, комплектования, учета и использования архивных документов Архивного Фонда Российской Федерации требует внедрения современных подходов. Информатизация общества, наличие телекоммуникаций и различных каналов связи, возникновение новых форматов хранения архивных документов способствуют совершенствованию методов хранения архивных документов. Для органов государственной власти, органов местного самоуправления и организаций вопрос передачи на архивное хранение документов в Архивный Фонд РФ является ответственной задачей. Приказ № 526 от 31 марта 2015г. Министерства культуры РФ вводит в силу новые «ПРАВИЛА ОРГАНИЗАЦИИ ХРАНЕНИЯ, КОМПЛЕКТОВАНИЯ, УЧЕТА И ИСПОЛЬЗОВАНИЯ ДОКУМЕНТОВ АРХИВНОГО ФОНДА РФ И ДРУГИХ АРХИВНЫХ ДОКУМЕНТОВ В ОРГАНАХ ГОСУДАРСТВЕННОЙ ВЛАСТИ, ОРГАНАХ МЕСТНОГО САМОУПРАВЛЕНИЯ И ОРГАНИЗАЦИЯХ». В главе II Правил в п. 2.31. определено: «Передача текстовых электронных документов для хранения в архив организации, являющейся источником комплектования государственного и муниципального архива, осуществляется в формате PDF/А».

По вопросу хранения архивных документов в формате PDF/A ведутся споры. Но законы не обсуждаются - они исполняются. Если принимаются на уровне Министерства такие решения (использование новых форматов), то возможно назрела крайняя необходимость. Попробуем разобраться в целесообразности принятия данного решения.

Международный стандарт ISO 19005-1 «Управление документацией. Формат файла электронного документа для долгосрочного хранения» разработан Техническим Комитетом совместно с подкомитетами и Рабочей группой, а именно:

  • 1. ISO/TC 171, Прикладные программы для управления документами, Подкомитет SC 2, Вопросы по прикладным программам;
  • 2. ISO/TC 130, Графическая технология;
  • 3. ISO/TC 42, Фотография;
  • 4. ISO/TC 46, Информация и документация, подкомитет SC 11, Управление архивами и документами.

Все страны на протяжении последних десятилетий использовали формат PDF (цифровой формат переносимого Документа) посредством оцифровки бумажных документов. Коммерческие и правительственные организации, библиотеки, архивы, другие учреждения и отдельные лица во всем мире используют формат PDF для представления важной информации. Предполагалось, что PDF формат позволит сохранить документ в течение длительного срока, но сказать, что этот срок бесконечен, не представлялось возможным. Будущие поколения могут использовать оцифрованные документы, используя программное обеспечение Adobe Acrobat Reader фирмы «Adobe Systems Incorporated». Однако природа простого формата PDF не предназначена для долгосрочного хранения документов и имеет ряд ограничений долгосрочного хранения.

Формат PDF является универсальным форматом оцифрованных документов. История возникновения и преобразования формата многогранная. Формат PDF/Х (буква X в обозначении обозначает eXchange) был разработан для полиграфии и описывается международный стандартом ISO 15930 (рабочая группа ISO ТС 130). Требовался формат пригодный для передачи печатных оригиналов в цифровом рабочем потоке. Усовершенствованным форматом, впоследствии, становится формат PDF/X-1 (формат, предназначенный для обмена данными в полиграфии), анонсируемый международным стандартом ISO 15930-1. С этого момента, обозначаемый, как PDF/X-la (стандартный формат файлов, специально предназначенный для «слепого» обмена готовыми к печати документами в виде электронных данных). Совершенствование формата PDF/Х продолжается. Переход формата PDF/X-1 в PDF/X-3 происходит в 2002г. Достоинством формата PDF/X-3 является автоматическая адаптация и безошибочное создание файлов без необходимости согласования установок, а также возможность преобразования и интерпретации цветовых профилей, что облегчает работу цветной полиграфии. Управление цветом стало возможно в рабочем потоке, что обеспечивало надежную передачу цветового массива. Далее последовали форматы PDF/X-4, PDF/X-5. Достоинством последующим форматов становится возможность использования сжатия изображений, поддержка различных цветовых систем (прозрачного, нейтрально серого и т.д.), встраиваемых профилей.

Совершенствование программного обеспечения в части качественной визуализации образов, связано с потребностью представления информации в ЗЭ-пространстве. Формат PDF/Е (визуализация трехмерных изображений и задание метаданных для свойств объектов), ратифицирован организацией ISO в 2007 году в качестве открытого стандарта. Формат PDF/Е удобен для обмена документами архитекторами, строителями, инженерами производственных групп. Документы инженерных процессов содержат чертежи, которые отображаются как в 2D-, так и в 3 D-пространстве, а также дополняются сметами или спецификациями. Возникновение формата PDF/А инициировано некоммерческой международной организацией АПМ, осваивающей передовые практики архивирования документации и оптимизации информационных ресурсов, рассматривающей вопросы Управления Информацией и Изображениями. PDF/А - это подмножество формата PDF, содержащее ограниченный набор возможностей представления данных. Данный формат предназначен для долгосрочного хранения электронных документов. ISO 19005-1 п. 3.13 дает определение: Долгосрочный- период времени, достаточный для отслеживания последствий воздействия изменяющихся технологий (включая поддержку новых средств информации и форматов данных, а также изменяющегося сообщества пользователей), касающихся информации, находящейся в хранилище, который может продлеваться на неопределенное время в будущем. Обеспечение длительного срока хранения достигается посредством внедрения в содержимое электронного документа в формате PDF/A всей информации, необходимой для его отображения. Е1ервая редакция формата PDF/A-1 (PDF1.4) предоставляет следующие возможности:

  • 1. Вставлять в текс документа гиперссылки;
  • 2. Шифровать документ (используя пароль, обеспечивая защиту от модификаций);
  • 3. Наносить поверх изображения текстовый слой (прием, когда пользователь может скопировать с картинки или изображения текс);
  • 4. Вставлять метаданные, осуществлять привязку конкретного знания к части документа.

Основной задачей использования формата файла электронного документа для долгосрочного хранения PDF/A-1 (PDF 1.4) международный стандарт позволяет:

  • 1. обеспечить долгосрочное хранение электронного документа;
  • 2. применять к документам, содержащим наборы тактовых, растровых и векторных данных;
  • 3. осуществлять электронное представление совокупности текста и графических данных в виде страниц и метаданные, используемые для идентификации, понимания и визуализации этих данных, которые могут быть воспроизведены на бумаге или оптической микроформе без существенной потери информационного содержания;
  • 4. распознавать абстрактный графический символ, независимый от всевозможного дизайна;
  • 5. использовать цветовую идентификацию, соответствующую спецификации ICC и ее приложению (в управлении цветом ICC- профилем называют набор данных, характеризующий устройство цветного ввода или вывода или цветовое пространство согласно Международным стандартам по цвету -ICC);
  • 6. работать в интерактивном режиме с документами;
  • 7. использовать пакет ХМР-структурированная обертка преобразованных в последовательную форму метаданных ХМР (Extensible Metadata Platform) встроенная в широкое разнообразие форматов файла [7];

Документ, сохраненный в формате PDF/А, имеет объем (вес) больше, чем документ, сохранённый в формате PDF. Документ, сохраненный в формате PDF, в силу отсутствия связей с гиперссылками и мультимедийным контентом, можно открыть в операционной системе с помощью Е1риложения, подтверждающего соответствующий формат. Документ, сохраненный в формате PDF/А, позволяет осуществить сжатие в 100 раз, сохраняя качество первоначального изображения. Уникальное свойство формата PDF/А- это бесконечно малое место хранения на сервере и сверхвысокая скорость передачи данных по каналам связи.

Дополнительно стандарт ISO 19005-1 вводит следующие термины, что касается этой спецификации или ее частей, рекомендуется употреблять для этой спецификации, когда полное название стандарта ISO не используется:

  • - «PDF/А» - синоним для ряда стандартов ISO 19005;
  • - «PDF/А-1» - синоним для стандарта ISO 19005-1;
  • - «PDF/A-la»- синоним для стандарта ISO 19005-1 Уровень А (п.3.11 Соответствие Уровню А - уровень соответствия, включающий все требования этой части стандарта ISO 19005);
  • - «PDF/A-lb»- синоним для стандарта ISO 19005-1 Уровень В (п. 3.12 соответствие Уровню В - уровень соответствия, включающий требования этой части стандарта ISO 19005, касающиеся форм визуального отображения электронных документов, но не их структурных или семантических свойств).

Обработка архивных документов предусматривает возможность конвертации документов. Конвертация - это перемещение с одного носителя на другой или из одного формата в другой. Требования к процессам конвертации описаны в ГОСТ 15489-1-2007 «Управление документацией. Общие требования». Поставщиками программного обеспечения для конвертации копии документов в формате PDF/А являются (таблица 18):

Таблица 18

Программное обеспечение для конвертации копии документов в формат PDF/A

Наименование ПО

Компания

производитель

Область использования

LuraDocument PDF Compressor

Luratech Ltd. Германия

является признанным экспертом международного класса в области создания электронных архивов

PDF Compressor

CVISION Technologies Inc. США

предлагает полный спектр продуктов, направленных на автоматизацию потокового ввода и обработки документов

Cognitive PDF/А (SDK) Compressimo

Cognitive Technologies Россия

Дополнительно: распознавание фотографий и документов, сделанных на iPhone 4S

OpenOffice

Sun Microsystems США

В основном ориентирована на восточно-азиатский рынок, имеет восточноазиатские шрифты, дополнительные шаблоны, сортировку по азиатскому типу, обеспечивает миграцию документов, утилиты для управления конфигурациями

Из таблицы 18 видно, что рынок программного обеспечения конвертации документов в формат PDF/А четко структурирован. Компании производители программного обеспечения не конкурируют между собой, а соблюдают требования стран по электронному представлению архивных документов по Восточно-азиатскому типу (Open Office), Европейскому (LuraDocument PDF Compressor), Американскому (PDF Compressor), Российскому (Cognitive PDF/А (SDK) Compres- simo). Отчет о научно-исследовательской работе РГГУ содержит сравнительный анализ форматов файлов постоянного (долговременного хранения). В отчете формат PDF/А описан так: «...Исходя из проведенных сравнений между форматами PDF и его производным PDF/A, можно утверждать, что первый больше пригоден для оперативного обмена и краткосрочного хранения электронных документов, в свою очередь как PDF/А, имея статус международного стандарта, гарантирует, что даже через продолжительное время, вне зависимости от окружения и операционной системы, любой пользователь сможет открыть документ в данном формате, располагая ПО-просмотрщиком. В целом это соответствует концепции архива электронных документов». Делая выводы, можно провести оценку технико-экономической эффективности внедрения формата PDF/A-1 (PDF1.4).

Во-первых, формат PDF/A-1 (PDF 1.4) рекомендован к применению на территории РФ, введен в действие Приказом Минкультуры России от 31.03.2015 № 526 , зарегистрирован в Минюсте России 07.09.2015 № 38830.

Во-вторых, формат PDF/A-1 (PDF 1.4) является современным форматом долгосрочного хранения, не зависит от программного окружения и операционной системы, сокращает затраты будущих поколений на хранение, т.к. изначально ориентирован на хранение, начиная от 70 лет и далее, предназначен для хранения на новых носителях информации.

Хочется отметить, что современное российское программное обеспечение (ПО) не уступает зарубежным аналогам, соответствует большей части международных требований, покрывает требования к долгосрочному архивному хранению оцифрованных документов и в условиях импортозамещения ПО рекомендовано к применению организациям, органам государственной власти, местного самоуправления РФ.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ   След >