Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии в государственном и муниципальном управлении
Посмотреть оригинал

Документальные базы данных

Документальные БД хранят документы, т.е. данные неопределенной или переменной структуры, и бывают полнотекстовыми или библиографическо-реферативными [8]. Подобные БД создаются в рамках документальных систем — систем, предназначенных для обработки, поиска, представления полнотекстовых документов или справочно-реферативной информации. В сфере государственного управления создаются различные документальные БД, например делопроизводственные, хранящие нормативно-распорядительные документы, служебные документы, корреспонденцию и пр. Используются правовые БД («Консультант Плюс», «Гарант», «Кодекс» и др.), БД научно-технической информации, в том числе патентной, БД образовательных ресурсов.

Документальные системы ведут свое происхождение от библиотечно-реферативных служб или информационных центров, выпускающих реферативную информацию (обзоры, экспресс-информацию, реферативные журналы). Современные документальные системы часто построены в виде системы гипертекстов, реализуют современные модели поиска и обладают свойствами информационно-поисковых систем (см. 3.2, 3.3).

Информационные хранилища

С развитием информационных технологий темпы увеличения объемов как структурированной, так и неструктурированной информации возрастают. Для организаций (предприятий) встает проблема обеспечения согласованной организации данных, так как:

  • • данные поступают из разных источников, использующих различные модели данных. Структурированные данные могут быть построены по реляционной, объектной модели; слабоструктурированные и неструктурированные данные могут быть организованы в виде HTML-файлов, иметь тэговую модель, а могут быть просто текстовыми файлами (см. 3.3);
  • • разные источники имеют свои интерфейсы взаимодействия с данными. Структурированные данные используют СУБД соответствующего класса и языки запросов, слабоструктурированные и неструктурированные данные используют языки разметки, информационно-поисковые языки и пр.

Трудности в обеспечении доступа к данным, полученным из разных источников, обусловили трудности применения к информационным массивам средств анализа данных для дальнейшего принятия решений и прогнозирования. Решением проблемы стали технологии информационных хранилищ. Наибольшее распространение получили технологии хранилищ данных и технологии виртуальных хранилищ.

Хранилище данных — многомерный массив данных, сформированный из баз данных и информационных массивов внешнего экономического окружения за длительный период деятельности организации (предприятия), снабженный процедурами извлечения и использования информации для анализа и прогнозирования.

Хранилище данных (ХД) заполняется данными из разных источников: БД различных типов и документов разных форматов из внутренних и внешних (курсы валют, таможенные пошлины, акцизные сборы, котировки акций и т.п.) источников. При этом выполняются преобразования по приведению разнородных данных к сопоставимому виду (реструктурирование данных) и проводятся постоянный мониторинг и отбор (по критериям достоверности, оперативности и др.) источников данных. Все поступившие документы каталогизируются в виде словаря-справочника данных (репозитория, базы метаданных), что обеспечивает при необходимости возможность восстановления документов. Размеры хранилищ бывают разные. Небольшим считается ХД размером меньше 5 Тбайт, средним — 5—30 Тбайт, а крупным — больше 20 Тбайт.

Хранилище данных обеспечивает достаточно высокую скорость выполнения запроса. Недостатком является невозможность синхронизации ХД с источником данных и, следовательно, невозможность актуализации данных. При изменении данных в источнике требуется операция по передаче новой порции данных в хранилище, а не по их обновлению. Несмотря на это, ХД являются ядром технологии комплексного использования сведений, находящихся в различных БД. Для создания ХД используются СУБД. Наиболее популярны СУБД, разработанные Teradata, IBM, Oracle, Sybase, Microsoft. Иногда применяют специальные технологии, например SENS и SEWSS, разработанные компанией StatSoft Enterprise Systems и др.

Хранилище данных может стать составной частью информационной системы управления территорией, организацией (предприятием). Разработка технологий для создания ХД информационных ресурсов органов государственной власти и создание инструментальных программных средств для информационной поддержки принятия решений на этой основе являются одними из приоритетных направлений региональной информатизации [31]. Концепция ХД дала начало развитию концепциям и технологиям интеллектуального анализа данных (см. 3.7).

Технологии виртуальных хранилищ основаны на идее создания программной среды, через которую пользователь или приложения могут формировать универсальные запросы на поиск информации. Доступ к внешним источникам информации осуществляется через набор адаптеров, транслирующих запрос в воспринимаемый источником формат и возвращающих полученный результат программной среде. Полученная информация сортируется и представляется пользователю в универсальном виде, при этом обеспечиваются доступ к первоисточнику и возможность сохранения содержания на компьютере пользователя. Преимущество виртуальных хранилищ заключается в том, что источники данных не теряют связь со своими источниками пополнения, и тем самым пользователь виртуального хранилища имеет всегда доступ к актуальной информации. Недостаток — в определенной сложности выполнения запросов, что снижает производительность системы.

 
Посмотреть оригинал
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы