Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow Информационные технологии в государственном и муниципальном управлении
Посмотреть оригинал

Информационно-поисковые системы

Системы текстового поиска — основной технологический компонент информационно-поисковых систем.

Информационно-поисковая система (ИПС) — совокупность информационно-поисковых массивов (коллекций документов) их носителей, информационно-поискового языка, правил его использования, критерия выдачи документов по запросу, программных и технических средств.

Каждая ИПС может поддерживать несколько различных коллекций документов.

Автоматизированные ИПС начали разрабатываться в 1950-х гг. В зависимости от вида хранимых данных различали фактографические и документальные (документографические) системы. Фактографические ИПС хранили сведения о сущностях реального мира и их свойствах в виде данных небольшого размера (имя, год рождения, образование и т.д.). Документальные ИПС хранили данные, представленные большими наборами символов. С развитием технологий баз данных, предназначенных для операций с массивами фактографических данных, за фактографическими ИПС постепенно закрепилось название «системы баз данных» (см. 3.1), а под ИПС стали понимать документальные системы.

Для поиска документов используются информационно-поисковые языки — подкласс информационных языков (см. 1.5.2).

Информационно-поисковый язык — формализованный искусственный язык, предназначенный для индексирования документов, информационных запросов и описания фактов в целях последующего хранения и поиска.

В информационно-поисковых языках выделяют:

  • 1. Классификационные языки — языки, предназначенные для индексирования документов (частей) и информационных запросов посредством понятий и кодов некоторой выбранной классификации (рубрик, тем) документов. Предполагается, что ИПС заранее содержит все классы, к которым может быть отнесен любой документ, закодированный соответствующим индексом. Примером ИПС, использующей классификационный язык, является библиотечный систематический каталог.
  • 2. Дескрипторные языки — языки, позволяющие приписать каждому документу несколько дескрипторов (совокупность ключевых слов), каждый из которых является именем широкого класса понятий, терминов и, следовательно, помечает множество, в которое данный документ входит. В основе дескрипторных информационнопоисковых языков лежат тезаурусы [16].

В зависимости от применяемого информационно-поискового языка содержание индекса будет несколько различным. Например, при использовании дескрипторного языка для того, чтобы индексировать статью о формировании земельного кадастра муниципальных образований территории, достаточно дескрипторов ЗЕМЕЛЬНЫЙ УЧАСТОК, СОБСТВЕННИК, ПРАВА, ПЛОЩАДЬ и названий муниципальных образований. При любой комбинации признаков при запросе документ будет найден. Использование классификационного языка требует, чтобы в ИПС было заранее создано достаточно большое количество рубрик и подрубрик, их количество и перечень влияют на содержание индекса.

Программное обеспечение ИПС делает возможным:

  • • составление, кодирование и загрузку БД поисковых образов документов;
  • • загрузку БД документов и их адресов хранения;
  • • составление и кодирование поисковых образов запросов;
  • • поиск и выдачу ответа на запрос в виде документа или адресов хранения документов на экран, бумагу или в файл;
  • • актуализацию БД поисковых образов документов и БД документов и их адресов хранения;
  • • актуализацию тезауруса;
  • • выдачу справок.

Информационно-поисковые системы первоначально создавались в библиотечно-реферативных службах или информационных центрах, выпускающих реферативную информацию (обзоры, экспресс-информацию, реферативные журналы). В настоящее время ИПС широко используются в управлении организациями (предприятиями) и во многих других сферах деятельности. Выделяют три поколения информационно-поисковых систем [30].

Первое поколение ИПС составляли дескрипторные ИПС — самые ранние системы текстового поиска. Системы основаны на создании дескрипторов на каждый документ и поисковый запрос и выполнении запросов путем сравнения наборов дескрипторов. В основном использовались для библиографического поиска, существуют и в настоящее время. Дескрипторные ИПС обладают несложными механизмами поиска, но качество поиска сравнительно невысокое.

Второе поколение ИПС представляют системы полнотекстового поиска, основанные на автоматизированном индексировании документов, использовании специального лингвистического обеспечения, применении различных моделей и методов поиска. Широкое распространение в сфере территориального управления имеют справочные правовые системы «Консультант Плюс», «Гарант», «Кодекс», хранящие правовые акты федерального и местного законодательства, ненормативные материалы (консультации экспертов, бланки деловых документов, проспекты эмиссии ценных бумаг коммерческих банков и т.п.).

Третье поколение ИПС представляют мультипоисковые системы: мультимедийные, мультиязыковые системы, системы, основанные на мультисредствах. Базируются на статистических методах, математической логике и теории вероятностей, кластерном анализе, методах искусственного интеллекта.

Областью применения технологий текстового поиска являются не только информационно-поисковые (документальные) системы. Перспективным является их использование в системах электронного документооборота, осваиваемых в крупных коммерческих фирмах и на предприятиях, а в настоящее время внедряемых в органы государственного управления (см. 3.5).

 
Посмотреть оригинал
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы