Поиск информации в сети Интернет

В 1990 году была создана первая система поиска информации в сети Интернет Арчи, в 1991 г. в университете Минессоты создана система Гофер. Гофер — это иерархическая система меню, позволяющая легко находить информацию, имеющуюся на сервере или на нескольких серверах.

Интернет предоставляет оперативный доступ к информации на любую тему, которая находится на сотнях тысячах информационных серверов. Очень часто у пользователя появляется необходимость найти сведения по какой-либо теме. Для этого предназначены специальные поисковые инструменты, они позволяют найти документы, содержащие какие-либо конкретные слова.

Поиск в Интернете требует определенных навыков. Полезно запомнить следующие советы:

  • • если вопрос поставлен правильно — то это уже половина ответа;
  • • легко найти редкую информацию и трудно — широко распространенную;
  • • необходимо знать особенности поисковых систем;
  • • для разных запросов нужно использовать разные поисковые инструменты;

Пользователь, задав ключевые слова и активизировав поиск, получает список документов. Этот список сортируется по определенным критериям так, чтобы вверху списка оказались те документы, которые наиболее соответствуют запросу.

Поисковые серверы можно разделить на тематические каталоги, роботы индексов (поисковые машины) и системы мета поиска. Также для поиска необходимой информации в Интернет весьма полезны системы поиска в конференциях Usenet и службы поиска людей.

Единой оптимальной схемы поиска в Интернет не существует. В зависимости от специфики информации для ее поиска вы должны использовать соответствующие поисковые службы. Можно пользоваться какой-нибудь одной поисковой системой, например Rambler, но чем грамотнее подобраны поисковые службы и составлен запрос на поиск информации, тем качественнее будут результаты поиска.

Облегчат поиск информации несколько советов.

  • 1. Правильно поставленный запрос, нужно искать по более редкому, уникальному слову.
  • 2. Нужно стремиться получить малое количество документов, не потерять нужное в большом объеме информации.
  • 3. Нужно пытаться использовать гиперссылки, относящиеся к ключевому слову.

Тематические каталоги очень похожи на библиотечные каталоги, информация в них имеет иерархическую структуру, классифицирован- на по темам: искусство, наука, образование и т.д. Каталогами пользуются тогда, когда не известно точно, что именно нужно искать. Возможен поиск информации и по ключевому слову.

Наиболее популярным во всем мире признан тематический каталог Yahoo! (http://www.yahoo.com). Он представляет собой огромную базу данных адресов сайтов самой различной тематики. Система Yahoo! англоязычная. Если нужно найти информацию на русском языке, то лучше использовать российские каталоги. Стоит отметить первый российский каталог Russia on the Net (http://www.ru), один из крупнейших русскоязычных каталогов List.RU (http://www.list.ru/), российский вариант УаЬоо!, также каталог «Созвездие Интернет», содержащий только избранные (заявлено как самые интересные ресурсы), российский проект «Желтые страницы Интернет» (http://www.piter-press.ru/yp), где, как и в одноименной книге, представлена информация о самых разных ресурсах Интернет.

Поисковые машины устроены несколько иначе. Это сервер с огромной базой данных адресов, который автоматически обращается к страницам VVW по всем этим адресам, изучает содержимое этих страниц, формирует и прописывает ключевые слова со страниц в свою базу данных, т.е. индексирует страницы. Все ссылки помещаются в базу данных сервера, в которой пользователи, используя ключевые слова, находят нужную им информацию. Результат поиска состоит из выдержек рекомендованных пользователю страниц, их адресов (и Я!/), оформленных в виде гиперссылок

Самая популярная поисковая машина АкаХ^а (http://www.altavista. сот) содержит 11 млрд слов, извлеченных из 30 млн ?УУ-страниц.

Наиболее развитый сервис поиска информации на русском языке предоставляет сервер Япбех (http://www.yandex.ru).

В Япёех можно написать фразу по-русски, описывающую то, что нужно найти. Система самостоятельно проанализирует запрос и постарается найти все, что относится к заданной теме. База Япёех содержит порядка 2 млн документов и постоянно обновляется.

Синтаксис запроса Япс1ех

Пробел или & — логическое И (краткое — в пределах одного абзаца).

Пример: школьное образование.

Результат: все документы, где в пределах одного абзаца встречаются слова «школьное» и «образование».

&& — логическое И (в пределах документа).

Пример: школьное&&образование.

Результат: все документы, где встречаются слова «школьное» и «образование».

, или | — логическое ИЛИ.

Пример: школьное, образование.

Результат: все документы, где встречается либо слово «школьное», либо слово «образование».

~ — бинарный оператор И НЕ (в пределах одного абзаца).

О — группирование слов.

Пример: (школьное&&образование) -газета.

Результат: все документы, где встречаются слова «школьное» и «образование», но не в словосочетании со словом «газета».

/(число) — расстояние в словах, где «число» — число слов между словами в запросе плюс единица.

Пример: школьное/1 образование.

Результат: все документы, где встречается словосочетание «школьное образование».

Очень популярна российская поисковая машина Rambler.

У этого сервера еще более полная база данных адресов URL, чем у Япёех. Использует те же логические операторы И, ИЛИ, НЕ, метасимвол * (аналогично расширяющему диапазон запроса символу * в AltaVista), коэффициентные символы + и — для увеличения или уменьшения значимости вводимых в запрос слов.

Стоит также отметить прочие русскоязычные поисковые машины Апорт.

Поисковые машины и тематические каталоги имеют много общего. У каталогов присутствует возможность поиска информации по строке запроса с использованием логических операторов, а поисковые машины содержат свои собственные тематические каталоги.

Системами метапоиска можно воспользоваться исходя из экономии времени и денег. Эти системы не имеют собственных поисковых инструментов и собственной базы данных. Их основная задача состоит в том, чтобы передать запрос пользователя настоящим поисковым системам. Системы метапоиска позволяют задействовать сразу несколько поисковых служб, при этом у пользователя нет необходимости подключаться к каждой из этих служб и многократно вводить запрос.

Системой такого класса является Search.com (http://www.search. com), а для русскоязычных документов можно использовать Savvy Search (http://guaraldi.cs.colostate.edu:2000/form?lang=russian). Еще одна российская система метапоиска «Следопыт» (http://www. medialingua.ru/www/Wwwsearc.htm) работает только с пятью англоязычными поисковыми машинами и одной русскоязычной, но интересна тем, что переводит ваш русскоязычный запрос на английский язык для англоязычных поисковых машин.

Существуют мультипоисковые страницы:

«Все в одном» (http://www.tpi.ac.ru/~mike/search/index.htm);

Search (http://www.informika.ru/windows/intern/poisk/main.html); и др.

Для продуктивного использования Интернета необходимо уметь искать и копировать нужные файлы, для этого служит FTP-сервис.

FTP-архивы являются одним из основных информационных ресурсов сети Интернет. По своей сути это огромный склад программ, рисунков, текстов, которые хранятся в виде файлов на различных компьютерах. При этом компьютерные платформы могут быть различных типов. В этом и заключается главная особенность FTP в сети. Если ваш компьютер имеет FTP и подсоединен к Интернету, то вы получите доступ к огромному числу архивов, хранящихся на других системах.

Если вам нужна определенная программа или документ, но вы не знаете, где он находится, то в поисках вам помогут так называемые Archie-серверы, которые ведут списки файлов многих FTP-серверов, постоянно обновляя свои базы данных. Можно, используя Telnet или программу-клиент на вашей системе, войти в такой АгсЫе-сервер и поискать нужные вам файлы. Если такой файл существуют, то вам будет выдан список FTP-серверов, путей, размер и дата последней модификации файла.

Для поиска информации на FTP-серверах можно использовать популярный русский поисковый сервер:

http://www.filesearch.ru

или зарубежный:

http://ftpsearch.iycos.com

Здесь требуется указывать не ключевые слова, а имя файла.

 
Посмотреть оригинал