автоматические роботы-индексаторы, т.е. в нашей терминологии - субъекты
КС, которые без участия человека постоянно сканируют информационное
пространство Интернета и индексируют (т.е. устанавливают связи между
понятиями и содержанием страниц) почти все, что им попадется. Результаты
своей работы они заносят в базу данных, из которой потом извлекается ответ на
запрос пользователя. Такие системы должны постоянно «передвигаться» по
Интернету: искать новые документы и обновлять старые. Для этого они
подключены к Сети через мощные каналы связи.
Второй класс - тематические каталоги, которые с самого начала были
созданы не для того, чтобы собрать под свою крышу абсолютно все. В
каталогах вся информация рассортирована по темам, причем в них содержится
информация, обработанная человеком. Это означает, что по каждому ресурсу
Интернета (страница, документ, сайт, сервер) составляется краткая справка:
содержание, ссылки на другие ресурсы, автор, фирма и т.п. Ценность
информации в каталогах значительно выше, чем в автоматических индексах,
но, к сожалению, ее и значительно меньше. Стоит заметить, что многие
каталоги не бесплатны, особенно это касается тех, которые содержат
коммерческую информацию. Вот несколько рекомендаций по практическому
нахождению информации с помощью поисковых систем:
• необходимо иметь в виду, что ответы на один и тот же вопрос в различных
поисковых системах не совпадают, поэтому для получения полного
ответа на свой вопрос надо провести поиск с помощью нескольких
поисковых систем;
• при первом ознакомлении с интересующей темой лучше всего начинать с
тематических каталогов.
Обзор поисковых систем. Русскоязычным пользователям, которым нужно
найти что-то в Рунете (в доменной зоне имен «.га»), лучше всего начинать
поиск с российских поисковых систем, и в первую очередь - с поисковой
169
машины Япdех. Для следующих этапов поиска вполне подойдут Rambler и
Mail.ru. Во многих случаях уточнить результаты поиска в Япdех можно с
помощью глобальной поисковой системы Google.
Русская буква «Я» среди латинских в названии Япdех не ошибка, а
пожелание авторов системы. В английском варианте название становится более
читаемым - Yandex. Но в любом случае перед нами весьма перспективная
поисковая машина (слово «машина» - это также изыск авторов), которая
находится по адресу: http://www.yandex.ru.
Поисковая система Япdех за последнее время несколько раз меняла свой
дизайн и расширяла сервисные функции, а в локализованной версии Internet
Explorer 5 вошла в число признанных Microsoft поисковых систем. Теперь у
поисковой системы два адреса в Интернете: http://www.yandex.ru и
http://www.ya.ru. По первому адресу находится портал, где можно найти
информацию, получить доступ к новостям, создать свой почтовый ящик. По
второму адресу располагается веб-страница, на которой имеется только форма
для ввода запроса.
Сегодня Япdех декларирует, что работает в режиме обработки запроса на
естественном языке, а также утверждает, что такой возможности нет у других
поисковых систем. В идеале это означает, что машина ищет не просто по всем
словам, указанным в запросе, а «с пониманием смысла». Вы вводите слово или
фразу, а ответ дается в соответствии со смысловой нагрузкой запроса.
Например, если задан запрос «идти», то в результате поиска будут найдены
ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т.д.
На запрос «окно» будет выдана информация, содержащая и слово «окон», а на
запрос «отзывали» - документы, содержащие слово «отозвали».
При составлении запросов надо учесть, что Яndex использует сложный
язык запросов, синтаксис которого только в общих чертах совпадает с языками
запросов у других поисковых систем, например:
+<���слово> - искать документы, в которых присутствует данное слово.
Запрос доска объявлений + велосипед покажет все объявления о продаже
велосипедов;
-< слово» - требует отобрать документы, в которых не содержится данное
слово;
“<���слово><���слово>” - поиск документа с образцом фразы;
<���слово>~<���слово> - поиск документа, в котором содержится первое
слово, но отсутствует второе.
При поиске следует учесть, что Япdех различает строчные и прописные
Читать дальше