Давайте рассмотрим примеры работы логического оператора «НЕ».
По запросу собака НЕ кошка будет найден документ, содержащий текст «корм для собак», а вот документы, содержащие текст «кошка отдыхала» или «собака гналась за кошкой» и даже «корма для собак и кошек», из выдачи будут исключены.
Часто встречается чуть более сложный вариант написания запроса, который содержит все или почти все операторы, показанные выше. В этом случае лучше пользоваться еще одним элементом поискового запроса – круглыми скобками, которые позволяют отделять однотипные слова запроса от остальных. Кроме того, они дают возможность самому составителю визуально лучше различать разные фрагменты запроса. Покажем на конкретных примерах, как и для чего скобки используются.
Например, запрос пушистые И (собаки ИЛИ кошки) позволит получить документы, относящиеся как к пушистым собакам, так и к пушистым кошкам – по отдельности или вместе. Скобки при этом «раскрываются» по обычным арифметическим правилам вынесения за скобку общего множителя (для тех, кто не любит математику, поспешим сказать, что глубоких знаний этой дисциплины вам не потребуется).
А вот запрос пушистые И (собаки ИЛИ кошки) НЕ (собаки И кошки) выдаст документы, в которых написано про пушистых собак или пушистых кошек, но не содержится документов, в которых кошки и собаки будут упоминаться вместе.
Еще раз уточним – все поисковые машины сегодня работают на основе этих трех операторов, хотя нюансы их написания в разных поисковых машинах могут быть различны.
Каждая полноценная поисковая машина располагает собственным штатом роботов, так называемых, пауков – их еще называют краулерами, спайдерами (spiders, crawlers) . Это программы, которые перескакивают со страницы на страницу и сканируют находящиеся на них тексты, не вникая в их содержание. После этого они сбрасывают их на серверы своих хозяев и идут к следующим страницам. Паук определяет, куда ему пойти, по гиперссылке. Вот почему, если на страницу не ведет ни одна ссылка, паук на нее тоже не придет. Исключение составляет ситуация, когда владелец страницы вручную сообщит о ней, заполнив специальную форму на сайте поисковой машины.
На сервере поисковой машины текст разбивается на отдельные слова. Каждому из них присваиваются координаты, вычисляется его расположение относительно других слов на странице, и оно заносится в таблицу сервера вместе со ссылкой на тот адрес Интернета, где текст размещался в момент посещения пауком.
Сам по себе сервер поисковой машины представляет собой большую локальную сеть, состоящую из мощных компьютеров с огромным объемом дисковой памяти. Они разделены на подгруппы (так называемые кластеры), между которыми распределяется информация, собранная пауками.
Когда поисковая система получает запрос, она ищет ответ именно в своей таблице, а не в Интернете.
При этом важно понять, как именно паук решает, с какой частотой ему следует посещать ту или иную страницу. Выглядит этот алгоритм приблизительно следующим образом. Поработав со страницей, он возвращается на нее, ну, например, через две недели. Если изменений там не произошло, он планирует следующее посещение через более длительный период – скажем, через месяц. Если и тогда он не увидит изменений, то следующее посещение произойдет еще позже.
Вот почему нередко бывает ситуация, что поисковая машина по запросу результат выдает, а попытка перейти на страницу по ссылке, полученной в ответ на запрос, безрезультатна – ее может уже просто не быть на прежнем месте, но паук на нее давно не заходил, поэтому поисковая система об удалении страницы не знает. Весь комплекс процессов, описанных выше, называется индексацией.
Описание языков запросов различных поисковых машин
Умение искать информацию с помощью поисковых машин очень важно для создания и последующей раскрутки блога.
Благодаря поисковым машинам можно своевременно собирать информацию, появляющуюся в Интернете по теме, которой посвящен блог. Это, в свою очередь, дает возможность своевременно прокомментировать ситуацию и разместить на своем блоге готовый материал, предложив его вниманию читателей. Важно, что язык запросов поисковой машины работает не только при поиске во всем Интернете, но и при поиске по блогам и форумам, что значительно расширяет возможности блоггера. Несмотря на то, что принципы языка современных поисковых машин действительно одинаковы, синтаксис запросов у них различен. Некоторые операторы языка запросов универсальны, но большинство – нет.
Читать дальше
Конец ознакомительного отрывка
Купить книгу