Если вы автоматизируете процесс сбора материалов для блога с соблюдением этих правил, у вас будут хорошие результаты при ощутимой экономии времени.
Кроме того, вам придется потратить время на изучение языка запросов поисковых машин.
Почему? Дело в том, что, как ни парадоксально это звучит, поиск информации – не главное, для чего нужен язык запросов поисковых машин.
Можно найти информацию, потратив значительно меньше времени, чем требуется на изучение языка запросов поисковиков.
По-настоящему вы оцените важность этого инструмента, когда станете проводить мониторинг Интернета в поисках новой информации. При хорошо составленном поисковом запросе вы будете с минимальными затратами времени видеть только то новое, что появилось по интересующему вас вопросу и не станете отвлекаться на просмотр информационного мусора. Это правило в равной степени применимо практически к любому виду деятельности, который предусматривает просмотр Интернета, и к блоггингу в том числе.
Принципы организации и поиска информации в Интернете
Два основных способа поиска информации
Существуют два основных способа поиска информации в Интернете – с помощью каталогов (их еще называют директориями) и с помощью поисковых машин.
Директории обеспечивают контекстный поиск, тогда как поисковые машины не обеспечивают контекста, однако позволяют находить конкретные слова или фразы. Их можно сравнить с оглавлением книги, а поисковые машины – с предметным указателем.
Крупные современные поисковые системы обычно объединяют в себе как поисковую машину, так и директории. Это хорошо видно на примере первой страницы Яндекса, где ниже поисковой строки размещается список директорий, которые позволяют пользователю уточнять запрос по мере продвижения вглубь каждой из них.
Чтобы завершить разговор о каталогах, приведем пример «цепочки», по которой осуществляется поиск в каталоге Яндекса: Бизнес – Реклама – Реклама в Интернете.
Ввиду того, что принцип организации директорий понятен каждому, кто пользовался библиотечным каталогом, мы не будем подробно останавливаться на технике работы с ними, а уделим дополнительное внимание работе с поисковыми машинами.
Все современные поисковые машины работают по одному и тому же алгоритму и основаны на одних и тех же принципах. Различия между ними возникают только на уровне технической реализации этих принципов в работе.
Чтобы понять принцип работы поисковой машины, давайте попробуем разделить вопрос на две части: на чем основан поиск и как он реализуется.
Все поисковые машины базируются лишь на трех основных операторах, лежащих в основе булевой алгебры (еще ее называют булевой логикой, или Boolean ). Это логические операторы «И», «ИЛИ» и НЕ». Работают они следующим образом.
1. Логическое «И».Если между двумя словами в запросе стоит оператор «И», то в результатах запроса будут только те документы, в которых содержатся оба слова. Так, например, по запросу собака И кошка будет найден документ, в котором есть предложение «Собака гналась за кошкой», но не будет документа, состоящего из текста «кошка отдыхала» или «корм для собак».
2. Логическое «ИЛИ».Если между словами стоит оператор «ИЛИ», то вы получите документы, в которых содержится хотя бы одно из этих слов. Если нет специальных ограничительных оговорок, то документы, где оба эти слова присутствуют, также будут найдены.
Например, по запросу собака ИЛИ кошка будут найдены документы, исключенные в прошлом запросе и содержащие тексты «кошка отдыхала» или «корм для собак», а также документ, в котором есть предложение «Собака гналась за кошкой».
3. Логическое «НЕ».Если два предыдущих оператора описывали те слова, которые вы хотите включить в запрос, то оператор «НЕ», наоборот, слова из запроса исключает. Те, кто впервые сталкивается с операторами запросов, нередко высказывают удивление и говорят: «Так не проще ли не включать ненужное слово в запрос? Зачем вводить дополнительный оператор?» Увы, не проще.
На самом деле, чтобы понять значение логического оператора «НЕ», имеет смысл вспомнить, что наш запрос не создает в Интернете ничего нового. Мы лишь выуживаем то, что нам надо, из имеющегося огромного, но все же конечного массива. При этом мы должны отсечь информационный мусор. Вот и отсекаем его с помощью оператора «НЕ». К сожалению, не мы решаем, будет мусор в выдаче или нет. Так, например, по запросу информации о коньке крыши неизбежно будет появляться информационный мусор в виде документов о Коньке-Горбунке, фигурном катании, хоккее, лошадях и т. п. Без логического «НЕ» тут не обойтись никак.
Читать дальше
Конец ознакомительного отрывка
Купить книгу