Рассмотрим языки запросов трех основных поисковых машин, работающих с русскоязычными текстами, более подробно.
Лучшая, на наш взгляд, работа по изучению операторов поисковой машины Яндекс, выполнена специалистом из Санкт-Петербурга Денисом Фурсовым. На его блоге в статье «Хозяйке на заметку. Поиск через Яндекс для специалистов» [19]постоянно публикуются результаты исследований, отслеживаются, оцениваются и обсуждаются изменения в работе операторов поисковой машины Яндекс (рис. 22).
Рис. 22.Внешний вид страницы «Хозяйке на заметку. Поиск через Яндекс для специалистов»
Ниже речь пойдет о том, как с помощью специальных фильтров, основанных на булевой алгебре, создавать запросы, максимально соответствующие потребностям специалиста, который ищет информацию в Интернете. При изучении этого вопроса не следует забывать, что компьютер очень исполнителен, но лишен способности думать, поэтому следует составлять запрос исходя из того, что он будет обработан буквально, а не с учетом того, что же на самом деле имел в виду пользователь, создавая обращение к поисковой машине. Лучше всех эту мысль проиллюстрировал летом 2005 года Алексей Амилющенко, главный аналитик отдела маркетинга Яндекса, на таком примере.
∆Вот еще одна история с семинаров, но ее приходится рассказывать не очень часто. Иногда случается, что заходит разговор о том, что хорошо бы поисковым системам учитывать не только слова, которые есть в индексируемых документах, но и смысл написанного. В ответ говорю, что знаю фразу, про которую и человек-то не скажет, о чем это. Вот она: «Эти типы стали есть в прокатном цехе». И что тут написано? Я вижу минимум три смысла. Не подглядывайте в ответ сразу (он ниже). Попробуйте сначала самостоятельно… Обычно, когда зал видит это предложение, сначала становится тихо (видно, что думают), потом начинаются смешки (до кого-то дошло). Потом хихикают уже все. Но к делу, что же здесь все-таки написано?
1. Скучный такой вариант: «Эти типы стали (варианты металлопроката) есть (имеются в наличии) в прокатном цехе».
2. Более творческий, с элементами мизантропии: «Эти типы (неприятные автору личности) стали (начали) есть (принимать пищу) в прокатном цехе».
3. Несколько надуманный, конечно, и тем не менее: «Эти типы стали (варианты металлопроката) есть (надлежит принимать в пищу) в прокатном цехе».
Вот видите, даже протеиновые мозги не справляются, а вы хотите, чтобы силиконовые умели [20].
Текст запроса мы будем помещать в квадратные скобки для того, чтобы визуально его выделить. Если уважаемый читатель решит ввести приведенные ниже запросы в поисковую строку поисковой машины, чтобы проверить их работоспособность на практике, то эти квадратные скобки вводить не надо.
Итак, перейдем непосредственно к операторам запросов Яндекса.
Логическое «И».Яндекс поддерживает три разных оператора, относящихся к логическому «И», что делает его самым гибким из всех поисковиков, работающих с русским языком. Столь развитая, практически уникальная, система операторов поисковых запросов дает возможность предельно точно настроить запрос и сформировать такой фильтр для данных в Интернете, который максимально качественно выбирает нужную информацию и отсекает ненужную.
Пробел.Слова, разделенные пробелом, должны быть недалеко друг от друга.
Специалисты поясняют, что термин «недалеко» фиксированной величиной не является и меняется в зависимости от того, с какими словами оператор «пробел» в каждом конкретном случае используется.
Если слова часто употребляемые, то «недалеко» – значит на расстоянии нескольких слов друг от друга. Если слова редко встречаются в обиходе, то даже их нахождение в разных концах документа будет восприниматься как «недалеко».
При этом, несмотря на то, что логическое «И» в общем виде булевой алгебры подразумевает присутствие всех упомянутых слов, Яндекс тем не менее действительно выдает сначала те документы, в которых есть все ключевые слова, упомянутые в запросе. Но после этого он дает и те, в которых содержатся не все ключевые слова.
На наш взгляд, сказанного об операторе «пробел» достаточно, для того чтобы решать основные проблемы, связанные с поиском в Интернете. Но на самом деле решение вопроса о том, что такое «не очень далеко» и «очень далеко», с точки зрения Яндекса, вопрос не простой, и для полного его понимания мы вновь рекомендуем держать в поле зрения статью Дениса Фурсова.
Читать дальше
Конец ознакомительного отрывка
Купить книгу