Почему качественная выдача нужна поисковым системам? Потому что чем лучше сайт, тем выгодней на нем продавать контекстную рекламу.
Постепенно поисковые системы стали понимать, что их пути и пути seo-оптимизаторов начали расходиться.
Естественно, Яндекс и Google это не понравилось, и они создали собственные меры борьбы с такими оптимизаторами.
Именно таким образом появился на свет термин «санкции». Поисковые системы начали накладывать свои санкции на те сайты, которые, по их мнению, не соответствуют результатам качественной выдачи.
Наверняка, вам интересно узнать, в каких именно случаях накладываются санкции. Но перед тем как поближе вас с ними познакомить, вам нужно рассказать общие принципы работы поисковых систем.
Представьте себе, что перед вами лежат 4,5 миллиарда документов, имеющих абсолютно разное содержание.
И вам необходимо их все перечитать, рассортировать и пустить дальше в работу.
Вам уже страшно?
Но именно такую задачу решают поисковые системы каждый день. Однако у них, в отличие от вас, есть различные «помощники», а именно:
• поисковый робот;
• поисковый алгоритм.
Что представляет собой поисковый робот?
Поисковый робот – это не робот в прямом смысле слова. Это определенная программа, которая проходит все сайты в Интернете и скачивает информацию из них. Но поисковый робот не только скачивает все текста, он еще и переносит их в то место, где они будут в дальнейшем храниться.
Как работает поисковый робот?
Допустим, программа идет по известному ей сайту и вдруг обнаруживает на нем новую ссылку. Она переходит по ссылке и скачивает информацию с нового сайта, на котором вновь обнаруживает очередную ссылку.
Передвигаясь по внешним и внутренним ссылкам, поисковый робот «прочесывает» весь Интернет и собирает абсолютно всю информацию.
А дальше к работе приступает второй «помощник» Яндекс и Google – поисковый алгоритм.
Что представляет собой поисковый алгоритм?
Поисковый алгоритм – способ разобрать весь ворох информации, который собрал поисковый робот.
Поисковый алгоритм относится к аналитическому центру Яндекс и Google. Он сортирует информацию по запросам, выискивает «говнотексты» и избавляется от них.
Вы должны понимать, что алгоритм поисковой системы – крайне закрытая вещь. И, конечно, ни Яндекс, ни Google добровольно не расскажут, как он работает.
Если же утечка информации все же произойдет, то этим сразу же попытаются воспользоваться огромное количество недобросовестных людей. А такое вмешательство в свою очередь может привести к изменениям результатов поисковой выдачи, неконтролируемым со стороны поисковых систем.
Как отметил в одном из своих интервью Александр Садовский, руководитель поисковых систем Яндекс, «когда веб-мастера расскажут нам все свои способы обмана поисковой системы, тогда и мы расскажем им все свои секреты».
Как работает поисковый алгоритм?
Есть такое понятие как «прямой поиск». Это когда вы берете в руки исписанный лист бумаги и начинаете вычитывать его в поиске какой-нибудь одной необходимой вам фразы.
Если бы поисковый алгоритм работал точно так же, то вы получали бы ответ на свой запрос примерно через несколько дней. Ведь системе необходимо было бы дополнительное время для того, чтобы «прочесать» огромный объем информации.
Но к большому счастью всех интернет-пользователей поисковый алгоритм работает по принципу инвертированного индекса.
Что такое инвертированный индекс?
Инвертированный индекс (inverted index) – это структура данных, в которой для каждого слова в соответствующем списке перечислены все документы, в которых оно встретилось.
Проще говоря, инвертированный индекс позволяет находить ответы на запрос только по оглавлению сайта.
Что происходит дальше с информацией после того, как ее переработает поисковый алгоритм?
А после вся собранная информация оказывается в «хранилищах» Яндекс и Google, доступ к ней получают все пользователи Всемирной сети Интернет.
Что такое апдейт?
Апдейт (update) – определенные изменения информации на конечной точке.
Для примера, ваш запрос «цветные валенки» находился на 112-м месте. Однако Яндекс получил от поискового робота новую информацию, обработал ее и через некоторый промежуток времени совместно с другими запросами «выкинул» ваш запрос наверх.
Читать дальше
Конец ознакомительного отрывка
Купить книгу