Разработчики Google сообщают, что количество сигналов, используемых для расчета релевантности, выросло до 200, а гуру маркетинга в области поисковых систем Дэнни Салливан считает, что может существовать до 50 000 подсигналов. Каждый из этих сигналов измеряется и вычисляется с помощью комплекса программ и алгоритмов, каждый из которых имеет свою собственную функцию приспособленности, которую он стремится оптимизировать. Результатом этих функций является оценка, которую вы можете рассматривать как цель главной функции приспособленности, предназначенной для оптимизации релевантности.
У некоторых из этих функций, таких как PageRank, есть имена, им даже посвящены научно-исследовательские материалы, объясняющие их значение. Другие являются коммерческой тайной, известной только командам инженеров, которые создают их и управляют ими. Многие из них представляют собой коренные улучшения в искусстве поиска. К примеру, дополнение, которому корпорация Google дала название «Граф знаний», позволило связать известные ассоциации между структурами различного вида, такими как даты, люди, места и организации, и различать, например, что человек может «родиться» тогда-то, «работать» там-то, являться «дочерью» того-то или «матерью» такого-то, «проживать» там-то и т. д. Эта работа была основана на базе данных, созданной компанией Metaweb, которую в 2010 году приобрела корпорация Google. Когда Metaweb представила свой проект в марте 2007 года, я с восторгом написал: «Они создают новые синапсы для глобального мозга».
Другие компоненты для всеобъемлющего алгоритма поиска были созданы в ответ на изменяющиеся условия в этом глобальном мозге, коллективное выражение мнений миллиардов взаимосвязанных людей. Например, корпорация Google сначала изо всех сил пыталась адаптироваться к потоку информации, поступающий из Twitter в режиме реального времени; алгоритмы также должны были быть откорректированы, поскольку смартфоны сделали видео и изображения в Интернете такими же доступными, как текст; поскольку все больше и больше поисковых запросов поступало с мобильных устройств, точное местоположение которых было известно, локальные результаты стали гораздо более важными; с появлением голосового ввода стиль речи поисковых запросов стал более разговорным.
Google постоянно пробует новые идеи, которые могут обеспечить лучшие поисковые результаты. В интервью 2009 года вице-президент Google по поисковым запросам Уди Манбер отметил, что в прошлом году они провели более 5000 экспериментов и «возможно, по 10 экспериментов для каждого успешного запуска». Корпорация Google внесла изменения в алгоритм, определила новый коэффициент ранжирования, от 100 до 120 раз в квартал, или в среднем один раз в день. С тех пор эта скорость только увеличивалась. В области рекламы проводилось еще больше экспериментов.
Как они узнают, что изменение улучшает релевантность? Один из способов оценить изменение – это реакция пользователей в краткосрочном плане: на какую ссылку они нажимают? Другим является реакция пользователей в долгосрочном плане: обратились ли они к Google еще раз? Еще один способ – беседовать с фактическими пользователями напрямую и спрашивать их, что они думают.
В Google также есть группа специалистов по оценке, которые проверяют результаты стандартизованного перечня общих вопросов, который ведется автоматически на постоянной основе. На заре истории Google как составление списка вопросов, так и его анализ выполнялись самими инженерами. К 2003 или 2004 году корпорация Google создала отдельную команду, определяющую качество поиска, которая стала этим заниматься. В это подразделение входят не только инженеры, занимающиеся поисковыми запросами, но и статистически значимая группа внешних пользователей, которые работают по принципу шахматного автомата «Механический турок», оценивая, «нравятся» им или «не нравятся» самые различные результаты поиска. В 2015 году корпорация Google даже опубликовала руководство, которое использует в своей работе команда, определяющая качество поиска.
Однако важно помнить, что, когда оценщики находят проблему, Google не изменяет рейтинг сайта в большую или в меньшую сторону вручную. Когда они обнаруживают аномалию – результат, созданный алгоритмом, не соответствует ожиданиям участвующих в тестировании людей, – они спрашивают себя: «Какие дополнительные факторы или какую иную оценку качества мы можем добавить к алгоритму, чтобы он выдавал тот результат, который, как мы считаем, ищут пользователи?»
Читать дальше