Скотт Хассан получил работу ассистента после встречи с Сергеем на игре по алтимат фрисби в Стэнфорде. Он был талантливым программистом и столь же одаренным по части пранков. Хассан в дальнейшем стал пионером робототехники и сегодня разрабатывает робота, в котором на катящемся теле располагается голова в виде телевизора с плоским экраном. Вместо того чтобы разговаривать с роботом, ты можешь общаться по видеочату с его владельцем в режиме реального времени, прямо как по FaceTime. Возможно, в будущем вместо того, чтобы идти в школу, можно будет просто отправить своего робота! Инновация Хассана зовется The Beam [4].
Глава 3. Давно забытый кошмар: поиск до изобретения Google
Сегодня, если ты наберешь «В чем значимость Уильяма Шекспира?» В Google, ты получишь около 16 700 000 результатов всего за 0,63 секунды. И все эти результаты упорядочены по значимости. Не так уж и сложно, не правда ли?
Не правда!
Приготовься. В этой поездке на машине времени будет трясти.
До Google люди жили в мире, где результаты поиска были бессмысленными. Вот ты входишь в поисковую систему. Вводишь какое-нибудь простое ключевое слово, например, «Шекспир», так как поисковая система не может обработать разговорный текст.
Возможно, ты хотел узнать, «где родился Шекспир?». Но все, что ты смог напечатать, – фамилию Уильяма.
Разговорный текст – это фраза или предложение, которое звучит так же, как бы ты его произнес. Это неформальное и естественное выражение твоих мыслей или вопросов.
Ты нажимаешь «ввод» и ждешь, пока страницы за страницами результатов загружаются без какого-либо порядка. Фактически то, что ты ищешь, может находится в самом последнем результате поиска – или где-то в середине. Мало того, спустя целый час поиска ты скорее всего с гневом осознаешь, что нужно было ввести другое ключевое слово (и повторить все заново). Ты пытаешься закричать, но сил нет даже на шепот.
В чем проблема? Поиск в Интернете основывался на ключевых словах. Поэтому, если ты искал информацию о лошадях, поиск выдавал тебе каждый сайт, на котором упоминалось слово «лошадь». И тебе приходилось сидеть и загружать каждый результат в надежде наткнуться на нужную информацию.
Это было похоже на поход в библиотеку с просьбой рассказать о лошадях. Библиотекарь берет каждую книгу, журнал и брошюру, в которых есть по крайней мере одно слово «лошадь». Затем он сбрасывает их в беспорядочно перемешанные кучи, в которых тебе предстоит рыться, пока ты наконец не найдешь то, что искал. Таким был поиск до изобретения Google. Не многим хватает мужества вспоминать о тех временах. Нам был необходим способ как-то организовывать эту информацию.
Математический мозг Сергея Брина был идеальным котелком для варки идей алгоритма, который бы анализировал ссылки и ранжировал веб-страницы. Это было похоже на фирменный рецепт блюда. Ларри и Сергей назвали этот особый соус PageRank.
Слово PageRank звучит знакомо? Ты угадал! Ларри и Сергей назвали его в честь Ларри, используя его фамилию, Пейдж.
Представь, что ты опубликовал веб-страницу, на которой ты восторгаешься фильмом «Звездные войны: Пробуждение силы» (что, кстати говоря, по праву). Как алгоритм сможет отличить твой сайт от, например, StarWars.com? Какой сайт уместнее? Какой авторитетнее? Какой лучше освещает тему? Ответ кроется в обратных ссылках. Со столь же огромной, как твоя любовь к кинокартине, вероятностью на твой фан-сайт все-таки ссылается не так много людей, как на StarWars.com. В конце концов, StarWars.com может похвастаться сенсациями, играми, видео, закулисными кадрами, анонсами и т. д. Между тем на твоем фан-сайте может быть размещен лишь один пост о том, какое впечатление на тебя произвел этот фильм. PageRank может определить, какой сайт важнее, исходя из количества входящих ссылок. А теперь настоящий вынос мозга. Важно не то, сколько ссылок ведут на твой сайт, а то, насколько важны сайты со ссылками на твой… что определяется количеством входящих ссылок на эти сайты. Затем, когда определенной странице присвоен рейтинг PageRank, Сергей также нашел способ проанализировать такие факторы, как ключевые слова, капитализация, размер шрифта, расстояние между словами на странице и многое другое. Эти ориентиры называются «сигналами». Анализ всех этих сигналов помог Сергею разработать алгоритм, который вырисовал довольно четкую картину релевантности веб-страницы.
Как сказал Ларри интервьюеру: «Мы преобразуем всю сеть в большое уравнение с несколькими сотнями миллионов переменных, которыми выступает PageRank всех веб-страниц; и миллиардами свободных членов, в качестве которых выступают ссылки». Другими словами, сеть была просто гигантской, сложной математической задачей. Той, которую решили Ларри и Сергей.
Читать дальше
Конец ознакомительного отрывка
Купить книгу