В октябре раздел пополнился службой «Цитаты в новостях», где использовался синтаксический анализатор и модуль выделения как прямой речи в кавычках, так и косвенной, выраженной придаточными предложениями («такой-то отметил, что …») и вводными оборотами («по словам такого-то, …»). Особое внимание и в пресс-портретах, и в цитатах уделялось совершенствованию механизма, позволяющего различать однофамильцев, даже если в предложении с цитатой никакой наводящей информации кроме имени нет.
Проект Google News тоже продолжает развиваться, и дотком регулярно отсылает в патентное ведомство заявки с описаниями новых методов поиска и сортировки новостей. Впрочем, русифицированной версии Google News пока нет, и в перечне Top Stories, позволяющем жителям различных стран выбрать близкие с точки зрения их местоположения новости, Россия отсутствует. Так что этот сервис преждевременно расценивать в качестве даже вероятного противника «Яндекс.Новостям». Однако несомненное лидерство в данной информационной отрасли в Рунете удерживают отдельные ресурсы, а не подразделения многопрофильных доткомов.
Не менее перспективное направление — поиск в блогах — также был реализован и в Google, и в Яндексе. Действительно, игнорировать стремительно раздувающуюся блогосферу, которую поспешили окрестить новым СМИ, было бы недальновидно. И Яндекс со своим «Поиском по общественному мнению» в данном случае даже обошел Google как по качеству работы сервиса, так и по функциональности. Говоря о качестве поиска, следует отметить, что речь идет исключительно о Рунете, то есть о том, насколько хорошо системы ищут в русском сегменте LiveJournal и базе отечественных блог-хостингов. Возможно, к тому времени, когда Google окончательно созреет для экспансии в отечественное виртуальное пространство, то и поиск по русским блогам станет работать лучше, но пока Яндекс здесь вне конкуренции.
Причем Яндекс не стал запускать собственный блог-хостинг, как сделали Mail.ru и Рамблер (кстати, подобный проект есть и у Google — социальная сеть Orkut, только популярна она преимущественно в Южной Америке), и предпочел «подножный» корм, то бишь RSS-аггрегатор lenta.yandex.ru, каталог блогов и уже упоминавшийся поиск. И если другие доткомы «большой тройки», заинтересованные в социальных сервисах, переманивали блоггеров друг у друга, а также из более популярных проектов, то к услугам «русского Google» прибегали пользователи всех вышеперечисленных сервисов. Яндекс оказался фактически «монополистом», хотя и в достаточно экзотичной области. Правда, своим положением дотком практически не пользуется, в том плане, что рекламы в поиске по блогам пока нет.
Творение зарубежного доткома еще не вышло из бета-статуса, а его потенциальный конкурент в России, запустивший блоговый поисковик еще два года назад, в марте 2006-го перевел его в полноценный режим работы, а к октябрю уже представил вторую версию. К тому времени поисковик ежедневно анализировал 300 тысяч записей из более чем 1,3 миллиона блогов, а ежемесячная аудитория сервиса насчитывала около полумиллиона человек. Главные отличия новой версии от раннего варианта заключаются в обилии разнообразных рейтингов: самых популярных записей (среди определяющих положение в хит-параде критериев можно отметить количество ссылок на запись, число комментариев и т. д.), авторов и блог-хостингов. Отдельно выведены рейтинги самых обсуждаемых фильмов, сериалов, выставок и театров. Особняком стоит «тема дня», то есть наиболее актуальное событие, о котором в данный момент гудит блогосфера. В основе всего этого благолепия стоит все то же полюбившееся доткому fact extraction.
Голос рынка
Рамблер сейчас занимает первое место по медийной рекламе в Сети, увеличивает свою долю в контекстной рекламе, и компания Бегун очень хорошо в этом помогает. А с долей рынка отечественной рекламы у Рамблера никогда не было проблем.
Ирина Гофман,
генеральный директор Rambler Media Group
Юзер юзеру
Кстати
В Google News используется весьма оригинальная формула для расчета «авторитетности» новостного источника, которая учитывает такие параметры, как общее количество новостей, средняя длина материала, число цитат официальных органов, число сотрудников редакции новостного ресурса, а также количетсво стран, население которых имеет доступ к источнику
Читать дальше