Прежде чем вы обеспокоитесь защитой персональных данных, стоит отметить, что Google Flu Trends невозможно использовать для идентификации пользователей, так как он оперирует анонимными агрегатированными данными о частоте конкретных поисковых запросов в течение недели. Сервис использует миллионы поисковых запросов, вводимых в Гугл, а зависимости, вытекающие из полученных данных, имеют смысл только благодаря большому количеству пользователей Гугла.
Представьте себе мощь этой технологии. Сезонные эпидемии гриппа – серьезная проблема для здравоохранения, так как грипп ежегодно становится причиной десятков миллионов случаев респираторных заболеваний и от 250 до 500 тысяч смертей по всему миру. В дополнение к сезонной эпидемии может появиться новый штамм вируса гриппа, к которому еще не выработался иммунитет, передающийся от человека к человеку, что может привести к пандемии с миллионами смертей. Страх перед «свиным гриппом» в 2009 году покажется мелочью по сравнению с реальной эпидемией, которая из-за неподготовленной иммунной системы быстро распространится по миру и убьет на своем пути миллионы (как это было, например, в пандемию гриппа в 1918 года, когда, по разным оценкам, умерло от 50 до 100 миллионов человек).
Раннее выявление заболевания, если за ним следует быстрая реакция, может уменьшить воздействие как сезонного, так и пандемического гриппа. Очевидно, что одним из методов раннего выявления гриппа является отслеживание поисковых запросов, связанных со здоровьем, – что и сделал Google.org, к которому, к счастью, имеют доступ миллионы человек в реальном времени. Зачем тратить время на оценки на основе обобщенных поисковых запросов? Традиционная система отслеживания гриппа сохраняет свое значение, но большинство организаций в основном уделяет внимание отдельным странам или регионам и обновляет данные раз в неделю или реже. Способность Google Flu Trends отслеживать тенденции почти в реальном времени делает его крайне мощным инструментом. Рекомендую посмотреть видео на сайте, показывающее скорость, с которой Гугл предсказал эпидемию гриппа в Среднеатлантическом регионе США зимой 2008 года. Данные Центра по контролю заболеваний появились на несколько недель позже Гугла. Недели, требующиеся, чтобы выявить вспышку гриппа, для тех, кто не знал о надвигающейся катастрофе, могут означать разницу между жизнью и смертью.
В Интернете существует огромное количество информации, связанной со здоровьем; большая часть ее представляет собой графические файлы на медицинскую тему. Эти файлы вообще не могут помочь в улучшении здоровья или спасении жизни, так как они не систематизированы. Более того, не существует стандартных медицинских терминов. Например, вы скажете «сломал ногу», а я – «перелом ноги». Современные технологии поиска будут интерпретировать наши слова как разные запросы.
Описанное явление имеет еще одну положительную сторону: такие технологии, как у Гугла, способные систематизировать массив данных с известными выходами, могут и должны быть использованы в медицине. Надеюсь, с помощью новых приложений, которые сделают геномику и протеомику пригодными для активного изучения, станет возможным такое накопление данных, которые мы сможем затем использовать в изучении индивидуальных систем. Да, в этом случае к данным вашей «системы» будет иметь доступ кто угодно – их сможет использовать любой житель Земли. Прежде чем вы ввяжетесь в спор о персональных данных и попытаетесь закидать меня тухлыми помидорами, позвольте объясниться. Речь не о том, чтобы открыть всему миру ваше имя и диагнозы, а о том, чтобы сделать накопленные данные о здоровье доступными ученым, которые смогут их изучать и делать открытия. Если выписать чек или оплатить счет в Интернете с помощью кредитной карты для меня не проблема, так почему стоит бояться отправить в Гугл данные о моем уровне холестерина? Это тоже не проблема. Если это поможет лучше понимать, как контролировать уровень холестерина и добиваться поставленных целей в области здоровья, то почему бы и нет? Я бы с удовольствием предоставил мои анонимизированные геномные и протеомные данные тому, кто сможет изучить эту информацию и рассказать мне то, чего я еще не знаю. С медициной связана значимая доля интернет-трафика. Но данные не структурированы удобным для работы образом. Мы ежедневно генерируем огромный объем данных, но ничего не делаем для того, чтобы получить от них какую-нибудь пользу, и, возможно, спасти жизни.
Читать дальше
Конец ознакомительного отрывка
Купить книгу