Данные – это не феномен. Первичная функция данных – имитировать реальность. Правда, во многих компаниях прочно укоренилось одна весьма широко распространенная ошибочная идея о том, что объективны только количественные данные. Существует повсеместная вера в некие идеальные данные, которые в своей совокупности порождают совершенное понимание клиентов. Вопрос сводится лишь к определению верных данных. Говоря кратко, мы узнаем «правду», если соберем правильные данные в количественной форме, такую информацию, которую можно оформить в таблицу или регрессивный анализ. Сколько? Что? Где? Кто? Когда? Качественный же анализ – наблюдения и представления, которые не вписываются в таблицы с целью разложения на мельчайшие частицы, – не настолько надежен, как количественный, поскольку в его основе не заложена одна-единственная «правда». Количественные данные, как думается многим, все-таки лучше.
Но это совсем не так. Не высший разум дарует данные человечеству. Все они – дело рук человеческих. В один прекрасный момент кто-то решил, какие данные собирать, как их организовывать, как представлять, какие делать из них выводы, – и все это повлекло за собой ложную негибкость процесса. Данные имеют такой же план действий, как и создавший их человек, намеренно или ненамеренно. Столько же времени, сколько высшее руководство анализирует данные, ему следует определять, какие данные генерировать в первую очередь. О каких аспектах феномена мы должны собирать данные, а какие аспекты – проигнорировать? [46]
Весной 2014 года журнал Science опубликовал результаты академического исследования сервиса Google Flu Trends [47] – статистики Google распространения гриппа, предназначенной для прогнозирования развития болезни раньше традиционных отчетов Центров по контролю и профилактике заболеваний. Сервис Google Flu Trends (GFT) основывался на алгоритме, сопоставлявшем пятьдесят миллионов поисковых терминов с 1152 результатами обработки данных. По сути, Google надеялся прогнозировать вспышки эпидемии гриппа посредством перекрестных ссылок между поисковыми запросами (симптомами, поставщиками медицинских услуг, лекарственными препаратами) и соответствующими объективными данными. Авторы статьи, ученые из Северовосточного, Гарвардского и Хьюстонского университетов, пришли к выводу, что Google Flu Trends значительно переоценил число случаев заболевания гриппом в Соединенных Штатах более чем за два года. В упомянутой статье «Сказание о Google Flu: ловушки анализа больших данных» резюмируется, что ошибки (по крайней мере частично) объяснялись решениями инженеров касательно того, что следует включать в свои модели. Эти ошибки ученые окрестили «динамика алгоритмов» и «надменность больших данных».
Google двигали благородные цели: возможно, заблаговременное предупреждение о появлении гриппа могло бы предотвратить распространение заболевания и спасать жизни раньше, чем традиционные методы. Но, как убедились инженеры Google, необходимо правильно выбрать, что анализировать. К сожалению, точная связь между конкретными поисковыми запросами и алгоритмом Google оказалась куда сложнее и подвержена влиянию множества переменчивых человеческих факторов (может быть, какой-нибудь ипохондрик месяц за месяцем вбивает одни и те же запросы; может быть, инженеры Google время от времени меняли метод сбора данных, и так далее), а поэтому не могла служить надежным инструментом прогнозирования.
Поскольку запросы в Google создаются на компьютерах и могут храниться и анализироваться с помощью многих новых способов, они производят впечатление весомой совокупности данных, хоть таковой и не являются. Некое явление – в данном случае поисковые запросы – не заслуживает статуса данных только лишь потому, что может быть подсчитано и проанализировано. Подсказывает ли оно направление движения? Да. Будет ли оно объективной реальностью? Нет.
Пассивные данные нуждаются в активном управлении
Обречены ли компании отклоняться от курса работ, когда вмешиваются стандартные операционные системы, наблюдая, как из рук ускользает с таким трудом завоеванное конкурентное преимущество? Нет, если высшее руководство защитит себя и свою компанию от напасти трех заблуждений о данных касательно инноваций. Но это совершенно точно и безоговорочно случится, если работа клиентов не будет выведена на первый план и не удостоится первостепенного внимания. Пассивные данные нуждаются в активном управлении. Об этой проблеме мы поговорим в следующей главе.
Читать дальше
Конец ознакомительного отрывка
Купить книгу