На протяжении всей книги прослеживается основная мысль: суть процесса управления компанией на основе данных не сводится к данным как таковым или к обладанию самым современным набором инструментов по работе с большими данными. Самое важное в этом – корпоративная культура . Культура организации – доминирующий фактор, который устанавливает ожидания относительно того, насколько демократичным будет процесс работы с данными, как эти данные станут использоваться внутри организации, какие ресурсы, в том числе образовательные, станут инвестироваться в использование данных как стратегического актива компании. По этой причине в главе, посвященной корпоративной культуре, мы объединим все уроки, извлеченные на разных этапах цепочки аналитической ценности. В одной из последних глав обсудим роль двух относительно новых позиций в высшем руководстве компаний: CDO (Chief Data Officer, директор по управлению данными) или CAO (Chief Analytics Officer, директор по аналитике). Тем не менее рядовые сотрудники тоже в значительной мере влияют на формирование корпоративной культуры организации, поэтому на протяжении книги мы будем напрямую обращаться к специалистам по работе с данными, подчеркивая, что именно они способны сделать для повышения своего влияния на эффективность деятельности компании. В компании, для которой управление на основе данных не просто модная тенденция, сотрудники на всех уровнях уделяют большое внимание качеству данных и их оптимальному использованию при принятии взвешенных решений и для повышения конкурентного преимущества компании.
В книге используются следующие условные обозначения.
Выделение курсивом
Применяется для обозначения новых терминов, адресов сайтов (URL), адресов электронной почты, имен файлов и расширений файлов.
Моноширинный шрифт
Применяется для обозначения программных элементов, таких как переменные, названия функций, базы данных, типы данных, переменные окружения, утверждения и ключевые слова.
Моноширинный шрифт с полужирным выделением
Применяется для обозначения команд или другого текста, который должен внести пользователь.
Моноширинный шрифт с курсивом
Применяется для обозначения текста, который нужно заменить переменными пользователя или переменными, которые определяются контекстом.
Этот элемент обозначает совет или рекомендацию.
Этот элемент обозначает общую информацию.
Глава 1. Что значит «на основе данных»?
Без данных вы просто еще один человек с собственным мнением.
Уильям Эдвардс Деминг
[4] Уильям Эдвардс Деминг (William Edwards Deming, 1900–1993) – американский ученый, статистик и консультант по менеджменту. Создатель теории менеджмента, основанной на предложенной им же теории глубинных знаний. Прим. перев.
Управление на основе данных подразумевает формирование инструментов, способностей и, что самое важное, корпоративной культуры , которая опирается на данные. В этой главе мы рассмотрим, что отличает компанию с управлением на основе данных. Начнем с базовых требований к их сбору и доступности. Затем остановимся подробнее на весьма важном отличии – подготовке отчетов и получении оповещений в противовес процессу анализа. Существует много различных типов перспективного анализа, отличающихся по степени сложности. Мы уделим некоторое время изучению этих типов с точки зрения их «уровня аналитики» и «аналитической зрелости», а также обсудим основные признаки «аналитически зрелой» организации. Какой она должна быть?
Начнем с ответа на первый вопрос: что означает для компании управление на основе данных?
Давайте сразу озвучим несколько очевидных требований.
Требование № 1:в компании должен осуществляться сбор данных.
Несомненно, данные – ключевой компонент. При этом речь идет не о любых данных, а о правильных . Необходимо, чтобы набор данных соответствовал вопросу, который требуется решить. Помимо этого, данные должны быть своевременными, точными, чистыми, объективными, и, что важнее всего, они должны заслуживать доверия.
Это не так-то просто. Данные никогда не бывают настолько чистыми, как вам кажется. Они могут быть предвзятыми, что может повлиять на результат анализа, а очистка данных может стать трудоемким и дорогим процессом, требующим времени. Часто приходится слышать, что специалисты по работе с данными до 80 % времени тратят на их сбор, очистку и подготовку и только 20 % – на построение моделей, процесс анализа, визуализацию и формулировку заключений на основе этих данных [5] См., например: http://bit.ly/nyt-janitor и http://bit.ly/im-data-sci .
. Как показывает опыт, это вполне вероятно.
Читать дальше