Появление книги о моделях может показаться неуместным в эпоху больших данных, которые сегодня характеризуются беспрецедентной размерностью и степенью детализации. Данные о покупках клиентов, раньше поступавшие в виде ежемесячных совокупных показателей, распечатанных на бумаге, теперь представляют непрерывный поток геопространственных, временн ы х и потребительских тегов. Данные об академической успеваемости студентов теперь включают баллы за каждое домашнее задание, работу, тест и экзамен, в отличие от итоговых оценок в конце семестра. В прошлом фермер мог упомянуть о засушливой почве на ежемесячном собрании ассоциации фермеров. Теперь тракторы передают мгновенные данные о состоянии почвы и уровне влажности в расчете на каждый квадратный метр. Инвестиционные компании отслеживают десятки показателей и тенденций по тысячам акций и используют инструменты обработки текстов на естественных языках для синтаксического анализа документов. Врачи могут страница за страницей получать данные из истории болезни пациентов, в том числе важные генетические маркеры.
Всего каких-то двадцать пять лет назад большинство из нас имели доступ к знаниям, размещавшимся на нескольких книжных полках. Возможно, у вас на работе была небольшая библиотека справочной литературы или коллекция энциклопедий и несколько десятков справочников дома. Хотя ученые и исследователи из правительственного и частного сектора имели доступ к большим библиотечным фондам, им все равно приходилось физически их посещать, чтобы получить необходимые материалы. Даже на рубеже нового тысячелетия еще можно было увидеть, как ученые курсируют туда-сюда между библиотечными картотеками, коллекциями микрофильмов, книжными стеллажами и специальными хранилищами в поисках информации.
Сегодня все по-другому. Контент, веками отображаемый исключительно на бумаге, теперь передается крохотными блоками по воздуху, так же как и информация о событиях, происходящих здесь и сейчас. Новости, приходившие к нам один раз в день в виде газеты, теперь поступают в виде непрерывного цифрового потока на наши персональные устройства. При помощи нескольких движений пальцев или мышки можно узнать курс акций и результаты спортивных соревнований, а также новости о политических и культурных событиях.
Но какими бы впечатляющими ни были данные, это не панацея. Да, теперь мы знаем, что уже произошло или происходит в настоящий момент, но из-за сложности современного мира не всегда способны понять, почему. Выводы, полученные эмпирическим путем, могут вводить в заблуждение. Данные о сдельной оплате труда часто показывают, что чем больше людям платят за единицу продукции, тем меньше они производят. Модель, в которой оплата зависит от условий труда, может объяснить этот парадокс. Если условия плохие и затрудняют выпуск продукции, оплата за единицу продукции может быть высокой. Если условия хорошие, оплата может быть низкой. Таким образом, более высокая оплата не приводит к снижению производительности, скорее наоборот, тяжелые условия труда требуют более высокой оплаты за единицу продукции [4] См. статью Паарша и Ширера (Paarsch and Shearer 1999), в которой анализируется лесная промышленность. Исходные данные о посадке деревьев указывают на наличие отрицательной корреляции между сдельной оплатой труда и количеством высаженных деревьев – другими словами, чем больше человеку платят за посадку дерева, тем меньше деревьев он высаживает. Этот вывод противоречит стандартной экономической логике. Если вы платите работникам больше за каждое посаженное дерево, они должны работать усерднее. Согласно модели Паарша и Ширера, лесозаготовительные компании платят работникам сдельную ставку за каждое дерево так, что почасовая рыночная ставка заработной платы составляет 20 долларов в час. На основании этого допущения можно вывести следующую формулу расчета оплаты за одно дерево: 20 долларов = количество деревьев, высаженных за час × оплата за дерево. Если человек посадит десять деревьев за час, то оплата за одно дерево составит 2 доллара, а если двадцать деревьев за час, то 1 доллар. Таким образом, модель указывает на наличие отрицательной корреляции между сдельной оплатой труда и количеством высаженных деревьев. Кроме того, она также говорит о том, что произведение сдельной ставки на количество деревьев равно постоянной величине.
.
Читать дальше