С четырьмя объектами число комбинаций, в которых не выбирается а) ни одного объекта, б) выбирается один, в) два сразу, г) три сразу и д) четыре сразу, равны, соответственно, 1, 4, 6, 4, 1, что представляет собой четвертую строчку в треугольнике Паскаля. Подсчет можно продолжить для все большего числа объектов, и окажется, что треугольник Паскаля — это справочная таблица для числа комбинаций. Если у нас есть n предметов и нас интересует, сколько комбинаций можно составить, беря из них m штук, за ответом надо обратиться к m -му элементу в n -й строке в треугольнике Паскаля. (Замечание: примем соглашение, что самой левой 1 в каждой строке приписано нулевое положение в строке.) Например, каково число способов взять три фрукта из имеющихся семи? Таких способов 35, потому что третий элемент в седьмой строке равен 35.
Давайте теперь перейдем к комбинированию математических объектов. Рассмотрим выражение x + у. Что представляет собой ( x + у ) 2? Это то же самое, что ( x + у )( x + у ). Чтобы разложить это выражение, умножим каждый член в первой скобке на каждый член во второй. Таким образом, получится xx + xy + yх + yy, или х 2 + 2ху + у 2. Дальнейшие вычисления делают структуру более ясной. Коэффициенты перед отдельными членами — это строки из треугольника Паскаля:
(x + у) 2= х 2+ 2ху + у 2,
(x + у) 3= х 3+ 3х 2у + 3ху 2+ y 3,
(x + y) 4= х 4+ 4х 3y + 6х 2у 2+ 4ху 3+ у 4.
В начале XVIII столетия математик Абрахам де Муавр (1667–1754) — француз и гугенот, нашедший убежище в Лондоне, — первым понял, что коэффициенты в этих равенствах все лучше ложатся на кривую-колокол по мере, того как ( x + у ) все большее число раз умножается само на себя. Он не назвал то, что получилось, ни колоколообразной кривой, ни кривой ошибок, ни нормальным распределением, ни даже гауссовым распределением — все эти имена были даны ей позже. Данная кривая впервые появилась в математической литературе в написанной в 1718 году книге Муавра об играх — «Теория случайностей» («The Doctrine of Chances»). To был первый учебник по теории вероятностей, а заодно и пример того, как азартные игры способствовали прогрессу научного знания.
* * *
Я говорил о колоколообразной кривой так, как если бы это была одна кривая; на самом же деле это семейство кривых. Все они выглядят похожими на колокол, но одни уже, а другие шире.
Вот объяснение, почему ширина бывает различной. Если бы Галилей, скажем, в своих астрономических измерениях пользовался телескопом XXI века, то ошибка была бы меньше, чем при использовании телескопа XVI столетия. Современный инструмент дал бы гораздо более узкую колоколообразную кривую, чем первый телескоп. Ошибки были бы намного меньше, но все равно были бы распределены нормально.
Колоколообразные кривые с различными отклонениями
Помимо среднего значения, колоколообразная кривая характеризуется еще шириной, называемой отклонением. Если известны среднее и отклонение, то полностью известна и форма кривой. Это исключительное удобство связано с тем фактом, что нормальную кривую можно описать, используя всего два параметра. Ну или, быть может, это даже слишком удобно. Те, кто имеет дело со статистикой, нередко принимают желаемое за действительное, стремясь обнаружить колоколообразную кривую во всех своих результатах. Билл Робинсон — экономист, возглавляющий отдел судебной бухгалтерии в KPMG [66] KPMG — одна из крупнейших аудиторских компаний мира. ( Примеч. перев. )
в Лондоне, признает, что подобное имеет место. «Мы обожаем работать с нормальными распределениями, потому что их математические свойства очень хорошо изучены. Стоит нам только узнать, что речь идет о нормальном распределении, как мы уже готовы делать всяческие интересные утверждения».
Работа Робинсона, грубо говоря, состоит в том, чтобы, исследуя структуру колоссальных объемов данных, сказать, не намухлевал ли кто в бухгалтерской отчетности. Робинсон придерживается той же стратегии, что использовал Пуанкаре, ежедневно взвешивая хлеб, с той лишь разницей, что он — британский экономист — ежедневно анализирует гигабайты финансовых данных и применяет для этого гораздо более продвинутые средства.
Робинсон говорит, что сотрудники его отдела имеют склонность работать, исходя из предположения, что любому набору данных априорно свойственно нормальное распределение. «Я полагаю, что в отношении финансовых рынков истина состоит в том, что мы зачастую предполагаем наличие нормального распределения там, где оно, возможно, не работает». В последние годы и правда наблюдалось некоторое попятное движение — как в мире науки, так и в мире финансов — прочь от исторически сложившейся практики опираться на нормальное распределение.
Читать дальше