К первому апреля 2011 года в архиве электронных препринтов вышла статья «Нестандартные космологические реликтовые паттерны в космическом микроволновом фоне» (arXiv:1103.6262), в которой авторы издеваются над поисками «паттернов» в реликтовом излучении, проверяя карту на корреляции с символами ☺, ☹, ликом Христа на Туринской плащанице и еще парой картинок. И, конечно, они находят значимую корреляцию. Чтобы не мелочиться, они оценивают значимость корреляции в ∞ σ . Этот е-принт мог бы по праву войти в сборник «Физики шутят». Кстати, там четыре автора, фамилии всех начинаются на «Z» (Zuntz, Zibin Zunkel, and Zwart) и все — реальные ученые из сильнейших научных центров! Можно предложить читателю в качестве домашнего задания оценить вероятность случайного возникновения такого авторского коллектива. После этой публикации разговоры о кольцах Пенроуза стихли.
Кстати, это не единственная первоапрельская статья данного авторского коллектива. Подбор авторов становится ясен из их предыдущей первоапрельской статьи. Годом раньше они (за исключением J. Zibin, вместо которого фигурировал Т. Zlosnik) выпустили препринт «Орфографические корреляции в астрофизике» (arXiv:1003.6064v1), где исследуется зависимость числа цитирований от первой буквы фамилии автора. По ходу авторы издеваются над некоторыми методологическими приемами, использовавшимися в статьях, написанных на полном серьезе. Вообще, первоапрельские розыгрыши и прочие шутки, видимо, имеют в науке огромное значение, поскольку положительно коррелируют с научным уровнем сообщества. Автор не проверял эту корреляцию на конкретном статистическом материале, но она видна и невооруженным глазом, ее значимость никак не меньше оценки, приведенной выше, — ∞ σ (см. врезку «Что такое сигма…»).
Однако шутки в сторону! На самом деле карта неоднородностей реликтового излучения — кладезь важнейшей информации. В ней зашифрованы ключевые сведения о Вселенной — карта говорит о ней как о целом больше, чем наблюдения далеких галактик и квазаров. По мнению автора, суммарное научное значение результатов WMAP превосходит значение открытия бозона Хиггса. Просто эти результаты оказались растянутыми во времени. Как же расшифровать карту? Для ответа полезно совершить очередной экскурс в прошлое.
Что такое сигма и статистическая значимость
Наверно каждому, кто хоть сколько-нибудь интересуется наукой, приходится время от времени слышать нечто подобное: «Модель противоречит данным на уровне два сигма», «Открытие бозона Хиггса будет официально признано, когда уровень значимости достигнет пяти сигма», «Заявки на доклады о три-сигма-эффектах не рассматриваются» и т.д.
Вездесущая сигма — всего лишь параметр, задающий ширину распределения Гаусса, традиционно обозначаемый как σ . Это жаргон. Официальный термин -стандартное отклонение, но это тот случай, когда жаргон сильно потеснил изначальный термин не только в устной речи, но и в научных статьях. Собственно, вот так выглядит распределение Гаусса, нормированное на единицу:
f ( x ) = 1/(σ√2π· е ^( x-x 0)/2σ 2)
«Нормированное на единицу» означает, что при таком коэффициенте перед экспонентой площадь под кривой равна единице. Распределение Гаусса крайне важно в статистике по простой причине: сумма многих случайных величин описывается распределением Гаусса (для простоты пользуемся вульгарным языком, пусть даже рискуя навлечь на себя гнев математиков). Например, распределение числа выпадений орла при 100 бросаниях монеты близко к распределению Гаусса со средним х 0 = 50 и σ = √50). На самом деле это будет так называемое биноминальное распределение, но при числе выпадений 50 оно достаточно близко к распределению Гаусса и обычно считается таковым при обработке данных.
Сходимость суммы многих распределений к распределению Гаусса декларируется так называемой центральной предельной теоремой. Именно поэтому распределение Гаусса столь важно в статистике. Настолько важно, что его называют нормальным распределением, а параметр ширины — стандартным отклонением. Если ошибки измерений описываются нормальным распределением, то с данными работать легко — есть простые способы оценок, насколько та или иная гипотеза описывает эти данные, каковы ошибки в параметрах гипотезы, которой мы пытаемся описать данные. Если ошибки не описываются нормальным распределением, то на это часто закрывают глаза, что обычно сходите рук, но не всегда.
Читать дальше
Вот если для примера рассмотреть вращение Луны вокруг Земли. Луна, располагаясь на своей орбите, находится в состоянии равновесия, и при этом ее постоянном движении не совершается работа (работа - это затраченная мощность на протяжении некоторого времени, мощность в свою очередь - это скорость передачи энергии). Наоборот, чтобы сместить Луну с ее орбиты необходимо совершить работу (т.е. затратить мощность). Так и Вселенная, расширяясь, вероятнее всего, находится в состоянии равновесия, которое точно так же, как и равновесие системы Земля-Луна, обеспечивается самой гравитацией. Расширение Вселенной - это ее равновесие, а не затрата мощности при передачи гипотетической темной энергии. И искать темную энергию, которая бы была причиной расширения, - то же самое, что искать скрытый двигатель у Луны, который толкает ее вокруг Земли.