Разработав методы статистического анализа, ученые смогли оградить себя от ложных закономерностей и решить, поддерживает ли ряд наблюдений гипотезу или, напротив, мнимое подтверждение случайно. Например, когда ученому-физику нужно определить, являются ли показания суперколлайдера значимыми, он не рассматривает все графики в поисках столкновений частиц, которые выделяются на уровне помех, а применяет математические методы. Один из этих методов — оценка статистической значимости — был разработан в 20-е гг. XX в. Р.А. Фишером, одним из величайших статистиков. Также он известен вспыльчивым характером и враждой со своим коллегой Карлом Пирсоном, одним из основателей статистики; противостояние было настолько ожесточенным, что Фишер еще долгое время нападал на своего заклятого врага после кончины того в 1936 г.
Чтобы проиллюстрировать идеи Фишера, предположим, что студент в ходе эксперимента по экстрасенсорному восприятию предсказывает, как упадет монета. Если студент почти всегда прав, мы можем выдвинуть гипотезу, что он предсказывает осознанно, например, благодаря своим экстрасенсорным возможностям. С другой стороны, если студент оказывается прав приблизительно в половине случаев, это говорит о том, что он просто-напросто угадывает. Но что если данные оказываются где-то посередине или их недостаточно? В какой момент мы примем гипотезу либо откажемся от нее? Это и выясняется с помощью оценки статистической значимости: формальной процедуры, позволяющей оценить вероятность того, что наши наблюдения соответствуют действительности, если данная гипотеза верна. Если вероятность невелика, мы отклоняем гипотезу. Если высока — мы ее принимаем.
Предположим, мы настроены скептически и исходим из того, что студент не может заранее знать, как упадет монета. Допустим, во время эксперимента он несколько раз предсказывает правильно. Рассмотренные в главе 4 методы позволят вычислить вероятность того, что студент угадывает по чистой случайности. Если он верно предсказывал то, как упадет монета, так часто, что вероятность его исключительного везения составляет, скажем, всего 3%, мы отклоняем гипотезу о том, что он всего-навсего угадывал. На языке оценки статистической значимости это означает, что уровень значимости отказа от гипотезы — 3%, имея в виду, что в 3% случаев данные ввели нас в заблуждение. 3%-ный уровень значимости — это очень даже неплохо, и средства массовой информации, ухватившись за описанный эксперимент, раструбили бы о доказанности существования экстрасенсорных способностей. Все же те из нас, кто не верит в сверхъестественные силы, сохранили бы скептический настрой.
Приведенный пример демонстрирует важное положение: даже если данные значимы на, скажем, 3%, тестируя 100 человек, не являющихся экстрасенсами, на наличие сверхъестественных способностей или 100 недейственных препаратов на эффективность, вы должны быть готовы к тому, что несколько человек проявят экстрасенсорные способности или некоторые лекарства проявят себя как действенные. Вот одна из причин, по которой результаты политических выборов или медицинских исследований, особенно не отличающихся масштабностью, противоречат данным предварительных опросов или более ранних исследований. И все же оценка статистической значимости и другие подобные методы являются большим подспорьем для ученых, особенно когда у тех есть возможность проводить широкомасштабные контролируемые исследования. В быту мы не проводим такие эксперименты, да и подсознание наше статистическим анализом не занимается, вместо этого мы полагаемся на инстинкт. Как-то оказалось, что приобретенная мной печь-камин фирмы «Викинг» — исключительное барахло, и случайно я узнал, что у одной моей знакомой сложилось ровно такое же впечатление. Тогда я стал предупреждать друзей, чтобы они не покупали товары этой марки. Когда, летая рейсами «Юнайтед эрлайнс», я несколько раз наткнулся на стюардесс, более раздражительных, чем на рейсах других авиакомпаний, я стал выбирать других перевозчиков. Располагая небольшим количеством данных, я инстинктивно вывел закономерность.
Иногда подобные закономерности имеют значение, иногда — нет. В обоих случаях тот факт, что наше восприятие закономерностей в повседневных ситуациях обладает в равной степени и большой убедительностью и высокой субъективностью, имеет под собой подоплеку. Данный факт предполагает некоторую относительность, то есть, как доказал Фарадей, у каждого свое представление о действительности. Например, в 2006 г. издание «The New England Journal of Medicine» обнародовало результаты исследования, на проведение которого было потрачено 12,5 млн. долларов. В исследовании приняли участие пациенты с диагнозом «остеоартрит коленного сустава». По итогам было выявлено, что комплекс биологически активных добавок с аминоглюкозой и хондроитином так же неэффективен в качестве болеутоляющего, как и плацебо. Тем не менее один именитый врач никак не мог расстаться с этим убеждением и продолжал настаивать на пользе добавок. Свои выводы он озвучил в выступлении по радио, убеждая слушателей в возможной пользе подобного лечения таким примером: «У врача моей жены есть кот, и жена говорит, что этот кот утром просто не может встать без небольшой дозы аминоглюкозы и хондроитинсульфата» {192} 192 The study was D. O. Clegg et al., «Glucosamine, Chondroitin Sulfate, and the Two in Combination for Painful Knee Osteoarthritis», New England Journal of Medicine 354, no. 8 (February 2006): 795–808. The interview was «Slate's Medical Examiner: Doubts on Supplements», Day to Day, NPR broadcast, March 13, 2006.
.
Читать дальше
Конец ознакомительного отрывка
Купить книгу