Один из нас (Майкл Джонс) много лет проработал практикующим хирургом-онкологом. Его разговор с человеком, у которого только что диагностировали злокачественную опухоль, мог бы звучать так.
Пациент . Что ж, доктор, каковы мои шансы победить болезнь?
Доктор Джонс . Ваши шансы на выживание составляют или 0, или 100 %.
Пациент . Что вы имеете в виду? Не могли бы вы привести мне цифры, оценить вероятность?
Доктор Джонс . Если вы хотите знать, какой процент из большой группы людей с этим заболеванием выживает, я, конечно, могу назвать цифры. Но в вашем конкретном случае мы имеем вариант «или пан, или пропал». Вы либо переживете это, либо нет. Так что давайте будем оптимистами и надеяться, что все закончится благополучно.
Пациент . Даже не знаю, плакать мне или радоваться.
Доктор Джонс . Учитывая единственную альтернативу, не лучше ли рассчитывать на то, что вы поправитесь?
Пациент . Может быть, доктор, может быть.
Все это, безусловно, справедливо, но ведь, с другой стороны, мало просто рассчитывать на лучший исход: наш воображаемый пациент и его врач должны определить максимально эффективную стратегию лечения. Ни один из трех основных способов борьбы с раком — операция, лучевая терапия или химиотерапия — ни порознь, ни в комплексе не лишены серьезных побочных эффектов. Ну и как в данном случае выбрать лечение, которое с наибольшей вероятностью увенчается успехом и при этом нанесет наименьший вред?
Несмотря на здравый аргумент, что выводы статистических исследований могут не подходить конкретному пациенту, от чего-то все же надо отталкиваться, и потому мы начинаем с костюма усредненного размера — статистических данных тщательно проведенных и проанализированных испытаний на группах пациентов с таким же заболеванием. В конце концов лучше уж такой костюм, чем вообще никакого.
Итак, это исходная точка. И куда мы из нее направимся? Простите, но необходимо сказать еще несколько слов о статистике, поскольку именно так большинство людей измеряет ценность научных данных.
В исследованиях на группах пациентов эффекты вмешательства анализируются на основе частотности — среднее значение, медиана, доверительный интервал и проч.; все показатели отдельных больных вливаются в сверхчисла, описывающие целую популяцию и считающиеся статистически значимыми; p < 0,05 = вероятно, p > 0,05 = возможно, нет. Но эти числа не относятся напрямую к отдельному человеку даже в группе испытуемых, не говоря уже о пациенте, который сидит сейчас в кабинете врача, с тревогой ожидая рекомендаций по лечению. Некоторые статистики занимаются этой проблемой и пытаются расширить свои умения, чтобы разобраться с тем, как использовать информацию, полученную от группы, в конкретных условиях. Такие попытки предпринимались еще в середине XVIII века.
На пути осмысления упомянутых выше сомнений относительно статистики хороший доктор также обязательно познакомится с преподобным Томасом Байесом [98] Thomas Bayes. Wikipedia , https://en.wikipedia.org/wiki/Thomas_Bayes .
, пресвитерианским священником из города Танбридж-Уэллса, что в английском графстве Кент. Байес, человек грузный и мрачный, если судить по предполагаемому портрету, был не только богословом, но и математиком и внес существенный вклад в статистику, поскольку изучал теорию вероятностей. Он родился около 1701 г. и умер в возрасте 59 лет, так и не опубликовав главную работу своей жизни. Его записки о том, что впоследствии получило название «теорема Байеса», выпустил через два года после смерти священника его друг Ричард Прайс. Статья в Philosophical Transactions of the Royal Society of London была озаглавлена «Очерки к решению проблемы доктрины шансов» [99] Thomas Bayes. An essay towards solving a problem in the doctrine of chances. Philosophical Transactions of the Royal Society of London . 53:370, 1763.
, и описанные в ней идеи положили начало целой области — применяемой до сих пор байесовской статистики .
Основная идея байесовской статистики заключается в том, что на статистическую вероятность определенных событий оказывает влияние целый ряд факторов (в дополнение к предыдущему групповому опыту) и что вероятность меняется при поступлении новой информации. Существует учение, согласно которому такой способ интерпретации сведений, имеющих отношение к медицине, более точен и более полезен на практике, чем распространенный подход на основе частотности.
Не будем углубляться в математику, лучше приведем несколько примеров того, как это работает. Специалист по информатике, инженер и педагог Кевин Бун использует простую иллюстрацию — выбор вероятного победителя из двух на скачках [100] Kevin Boone. Bayesian statistics for dummies. http://www.kevinboone.net/bayes.html .
; лошадей он называет Быстроногий и Конина. В прошлом лошади соревновались с равными шансами 12 раз; Быстроногий выиграл 7 забегов. Кажется, чего проще — надо ставить на него. Но оказывается, что в четырех случаях шел дождь, и в такие дни трижды первым приходил к финишу Конина. Так что в ненастный день ставьте на Конину (не обращая внимания на имя несчастного животного), а в ясный — на Быстроногого. При учете дополнительных факторов прогнозируемый результат может отличаться от того, что предсказывают данные, полученные путем обобщений.
Читать дальше
Конец ознакомительного отрывка
Купить книгу