Те, кто бывал на собачьих бегах или скачках, могут вспомнить, что вероятность победы в забеге часто выражается в коэффициентах. Аутсайдер может иметь коэффициент 5 к 1. Это означает, что в пяти из шести идентичных забегов это животное, скорее всего, проиграет, а выиграет лишь в одном. Вероятность его победы составляет 1 к 6. Естественный способ описывать шансы против – задавать соотношение вероятности того, что событие не произойдет, и вероятности того, что оно произойдет (в данном случае 5/6 к 1/6, или, проще, 5 к 1). Фаворит гонки, напротив, может иметь коэффициент 2 к 1. В спортивном тотализаторе принято всегда ставить на первое место большее число, поэтому необходимо различать коэффициенты «на» и «против». Коэффициент «на», обратный коэффициенту «против», выражает отношение вероятности того, что событие произойдет, к вероятности того, что оно не произойдет. При коэффициенте 2 к 1 можно ожидать, что фаворит в трех забегах выиграет два раза и проиграет один. Таким образом, вероятность того, что фаворит выиграет, составляет 2 из 3 или 2/3, а вероятность того, что он проиграет, составляет 1/3, что и дает коэффициент 2/3 к 1/3 или, проще, 2 к 1.
Комментаторы и букмекеры порой говорят о «фаворите с высокой котировкой» – как правило, когда речь идет о забегах с небольшим количеством лошадей. Этот жаргонизм – тавтология. Любая лошадь с положительным коэффициентом (выше единицы) котировок является фаворитом по определению, поскольку в любом забеге математически может быть только одна лошадь, которая с большей вероятностью выиграет, чем проиграет. В забеге же с большим количеством лошадей вероятность выиграть ниже. Так, в самых известных скачках Великобритании Grand National участвуют 40 лошадей. Даже победитель 2018 года, Tiger Roll, считавшийся неоспоримым фаворитом в 2019 году (в конце концов он и выиграл), имел шансы 4 к 1 «против». Поскольку большинство лошадей вряд ли выиграют большинство забегов, коэффициенты на лошадей, начинающиеся с высокого числа, как правило, это коэффициенты «против» – если прямо не указано иное.
В медицинских сценариях все наоборот. Шансы обычно выражаются в виде коэффициента «за» – вероятности того, что событие произойдет, относительно вероятности того, что оно не произойдет, а поскольку мы обычно говорим о заболеваниях с уровнем распространения среди популяции ниже 50 %, первым обычно называется меньшее число.
Чтобы посмотреть, как вычислить медицинские шансы и желаемое соотношение шансов, рассмотрим гипотетическое исследование конкретного контролируемого случая о влиянии единственного варианта Е4 (как в моем профиле ДНК) на вероятность развития болезни Альцгеймера к 85 годам. Результаты представим в табл. 1. Шансы развития болезни Альцгеймера к 85 годам в случае с одной копией варианта Е4 в генотипе (как и у меня) представляют собой количество людей с болезнью (100), деленное на количество людей без болезни (335), то есть 100 к 335 или, в виде дроби, 100/335. По той же логике, с учетом данных из второй строки таблицы, шансы развития болезни к 85 годам у обладающих распространенным генотипом с двумя копиями варианта Е3 составляют 79 к 956, или 79/956. Таким образом, соотношение шансов – это сравнение шансов на развитие болезни у человека с заданным генотипом (например, одна копия варианта Е4 и одна копия варианта Е3) с шансами развития болезни у человека с наиболее распространенным генотипом (две копии варианта Е3). Для гипотетических показателей, приведенных в табл. 1, соотношение шансов составляет 100/335, деленное на 79/956, что дает 3,61. Крайне важно, что соотношение шансов не требует от нас знать уровень распространения болезни в популяции в целом, поэтому его можно легко вычислить на основе анализа конкретных случаев.
Табл. 1. Результаты гипотетического тематического исследования о влиянии варианта одной копии Е4 на развитие болезни Альцгеймера к 85 годам
Показатель соотношения шансов сам по себе не дает информации о значении относительного риска (вероятности получения заболевания для генотипа Е3/Е4 относительно вероятности получения заболевания для генотипа Е3/Е3), но, объединив его с общим популяционным риском заболевания и известными частотами генотипов [56] Частота генотипа – доля особей с данным генотипом в популяции. – Прим. пер.
, можно определить вероятность заболевания для данного генотипа. Этот расчет очень непрост. Более того, не существует даже однозначно определенного способа его сделать. Я попытался воспроизвести тот же показатель риска развития поздней болезни Альцгеймера, что обнаружил в присланном отчете, используя тот же метод, что и в 23andMe, и данные, взятые непосредственно из отчета или из документов, которые они цитировали [57] Farrer, L. A., Cupples, L. A., Haines, J. L., Hyman, B., Kukull, W. A., Mayeux, R….. Duijn, C. M. van. (1997). Effects of age, sex, and ethnicity on the association between apolipoprotein E genotype and Alzheimer disease. JAMA, 278 (16), 1349. https://doi.org/10.1001/jama.1997.03550160069041 Gaugler, J., James, B., Johnson, T., Scholz, K., & Weuve, J. (2016). 2016 Alzheimer’s disease facts and figures. Alzheimer’s & Dementia, 12 (4), 459–509. https://doi.org/10.1016/J.JALZ.2016.03.001 Genin, E., Hannequin, D., Wallon, D., Sleegers, K., Hiltunen, M., Combarros, O., Campion, D. (2011). APOE and Alzheimer disease: a major gene with semi-dominant inheritance. Molecular Psychiatry, 16 (9), 903–7. https://doi.org/10.1038/mp.2011.52 Jewell, N. P. (2004). Statistics for Epidemiology. Chapman & Hall/CRC. Macpherson, M., Naughton, B., Hsu, A. and Mountain, J. (2007). Estimating Genotype-Specific Incidence for One or Several Loci, 23andMe. Risch, N. (1990). Linkage strategies for genetically complex traits. I. Multilocus models. American Journal of Human Genetics, 46 (2), 222–8.
. (Если вам интересно, при расчете мне предстояло найти вероятность развития заболевания, решив систему из трех взаимосвязанных уравнений для трех неизвестных условных вероятностей при помощи нелинейной программы поиска решений – как раз в таких задачках я люблю покопаться в процессе своей повседневной работы). Я обнаружил небольшие, но потенциально очень значимые расхождения между моими результатами и результатами 23andMe. Мои расчеты подсказывали, что к выкладкам 23andMe стоит отнестись с некоторым скептицизмом.
Читать дальше
Конец ознакомительного отрывка
Купить книгу