Как я уже говорил, Байес разработал условную вероятность в попытке ответить на тот же вопрос, который увлек Бернулли: как по известному факту события вычислить вероятность того, что оно было вызвано данной причиной? Если в процессе клинических испытаний лекарство помогло 45 пациентам из 60, каковы шансы того, что лекарство подействует и на следующего пациента? Если оно помогло 600 000 пациентов из 1 млн, шансы того, что оно подействует, приближаются к 60%. Однако к какому выводу вы придете, если будете исходить из испытаний меньшего масштаба? Байес задался и другим вопросом: если перед испытаниями у вас были основания верить в то, что лекарство эффективно лишь на 50%, насколько весомыми окажутся новые сведения для ваших дальнейших оценок? Наш жизненный опыт в основном выглядит следующим образом: мы наблюдаем сравнительно небольшую выборку исходов, а уже из этого выводим информацию и приходим к заключению относительно качеств, которые привели к подобным исходам. Как нам следует выводить информацию?
Байес задумал решить задачу через метафору {105} 105 Ibid., pp. 121-31.
. Предположим, нам выдали квадратный стол и два мяча. Первый мяч мы катим по столу таким образом, чтобы имели место равные вероятности: мяч остановится в любой точке. Наша цель — определить, не глядя, где именно вдоль всей оси слева направо мяч остановился. При этом наше орудие — второй мяч, который мы поначалу тоже будем неоднократно катать по столу тем же самым образом, что и первый. С каждым разом специально поставленный для этого человек будет записывать, где именно, справа или слева от первого мяча, остановился второй мяч. В конце человек сообщит нам общее количество попыток, во время которых второй мяч останавливался в каждом из двух основных направлений. Первый мяч представляет собой то неизвестное, о чем мы хотели узнать, второй мяч представляет собой свидетельства, которые нам удалось собрать. Если второй мяч будет раз за разом останавливаться справа от первого мяча, можно быть в достаточной степени уверенным, что первый мяч останавливается в дальнем левом углу стола. Если он останавливается — не так последовательно, раз за разом — мы будем в меньшей степени уверенными в своем выводе или же предположим, что первый мяч находится в дальнем правом углу. Байес продемонстрировал, как, опираясь на сведения о втором мяче, определять точную вероятность того, что первый мяч находится в любой данной точке рядом с осью слева направо. И продемонстрировал, как при наличии дополнительных сведений можно пересмотреть первоначальные подсчеты. Согласно терминологии Байеса, первоначальные подсчеты называются априорной вероятностью, а новые предположения — апостериорной вероятностью.
Байес затеял эту игру по той простой причине, что она моделирует многие решения, которые мы принимаем в жизни. В примере с испытаниями лекарства положение первого мяча представляет собой истинную эффективность лекарства, а то, что говорится о втором мяче, представляет собой информацию о пациенте. Положение первого мяча может также обозначать интерес к фильму, качество изделия, умение водить машину, усердную работу, упрямство, талант, способность — да что угодно, что определяет успех либо неудачу того или иного предприятия. Сообщения о втором мяче в таком случае обозначали бы наши наблюдения либо полученные нами данные. Теория Байеса демонстрирует, как производить оценку и согласовывать ее при наличии новой информации.
В наше время байесовский анализ широко применяется и в науке, и на производстве. К примеру, в модели, с помощью которых рассчитываются страховые тарифы для автомобилей, заложена математическая функция, описывающая в единицах времени за рулем вероятность для вас лично попасть в аварию однажды, не один раз, ни одного раза. В нашем случае достаточно рассмотреть упрощенную модель, согласно которой все водители распределяются на две категории: высокого риска, к которой относятся водители, в среднем попадающие в одну аварию в год, и малого риска, к которой относятся водители, в среднем попадающие в менее чем одну аварию в год. Допустим, в момент обращения за страховкой вы предоставляете данные, согласно которым проездили без единой аварии аж двадцать лет, либо предоставляете данные, согласно которым за двадцать лет побывали в тридцати семи авариях. Страховая компания четко определит для себя, к какой категории вас отнести. Однако если вы сели за руль недавно, к какой категории вас отнести: малого риска (водитель не превышает скорость и не употребляет ни капли спиртного за рулем) или высокого риска (водитель гонит по шоссе, отхлебывая из уже полупустой бутылки вина)? У страховой компании нет на вас никаких данных — ни малейшего представления о «положении первого мяча», — поэтому вас могут отнести с равной априорной вероятностью и к той, и к другой категории, либо, на основании известных данных о начинающих водителях, сразу приписать к категории высокого риска, скажем, 1 к 3. В таком случае компания применит к вам смешанную оценку — одна треть высокого риска и две трети малого риска — и возьмет с вас одну треть платы, которую берет с водителей категории высокого риска, и две трети платы, которую берет с водителей категории малого риска. Далее после года наблюдений — то есть, после броска одного из вторых байесовских мячей, — компания будет располагать другими данными, чтобы переоценить модель, привести в соответствие ранее рассчитанные пропорции в одну треть и две трети и определить новую ставку. Если у вас не было ни одной аварии, соотношение малого риска и следовательно низкого тарифа возрастет; если у вас произошло две аварии, соотношение снизится. Точные размеры соответствия даются теорией Байеса. Таким же образом страховая компания может периодически приводить в соответствие свои оценки в последующие годы, отражая факт того, что у вас не было аварии или же вы дважды попали в аварию, когда ехали по улице с односторонним движением не в ту сторону, Да еще одной рукой прижимали к уху мобильный телефон, а в другой держали пончик. Вот почему страховые компании могут назначать скидки так называемым «примерным водителям»: отсутствие аварий повышает апостериорную вероятность того, что водитель входит в категорию малого риска.
Читать дальше
Конец ознакомительного отрывка
Купить книгу