Процесс пересмотра убеждений часто называют обучением Байесовым методом (названным так по имени священника XVIII века Томаса Байеса). Предположим, что мы имеем первоначальное (предварительное) субъективное распределение вероятностей, касающихся различных положений вещей. В приведенном примере предварительное распределение было выведено из частотности в прошлом. В других случаях это может быть просто догадка. На основании своей интуиции я, например, могу присвоить 60 %-ю вероятность тому, что премьер-министр компетентен. Мы можем наблюдать за действиями, которые он предпринимает на должности, и за их результатами, например коэффициентом роста экономики. Предположим, мы можем сформировать оценку вероятности этих наблюдений с учетом компетентности премьер-министра. При компетентном премьер-министре у нас 80 %-е ожидание хорошего результата, при некомпетентном – 20 %. Байес показал, как скорректировать наши первоначальные вероятности, касающиеся компетентности премьер-министра, с учетом наблюдений .
Предположим, что есть только два возможных исхода – хороший и плохой, и что мы наблюдаем хороший. Если мы присваиваем р ( а ) вероятности, что будет получено а , и р ( а | b ) условной вероятности (conditional probability) получения а , если будет получено b , мы предположили, что р (премьер-министр компетентен) = 60 %, р (премьер-министр некомпетентен) = 40 %, р (хороший исход | премьер-министр компетентен) = 80 % и р (плохой исход | премьер-министр некомпетентен) = 20 %. Мы пытаемся вычислить р (премьер-министр компетентен | хороший результат). Для обозначения мы используем буквы а и b , соответственно для компетентности и хорошего исхода. Тогда в начале мы можем отметить p ( а | b ) = p ( a & b ) / p ( b ) (*)
Условная вероятность p ( а | b ) равна вероятности получения а и b , поделенной на вероятность b . Это вытекает из интуитивного предположения, что p ( a & b ) равна p ( b ), у множенной на p ( а | b ). Разделив обе части этого уравнения на р ( b ), мы получаем уравнение (*).
Снова используя уравнение (*), поменяв местами a и b , мы имеем p ( b | a ) = p ( a & b ) / p ( a ), что равнозначно p ( a & b ) = p ( b | a ) p ( a ).
Подставляя последнее выражение в (*), мы получаем p ( a | b ) = p ( b | a ) p ( a ) / p ( b ). (**)
Есть два способа, которым может произойти b (хороший исход) с компетентным или некомпетентным премьер-министром. Вероятность того, что случится одно из двух взаимоисключающих событий, является суммой вероятностей каждого события. Мы, таким образом, можем записать p ( b ) = p ( b & a ) + p ( b &не- а ), которое, согласно рассуждению в абзаце, следующим за (*), равнозначно p ( b | a ) p ( a ) + p ( b |не- а ) p (не- а ).
Если мы подставим это выражение для p ( b ) в (**), получим теорему Байеса p ( a | b ) = p ( b | a ) p ( a ) / [ p ( b | a ) p ( a ) + p ( b |не- а ) p (не- а )].
Замещение числовых вероятностей в правой части этого уравнения показывает, что p ( a | b ) = 80 %, то есть наблюдение успешного исхода повышает вероятность того, что премьер-министр компетентен, с 60 до 80 %. Наблюдение второго и третьего положительного исхода поднимут его до 91 и 97 % [170]. Если, по первоначальным оценкам другого человека, р ( а ) = 0,3, а не 0,6, три последующих позитивных наблюдения поднимут его оценку сначала до 0,53, потом до 0,75 и, наконец, до 0,89. Таким образом, возможно, что не имеет значения, надежными или ненадежными были первоначальные предположения, поскольку по мере поступления новой информации откорректированные убеждения становятся все более достоверными. Со временем первоначальная разница во мнениях может быть нивелирована новыми данными [171]. Заметим (глава XXIII), что каждый новый фрагмент информации оказывает меньшее воздействие, чем предыдущий.
Оптимальное инвестирование в сбор информации
Третий компонент рационального действия – оптимальное инвестирование ресурсов (таких как время или деньги) в добывание новой информации. Как показано на рис. XI.1, есть несколько детерминант этого оптимума. Во-первых, какое количество информации рационально получить, зависит от желаний агента [172]. Например, агент, который не слишком заботится о наградах в отдаленном будущем, не будет много вкладывать в определение срока службы товара длительного пользования. Очевидно, что имеет смысл собирать больше информации при принятии важного решения, например при покупке дома, чем при выборе между двумя бутылками одинаково дорогого вина. В последнем случае можно просто подбросить монету, если предполагаемые издержки на определение того, что лучше, превосходят ожидаемую выгоду (основанную на предварительном знании качественного диапазона для вина в данной ценовой категории) от употребления вина более высокого качества.
Читать дальше