Зато мы точно знаем, что игры типа шахмат и го, а также более простые, вроде крестиков-ноликов или точек и квадратов, – это “игры с совершенной информацией”: обдумывая ход, участник располагает всей информацией, необходимой, чтобы определить, какие ходы хорошие, а какие плохие. Никакой неопределенности, все на виду. А это значит, что в принципе, при наличии неограниченных ресурсов памяти и времени, такие игры можно просчитать. Но есть и другие игры, такие как покер, где не вся информация участникам доступна. Обдумывая свой ход, игрок в покер не знает, какие карты на руках у соперников – а ведь это решающий фактор, определяющий исход партии. Новичку, противостоящему в турнире профессионалу, конечно, может повезти – соберет роял-флеш да и выиграет партию. Но при длительной игре с большим количеством партий более опытный участник, знающий, когда делать ставку, а когда пасовать, в среднем выигрывает чаще и более крупные суммы, чем новичок.
Прежде чем говорить о просчитывании игр, подобных покеру, необходимо определиться, что же означает “просчитать”, когда речь идет об играх без “совершенной информации”. Ни один компьютер не может гарантировать стопроцентного выигрыша в покере (если не будет жульничать) – всегда ведь есть вероятность, что человеку придет роял-флеш. Поэтому “просчитыванием” в случае с покером будет выработка компьютером такой стратегии, при которой он в среднем окажется в выигрыше максимальное количество раз.
В покере еще больше усложняет задачу просчитывания возможность блефа и то, что обычно в турнирах игроков за столом значительно больше двух. Когда вместе состязаются компьютер и несколько человек, люди вполне могут объединиться против машины (причем, скорее всего, так и сделают), стремясь поставить ее в невыгодное положение. И пусть в подобной ситуации выигрыш каждого из живых участников будет менее ощутимым, чем если бы он действовал только сам за себя, – зато команда выиграет больше.
И все же для одной из разновидностей покера – техасского холдема для двух участников с лимитом – ученые уже разработали программу, которую невозможно победить в длинной серии игр. Ее появление в 2014 году стало важной вехой: впервые был найден алгоритм, способный просчитать сложную игру, в которой часть информации участникам недоступна. Эта скрытая информация и случайность розыгрыша карт не дают компьютеру выигрывать каждый раз. Но в серии из множества партий у человека практически нет шансов (так же как шахматисту, например, практически невозможно превзойти программу Stockfish ) – так что эту версию игры мы вправе объявить просчитанной. Программа может не только помочь участникам усовершенствовать навыки игры; предполагается, что используемый в ней подход найдет применение в здравоохранении и системах безопасности.
Из примера с покером может возникнуть впечатление, что во всех играх с “несовершенной информацией” имеется элемент случайности, никак не зависящий от участников. Но это не так. Во всем знакомой игре “камень, ножницы, бумага” значение имеет только то, какие фигуры показывают игроки: никакой случайности, все по воле состязающихся. И все же информация в ней несовершенна. Суть игры, в которой участники делают синхронные жесты руками, ничуть не изменится, если те будут находиться в разных помещениях и записывать выбираемые фигуры на бумажке, не зная о решениях оппонента.
В игре с совершенной информацией всегда есть какая-то “чистая” стратегия – некая последовательность ходов, которая приводит к наиболее благоприятному исходу. Скажем, в любой шахматной позиции существует лучший ход или, чаще, серия выигрышных ходов, и всякий раз, когда такая позиция возникает на доске, оптимальнее разыгрывать именно их. В случае с игрой “камень, ножницы, бумага” все с точностью до наоборот. Чистая стратегия здесь не работает: если, например, каждый раз показывать “камень” или в одной и той же последовательности “камень”, “ножницы” и бумагу”, вас в два счета обыграют. Лучше всего в подобных играх использовать так называемую смешанную стратегию, при которой в каждой из возникающих позиций с разной вероятностью предпринимаются различные действия. Просчитывание такой игры, как “камень, ножницы, бумага” или покер на двоих, заключается в нахождении оптимальной смешанной стратегии, гарантирующей наиболее высокую вероятность победы. Стратегия “всегда показывать «камень»” будет иметь вероятность выигрыша 100 %, если оппонент настолько несообразителен, что всегда будет разыгрывать “ножницы”. С другой стороны, если второй игрок быстро раскусит первого (а так, скорее всего, и будет) и станет все время показывать “бумагу”, то вероятность выигрыша с помощью “каменной” стратегии тут же упадет до нуля. Так что нет ничего удивительного в том, что игра “камень, ножницы, бумага” была просчитана, причем решение совершенно тривиально. Оптимальная стратегия: треть времени разыгрывать “камень”, треть – “бумагу” и треть – “ножницы”. Если считать ничью за полпобеды, вероятность выигрыша составляет как минимум 50 % – это лучшая из всех возможных стратегий. Есть, конечно, эксперты и более высокого уровня, но они полагаются не столько на теорию игры, сколько на психологию, извлекая выгоду из того факта, что человеку, как правило, плохо удаются по-настоящему случайные ходы, как мы уже видели в третьей главе. В целом, лучшая стратегия в играх с несовершенной информацией – смешанная.
Читать дальше
Конец ознакомительного отрывка
Купить книгу