Роял-флэш: игровой теоретик взломал покер

    Новейший компьютерный метод может играться в один из самых фаворитных вариаций покера почти безупречно. Его авторы рассказывают, что «в добросовестной игре он и не проиграет ни единому из оппонентов».

    Роял-флэш: игровой теоретик взломал покер

    Это же обстоятельный этап вперед, когда компьютерная програмка может обыграть топовых игроков из граждан, с того времени как только небезизвестный персональный компьютер Deep Blue от IBM обыграл Гарри Каспарова в 1997 году, который тогда был работающим фаворитом мира по шахматам. Програмка для покера существовала разработана ученым Майклом Боулингом и его сотрудниками из Вуза Альберты в Эдмонтоне, Канада, с помощью финского разраба программного обеспечения Оскари Таммелина. Програмка играется безупречно. Что это же значит?

    Это же значит, что раздельно заимствованный случай покера (холдем HULHE) можно полагать решенным. Метод описан в статье в журнальчике Science.

    Тактика, которую вычислили создатели, так близка к совершенству, что «сделает глупую последующую работу над данной игрой», разговаривает Эрик Джексон, исследователь компьютерного покера в Менло-Парке в Калифорнии.

    «Я думаю, это же будет сюрпризом для профессионалов. То, что эта игра эдак резво разрешилась», — прибавляет Джексон.

    Раньше уже решались альтернативные пользующиеся популярностью игры. В 2007 году команда из такого же отделения вуза Альберты — в фолиант числе и Нил Берч, соавтор крайнего научные исследования — взломала шашки.

    Однако покер куда труднее решить, чем шашки. Шахматы и шашки являются примерами игр с открытой информацией, в какой геймеры владеют тотальным познанием любых прошедших обстоятельств и сегодняшней ситуации в игре. В покере, в отличие от этих игр, существуют ряд вещей, кои геймеры и не знают: и что в особенности немаловажно, какие карты у иного геймера. Этот класс игр с неполной информацией в особенности увлекателен для экономистов и теоретиков игр, так как включает практические трудности — поиск хороших стратегий для аукционов и переговоров.

    С сожалением

    В покере главная сложность заключается в неограниченном количестве потенциальных путей развития, кои дает игра. Боулинг и его коллеги занимаются одной из самых фаворитных форм покера — техасский холдем (Texas hold’em). С двумя геймерами игра становится типа «хедс-ап», когда хоть какой проигрыш геймера — выигрыш оппонента, также имеет фиксированный объем ставок и фиксированное число подъемов ставок (raise). Существуют приблизительно 3,16 х 10^17 состояний, в каких возможно окажется HULHE, и порядка 3,19 х 10^14 потенциальных точек, в каких игрок обязан принять решение.

    Боулинг и его коллеги разработали собственный метод, который был должен выполнять выводы на базе собственного эксперимента, пока что и не достигнет чемпионского уровня (сыграв наиболее 1500 игр). На первых парах он воспринимает решения случаем, однако потом подключает к каждому решению значение «сожаления», зависимо от тамошнего, как неполноценным оно существовало.

    Эта процедура, популярная как только контрфактуальная минимизация сожаления, существовала обширно общепринята на каждогоднем соревновании по компьютерному покеру Annual Computer Poker Competition, проводимому с 2006 года. Боулинг и его коллеги улучшили ее, позволив методу заного оценивать решения, кои числились нехорошими в предшествующих тренировочных раундах.

    Иным немаловажным нововведением предстало воззвание множества инфы, которую надо хранить, применять и производить тактику на ее базе — порядка 262 терабайт. Этакий размер заданных просит очень не мало «места на диске». Ученые приименяли способ сжатия, который сократил этот размер перед началом 11 терабайт и добавили всего 5% времени, нужного для расчетов операций.

    «Думаю, контрфактуальный метод сожаления — это же важнейший этап вперед, — считает ученый Джонатан Шапиро из Вуза Манчестера. — А также они создали несколько остальных немаловажных и разумных вещей, дабы предпринять функцию вычислительно возможной».

    И блефом

    В рамках разработки собственной тактики, персональный компьютер научился вводить конкретную дозировку блефа в собственную игру. Хотя блеф кажется чисто людской психической составляющей игры, он является частью теории игр, а уж означает, и компьютерного покера. «Блеф вытекает из арифметики игры», — разговаривает Боулинг, и вы сможете высчитать, как только частенько вы обязаны блефовать, дабы достигнуть топовых результатов.

    Конечно же, ни один метод покера и не гарантирует математическую победу в каждой игре, так как эта игра включает объемной комплект случайностей, основанный на фолиант, что у вас в руке. Но Боулинг и его коллеги продемонстрировали, что в длительной перспективе них метод одолевает в большинстве случаев.

    Неполадка исключительно в фолиант, что ученые именуют «решено по существу»: это же значит, что останется маленькая маржа, вследствие которой персональный компьютер может победить благодаря способностям, а уж и не шансам. Однако эта маржа малозначительна на практике.

    Боулинг утверждает, что этакий подход возможно полезным в настоящих актуальных ситуациях, когда приходится воспринимать решения с неполной информацией — к примеру, для руководства вкладывательным ранцем.  Ныне команда ишачит над применением них способа к мед принятию решений, совместно со спецами по диабету.