AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Предположим, что у AlphaZero рейтинг 3600 а у 32-х фигурной базы 4200.
    Вопрос сколько возможных побед может отсечь, 32 фигурная база, если на ходу так примерно 80, 90, 100, увидит для себя проигрыш? Возможных побед потому, что AlphaZero с рейтингом 3600 эти выигрышные ходы так и не увидит?
    А вот если сделать прогу, с ретингом близким к 4200, но еще более умную чем 32 фигурная база и запустить матч с AlphaZero из 100 игр. После первых 10-15 игр наша прога прощупывает рейтинг AlphaZero и понимает, что AlphaZero выигрышь на 80, 90, 100 ходах не увидит и начинает не много рисковать, но за счёт более высокого уровня игры, выигрывает все 100 партий из 100?
    Я это всё к тому что 32 фигурная база по отношению к третьему игроку, не всегда самый сильный соперник))
  2. nh2008 Учаcтник

    • Участник
    Рег.:
    01.12.2013
    Сообщения:
    2.183
    Симпатии:
    2.264
    Репутация:
    221
    Нарушения:
    10
    Адрес:
    Украина
    Оффлайн
    Не слежу за дискуссией. Можете пояснить что такое 32-х фигурная база?
  3. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.853
    Симпатии:
    11.647
    Репутация:
    718
    Нарушения:
    21
    Оффлайн
    типа шахматного коммунизма
    MS нравится это.
  4. nn В предбаннике

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    623
    Симпатии:
    1.206
    Репутация:
    83
    Нарушения:
    23
    Оффлайн
    Самая интересная игра игра - ним. Потому что правильный ход мгновенно вычисляется из аналитического представления n*m -фигурной эндшпильной базы. Для соперника непрерывные поражения выглядят очень загадочно. Главное направлением взгляда делать вид, что увеличиваешь глубину расчета, и не закатывать глаза вверх, что является признаком математических вычислений
    Последние данные очков репутации:
    Комсюк: 2 (ним - наше всё!) 20 янв 2018
    Комсюк нравится это.
  5. SkipperNorton Новичок

    • Новичок
    Рег.:
    04.05.2016
    Сообщения:
    19
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    Да ничего она не отсекает, в случае если видит одинаковые по оценкам ходы.
    Т.е. программа имеющая такую базу - сразу видит к примеру - пойду 1) e4, 1) d4 1) c4 --- попадаю в ничейную позицию,
    у которой у чёрных будет по 3-4 ответа - тоже с ничейной оценкой, иначе проиграют.

    Пойду 1) Kf3, 1) b3 , Kc3 -- тоже ничейная, только у черных больше вариантов сохранить ничью.

    Пойду любой другой ход - вообще в проигрышную позицию попадаю.

    Программа может конечно просто выбрать любой ход, зная оценки только на один полуход вперед, тогда очков меньше
    наберет. Но вот если она будет смотреть что там по базам получается у противника на глубине 5-6 полуходов,
    то она не просто выберет ход, ведущий в ничейную позицию. Она выберет ход, который минимизирует возможность
    не ошибиться противнику в ближайшие 5-6 ходов, и не попать в проигрышну. для себя позицию.

    Занимаясь таким анализом в течении всей партии, на протяжении 80 ходов, и даже 150 ходов
    (программа сможет выбирать самые сложные затягивающие варианты) - сведет вероятность не ошибиться
    у продвинутой Альфа-Зеро или Стокфиша, или др. программы с рейтингом в 3600 - до такого уровня, что вот
    именно это и произойдёт как я написал - у них -

    результат будет таким - 95 партий проиграет, 5 партий сведет в ничью, и ни одной не выиграет.

    А то может даже и 5 партий вничью не свести.
    Я сам программировал и анализировал эти базы (7-фигурки вообще все могу сгенерить,
    только компьютерные мощности нужны и денежки на них), и уж хорошо видел,
    какие там вообще возможности открываются.
    Так что уверяю вас, даже если создадуд шахматную программу с рейтингом в 4000 - это еще далеко не предел.
    А то некоторые ошибочно возомнили, что человечество с нынешними программами уже чуть ли не уровня Бога в шахматах достигает :)
  6. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Гипотетическая эндшпильная база типа Налимова, только не на 6 фигур, а на 32.
    В принципе её можно заменить квантовым компьютером, который решил шахматы))
  7. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    Рег.:
    10.04.2006
    Сообщения:
    2.478
    Симпатии:
    2.678
    Репутация:
    207
    Адрес:
    Москва
    Оффлайн
    Фантазеры ... :)
  8. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    SkipperNorton, Но вы же пишите про 5 ничейных партий. Вы хотите сказать, что это те ходы AlphaZero, при которых база, не выиграла бы вообще ни при каких вариантах? То есть, даже если бы она рискнула проиграть в этих вариантах и сильно обострила бы игру, всё равно бы не выиграла? То есть риск на таком высоком уровне игры абсолютно ни чего не даёт?
    Вот например играет 6 фигурная база с человеком новичком. Позиция у них ничейная. И новичок легко доводит эту игру до ничьи. А теперь играет новичок и прога скажем MegaAlphaZero+ и прога решает, "а я пожалуй рискну и тупо жертвует фигуру". Новичек от этого хода входит в ступор начинает нервничать и делает совершенно глупых ход и MegaAlphaZero+ спокойно выигрывает игру!))
  9. SkipperNorton Новичок

    • Новичок
    Рег.:
    04.05.2016
    Сообщения:
    19
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    Гипотетическая эндшпильная база типа Налимова, только не на 6 фигур, а на 32.

    Нужно еще не просто пользоваться базой на один полуход вперед, а при одинаковых оценках - анализировать
    варианты которые получаются на глубине несколько полуходов - т.е. минимизировать вероятность не ошибиться противнику.
    Шахматы - это такая игра, в которой существуют позиции, неотличимые по оценкам нейронной сети (и мозга), но вместе с тем,
    имеющие разные (теоретические) оценки.
    Пример - возьмите позицию из 7-фигурной базы, где белые выигрывают в 545 ходов, и сравните ее
    с позицией где белые выигрывают но уже в 350 ходов. Ни человеческий мозг, ни одна нейронная сеть - часто неспособны будут
    вообще понять, в чём же преимущество второй позиции над первой. Это чистая комбинаторика, и только программа
    имеющая доступ к 32-фигурным базам - будет это видеть и понимать.

    Если бы так человек мог ко всему совершенствоваться, то вот аналогичный пример - разложите на два множителя
    число, длиной в 1000 десятичных цифр! Случаи факторизации в большинстве своём неотличимы
    по функции нелинейной оптимизации, благодаря которой эти нейронные сети и обучаются!.
    Потому и ни один человек не сможет решать подобную задачу, и её не сможет решить
    ни одна нейронная сеть (ИИ - искусственный интеллект компьютера).
    Иначе злоумышленники давно бы уже создали такую нейронную
    сеть и взламывали бы любые шифры и пароли к базам данных банков и фондовых бирж.
    и на этом можно было бы "заработать" миллиарды долларов.
    (т.е. нейронную сеть невозможно этому обучить - нет критериев оптимизации для
    этого). А 32-фигурная база по отношению к шахматам, это аналогично как уже сохранненная база
    всех множителей для чисел длиной в 1000 цифр. Вот аналогия.

    Отсюда следует, что если бы имелась 32-фигурная база.. Скажем, прилетели инопланетяне с ней и предложили
    сыграть партию в шахматы с человечеством.
    Такую что : 1) анализирует Карлсен + 20 лучших гроссмейстеров, 2) пользуются Стокфишем + продвинутой нейро-сетью
    Альфа-Зеро, + 3) играют белыми и тратят неделю на каждый один ход -
    и всё равно инопланетяне чёрными, с такой 32-фигурной базой - могли бы построить такую игру, в которой
    минимизировали бы вероятность не ошибиться противнику, и в 95% партий (а то и больше) - добились бы победы.

    Дело в том, что партия может продолжаться и 100 и 200 ходов, а чтобы проиграть в такой партии, достаточно
    всего лишь одной ошибки. и вероятность хотя бы одной ошибки (на этом множестве) растет именно
    с экспоненциальной скоростью в зависимости от количества ходов.
    И программа с 32-фигурной базой уже ни одну ошибку точно не простит, и победу не упустит.

    Так что шахматные программы еще долго будут совершенствоваться и даже будущий рейтинг
    в 4000 - это еще далеко не предел.

    Это область математики и мат.статистики.
    sovaz1997 нравится это.
  10. SkipperNorton Новичок

    • Новичок
    Рег.:
    04.05.2016
    Сообщения:
    19
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    вы же пишите про 5 ничейных партий. Вы хотите сказать, что это те ходы AlphaZero, при которых база, не выиграла бы вообще
    ни при каких вариантах? То есть, даже если бы она рискнула проиграть в этих вариантах и сильно обострила бы игру, всё равно бы не выиграла?

    Скажу точнее - для программы имеющей доступ к 32-фигурным базам, вовсе не обязательно будет рисковать что то жертвовать и т.д.
    чтобы осложнить игру, и увеличить вероятность выигрыша, вместе с тем получив (кратковременно) проигрышные для себя позиции.
    Скорее всего, стартовая шахматная позиция ничейна, но даже в рамках этого "ничейного множества" - достаточно вариантов,
    когда : 1) ничем не рискуешь, т.е. при лучшей игре противника всё равно ничья будет, 2) усложняешь или затягиваешь игру так, что
    вероятность не ошибиться у противника, не имеющего 32-фигурных баз - будет устремляться к нулю.

    это те ходы AlphaZero

    Я просто допускаю возможность что лучшая программа AlphaZero хотя бы в 5% партий сможет не ошибиться ни разу на большом множестве ходов.
    Но это пока недоказуемо. Может и меньше чем 5% ничьих у нее будет. Но то, что она ни разу никогда не выиграет у программы
    с 32-фигурной базой, даже с миллионом партий (1.000.000) - вот это уже совершенно точно!
    Выиграть точно невозможно. Но игра будет интересной. :)
    sovaz1997 и nh2008 нравится это.
  11. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    2.968
    Симпатии:
    721
    Репутация:
    28
    Оффлайн
    Это будут форсированные варианты и размены.
    Вообще, можно провести эксперимент. Взять какой-нибудь эндшпиль, ничейный, но не тривиальный, например Л+С против Л, или Ф+2 крайние пешки против Ф, и посмотреть, как его будут разыгрывать по базам против движка без баз.
  12. SkipperNorton Новичок

    • Новичок
    Рег.:
    04.05.2016
    Сообщения:
    19
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    Можно. Только движок должен быть специалзированный. Т.е. не просто -
    1) помотрел в базу на глубину 1 полуход, увидел что из 40 варантов - 20 приводят к ничьёй, и любой ход из них рандомно выбрал.

    а так -

    1) посмотрел в базу на глубину 5-6 полуходов и даже больше, и увидел, в каких случаях у противника минимизируется
    вероятность не сделать ошибку, т.е. меньше множесто ходов при которых он не проигрывает.

    Только я такой программы не писал сам, и еще не видел, чтобы она где то существовала.
    Но по факту, ее можно и создать, было бы желание.

    А то что ферзь + две связанные крайние пешки не выигрывает против ферзя, это конечно сенсационная новость была. После того как было обнаружено с генератором эндшпильных таблиц.
  13. nh2008 Учаcтник

    • Участник
    Рег.:
    01.12.2013
    Сообщения:
    2.183
    Симпатии:
    2.264
    Репутация:
    221
    Нарушения:
    10
    Адрес:
    Украина
    Оффлайн
    Я так и полагал. Тогда вообще не понятно что значит 4200.
    --- добавлено: 20 янв 2018 ---
    Это верно лишь в случае, если начальная позиция ничейна. Если же она выиграна, выиграть будет возможно. У Вас есть доказательство, что начальная позиция ничейна?
  14. SkipperNorton Новичок

    • Новичок
    Рег.:
    04.05.2016
    Сообщения:
    19
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    У меня только гипотеза того что начальная позиция ничейна.
  15. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.853
    Симпатии:
    11.647
    Репутация:
    718
    Нарушения:
    21
    Оффлайн
    ода ниму
    хорошая была тема изначально, теперь там Полоудин
    nn нравится это.
  16. SkipperNorton Новичок

    • Новичок
    Рег.:
    04.05.2016
    Сообщения:
    19
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    Значит, можно и на своём домашнем компьютере запрограммировать эмуляцию нейронной сети,
    обучить её (месяц-полгода-год будет играть в шахматы сама с собой) - и получится программа, уровня
    Стокфиш или Комодо (Гудини)? И не нужен никакой перебор на глубину в 20 полуходов :)

    А если удачнее чем в Google придумать как учить свою нейронную сеть на компьютере, то может быть
    будет играть и лучше чем АльфаЗеро, и против лучшего Стокфиш - наберет 90% очков.
    Интересно потом и в адванс играть с такой программой.
  17. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.798
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Оффлайн
    Может оказаться, что такая программа не будет играть по плану, а будет нападать на фигуры в надежде на простые одноходовые зевки.
  18. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Цифры я тут так, почти с потолка взял, там может быть и 5200. Вообще специалисты наверное могут примерно рассчитать рейтинг такой базы относительно того же стокфиша.
  19. просроченый_кмс Учаcтник

    • Участник
    Рег.:
    15.02.2010
    Сообщения:
    955
    Симпатии:
    67
    Репутация:
    0
    Оффлайн
    БУДУЩЕЕ, ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ, НОВЫЕ ТЕХНОЛОГИИ, РИСКИ КОМПЬЮТЕРНЫХ СИСТЕМ, РОБОТЫ
    ДУМАТЬ САМИМ ИЛИ РАЗУМОМ ИИ?
    https://kiwibyrd.org/2017/10/07/1710/

    Искусственный интеллект может заменить пилотов в воздушном бою
    Робот ALPHA побеждает опытных пилотов-истребителей в каждом бою, используя мощность простого компьютера стоимостью $35
    http://zoom.cnews.ru/rnd/news/top/iskusstvennyj_intellekt_mozhet_zamenit_pilotov_v_vozdushnom_boyu
  20. nh2008 Учаcтник

    • Участник
    Рег.:
    01.12.2013
    Сообщения:
    2.183
    Симпатии:
    2.264
    Репутация:
    221
    Нарушения:
    10
    Адрес:
    Украина
    Оффлайн
    - Петька, приборы.
    - Тридцать.
    - Что "тридцать"?
    - А что "приборы"?
    Вряд ли такой низкий будет коэффициент. Может быть несколько миллионов, а может быть и миллиардов ... :confused::idntknow:
    Вот где есть простор показать класс асам теорвера. :pray:
    А может быть надо будет придумать какую-нибудь другую оценочную шкалу, т.к. абсолют достигнут.
  21. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    2.968
    Симпатии:
    721
    Репутация:
    28
    Оффлайн
    Есть специальная тема про ИИ, незачем оффтопить в теме про AlphaZero и шахматы.
    http://kasparovchess.crestbook.com/threads/6365/
    Комсюк нравится это.
  22. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Дорогие друзья !
    Насколько мне удалось понять , преимущество Альфы было в самообучении - то есть автоматизированном
    получении Оценочной Функции . Которая и оказалась более точной чем у Стокфиша (созданная вручную) .

    Если это так , возможен ли вариант передачи Гуглом и пересадка в Стокфиш этой самой уточненной ОФ ?
  23. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    Увы, как показывает пример Го, обученной нейросетью Гугл вряд ли поделится. Так что придется обучать самостоятельно. :)

    Оценочная функция Стокфиша, кстати, тоже отчасти настраивается автоматически. Оцениваемые параметры выбираются вручную, но подбор "весов" для этих параметров автоматизирован. В целом, ОФ Стока конечно намного слабее, но зато работает быстрее. До появления правильных методов тренировки нейросетей скорость была эффективнее качества оценки для шахматных движков. Кстати, разобрать оценочную функцию Стока "на пальцах" можно здесь:
    https://hxim.github.io/Stockfish-Evaluation-Guide/

    Нейросетка Альфы не только берёт на себя обязанности Оценочной Функции, но отчасти и Функции Поиска. То есть, помимо оценки позиции, она ещё и рекомендует перспективные ходы. В этом отношении её рекомендации пересекаются с переборными эвристиками Стокфиша. Возможно (но не обязательно) здесь может возникнуть дублирование, избыточный счёт и соответственно неэффективная работа вместе. Кроме того, большая нейросеть высчитывает свои оценки очень медленно, а традиционные алгоритмы рассчитаны на быструю работу. Так что эффективно совместить их может оказаться не тривиальной задачей.

    Натренировать маленькую, но быструю нейросеть может тоже оказаться не лучшим решением, поскольку как показали недавние тесты скорости, в шахматах топовые видеокарты сильно теряют в эффективности на маленьких нейросетках. То есть, выходит что малоразмерные нейросетки тоже не слишком быстры. Народ сейчас только начал пробовать разные варианты, так что может быть в конце концов из этого что-то и выйдет. Но также вполне возможно, что потребуется "изобрести" ещё какие-то новые методы обучения.
  24. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Это странно .
    Гугл не хочет сыграть ещё матч по причине того , что им это не нужно , другие цели , все такое . Деньги им не нужны ...
    Так почему бы не передать ОФ ?
    Нельзя же быть такой собакой на сене .

    Альфа доказала в матче , что лучше медленно , но с более тонкой оценкой .

    Что значит "рекомендует перспективные ходы " ?
    На основании чего рекомендует ?
    Я вижу только один вариант - на основании все того же перебора и ОФ.


    Наверняка это не столь примитивно .
    Но принципиально то возможно ?

    Будет новый шахматный монстр - считать быстро как Сток , а оценивать так же тонко как Альфа .
  25. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.853
    Симпатии:
    11.647
    Репутация:
    718
    Нарушения:
    21
    Оффлайн
    В прошедшем матче ничего не доказала
    Mustitz и nh2008 нравится это.
  26. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Вы же разверните мысль . Что было не так в матче ?
  27. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.853
    Симпатии:
    11.647
    Репутация:
    718
    Нарушения:
    21
    Оффлайн
    отсюда начинать
  28. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    108
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    ну наверное не стоит так уж категорично....
    Кое что все таки доказала, например то , что во многом другой алгоритм тоже имеет право на существование, полностью автоматическое обучение не требует эвристики, зато требует специфических команд процессора для перемножения матриц.Потраченные ресурсы на обучения не пропадают и сеть может быть доучена позднее с текущего уровня.
    В принципе возможно коммерческое создание некой экосистемы, вполне себе самодостаточной и коммерчески привлекательной.
  29. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    2.968
    Симпатии:
    721
    Репутация:
    28
    Оффлайн
    Это невозможно.
  30. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.853
    Симпатии:
    11.647
    Репутация:
    718
    Нарушения:
    21
    Оффлайн
    А если взять с цитатой, на которую я отвечал?
  31. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Просто невозможно и всё ?
    Не хотите развернуть свою мысль ?
  32. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    2.968
    Симпатии:
    721
    Репутация:
    28
    Оффлайн
    Чем точнее и сложнее ОФ тем большего объема вычислений она требует и тем меньше раз её можно выполнить в секунду (на одинаковом железе). Разве это не очевидно?
    Вы предлагаете сделать машину, такую же быструю, как автомобиль Ф1 и такую же грузоподъемную, как Белаз. Так не бывает.
  33. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    Может быть что-то ещё состоится. Хассабис вроде бы в твиттере писал о какой-то публикации.

    Возможно потому, что имиджевые плюсы от этого будет получать уже не Гугл, а другие организации. За счёт Гугла. Если нейросеть будет доступна, то устроить матч с "правильными" результатами не так уж сложно.

    Оценочная функция Стокфиша вычисляет только одно число - оценку позиции. Нейросеть Альфы вычисляет не только оценку позиции, но и предоставляет список ходов с процентной вероятностью "перспективности" каждого из них. И всё это без перебора, только на основании самой позиции и её истории. И только затем эти данные используются в переборе методом Монте-Карло (MCTS).

    К сожалению, даже принципиальная возможность для получения топового уровня из смеси Стока и Альфы ещё не совсем понятна.

    Нейросеть Альфы потому и даёт более тонкую оценку, потому что она производит намного больше вычислений чем ОФ Стока. Если очень упрощенно, то ОФ Стокфиша, можно представить как сетку вычислений из одного слоя, а нейросеть Альфы, как сетку из сорока слоёв, из которых каждый последующий вычисляется только после получения результатов предыдущего.
  34. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Насколько я понимаю , свою ОФ Сток вычисляет в 1000 раз быстрее чем Альфа свою .
    А что будет если поменять ? Как минимум , Сток догонит Альфу по уровню , если говорить о равном железе .
    --- добавлено: 21 янв 2018, опубликовано: 21 янв 2018 ---
    Не совсем ясно . Сток набрал свою глубину , оценил миллионы позиций - и обладает списком ходов -кандидатов , и оценкой каждого продолжения . Оценка соответствует перспективности . Все как у Альфы.

    Как Альфа без перебора получает список рекомендуемых ходов , на основании позиции ?

    То есть , по сути Альфа это более мощное железо , и ничего более ?
    --- добавлено: 21 янв 2018 ---
    То есть , у Альфы 40 вариантов ОФ , а у Стока 1 ? Можно ли замедлить Сток в 40 раз , чтобы произвести все вычисления как Альфа ?
  35. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    Альфа состоит из нейросети и переборной схемы методом Монте-Карло (MCTS). Нейросеть Альфы навроде черного ящика - мы просто подаём на вход нейросети позицию, а на выходе получаем оценку и список ходов. Какие там "соображения" она сформировала в процессе обучения мы не совсем представляем.

    ОФ Стока это по сути быстрая прикидка оценки, всё остальное отдаётся на откуп поисковой функции. Нейросеть альфы, это тщательное изучение каждой позиции на дереве перебора, а сам перебор менее изощренный. Даже на сходном железе Альфа будет больше расчётов вкладывать в оценку, а Сток в "умный" перебор.

    Не совсем понял... Если ОФ Стока, условно, в 40 хуже оценивает позицию, а затем её еще и в 40 раз замедлить, то тогда она будет в 1600 раз хуже оценивать.

Поделиться этой страницей