AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    10.130
    Симпатии:
    9.307
    Репутация:
    504
    Оффлайн
    цитируемая книжка от Зиппорта это не книжка-убийца с длинными редкими ветками, а широкое полотно
    Но я уже приводил здесь партию, где Сток без книги заплывает во французской в тесте Седата (с другой, более специализированной книжкой)
    Игра начинается с +4.5
    Не веришь, что они все закончатся победой?
  2. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    14
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    По крайней мере много чего, и дело в том,что мой оппонент не совсем учитывает тот факт, что Гугл выложил только 10 игр из 28 проигранных Стоком, скорее всего они отбирались что бы показать интеллект A0, но даже в них есть такие,которые трудно повторить Стоку 8, так как он сделанный в матче с A0 ход не под каким видом не хочет повторять даже при гораздо худшем железе, что было с недоумением замечено некоторыми комментаторами (видео есть).
    То есть мнение, которое хочет создать Гугл , весьма предвзято.
    По любому оценки будут весьма приблизительные и моя цель только подчеркнуть что A0 и SF примерно равные игроки (даже на весьма не равном железе) и поставить под сомнение фразу :
    С вашими условиями вполне можно согласиться, именно так и тестируют обычно движки (с малоходовой книжкой).
  3. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    10.130
    Симпатии:
    9.307
    Репутация:
    504
    Оффлайн
    давайте опираться на факты!
    1. Партий было не 100
    2. Сток проиграл не 28
    3. Есть выигранные

    тут соглашусь

    А тут нет!
    Ни одного хода, якобы не Стокфиша 8, представлено не было
    sovaz1997 нравится это.
  4. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    14
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    Речь не об этом, а о том, что при том сочетании контроля, хеша и числа ядер,тот ход, который не был бы в первой линии при нормальных параметрах игры оказался в первой линии.

    те 10, что выложены, были из числа 28 проигранных в матче из 100 игр
    (если верить Гуглу)
    Разумеется этим одним матчем дело не ограничилось ... (полный список итогов всех матчей вполне доступен)
  5. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    10.130
    Симпатии:
    9.307
    Репутация:
    504
    Оффлайн
    если об этом, то ролик можно было не приводить :)
    с ходом Лf8 мы выяснили здесь месяц назад
  6. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    308
    Симпатии:
    27
    Репутация:
    1
    Оффлайн
    Это твой твинк?:D

    Я об этих более-менее справедливых условиях (для обоих участниках матча) писАл страниц двадцать назад. Альфаман/альфафоб тут не применимо.

    Ну здрасти! А талевские атаки в новоиндийке с жертвами, а избиение в испанке, а жертва фиги во французской?


    Дебютное дерево в шахматах слишком широкое, все посчитать не получится, тем более в каких-нить кривых дебютах типа старушки или французской движки типа стока буксуют довольно часто.


    Тут мы опять упираемся в границы перебора, о чем я и писал. Пусть у тебя книга на 30 полуходов проанализирована, а соперник на 35 считает. И эти нули превращаются в дырку от бублика. Помню ловил таких ребят еще когда в переписку играл, тогда любителей идеевской книги с оценками было много.

    Ты веришь, что движок 100 раз пойдет в этот один кривой вариант? Я такие книжки с кривыми вариантами сам клепал когда на плече играл лет 10 назад (а то и 15, когда рулили фрицы 5, 6 и 7:gigi:), даже тогда движки через раз лезли в такие варианты (подловить не так легко было), а уж сейчас еще меньше лезут, т.к. на 400-500-600 пунктов сильнее играют и рандомят при поражении другой дебют(вариант).
  7. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    10.130
    Симпатии:
    9.307
    Репутация:
    504
    Оффлайн
    нет, я его встречал в похожих темах на других ресурсах

    а я помню...
    Но книга 8-10 это не справедливость, а фикция

    Будем десятком партий восторгаться, а в проигранных, возможно, одноходовые зевки :)

    Так вот пусть соперник (вернее, соперница) и покажет пересчитывание Стокфиша в этих условиях
    И, кстати, можешь поискать дырки в той книге
    Будет очень интересно (тебе в поиске... и нам, если найдёшь)
    --- добавлено: 1 фев 2018, опубликовано: 1 фев 2018 ---
    100 раз не пойдёт в один и тот же, но у тебя же и боковушки посчитаны...
    Если клепал, то зачем удивляться?

    Да уж, таперича, не то, что давеча
    Но в Гугле тоже "не дураки", при контроле минута на ход они дерево очень заузили
    --- добавлено: 1 фев 2018 ---
    Очень интересно!
    И где же у него хранится знание о проигрыше?
  8. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    31
    Симпатии:
    43
    Репутация:
    2
    Оффлайн
    Есть ещё новый бот minusGo, играющий в Go на доске 9x9, используя методы из AlphaZero (в отличие от Leela Zero который использует методы из AlphaGo Zero).
    https://online-go.com/player/481097/
    И вот ещё один похожий бот: https://online-go.com/player/495900/

    Кроме того, Google позавчера выложил реализацию AlphaGo Zero на tensorflow: https://github.com/tensorflow/minigo.
    Это не тот самый AlphaGo от Deepmind, а просто энтузиасты из Google написали совсем отдельную реализацию по статьям об AlphaGo, в качестве примера проекта, использующего Tensorflow.
    N1mTzo нравится это.
  9. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    14
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    Странно, я уж думал что её забросили?
    Ну может как нибудь и AlphaZero в свободное от работы время выложат :)
  10. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    9
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    В идеале, что бы сравнить алгоритмы Альфы и Стока , нужно дать и тому и другому хорошую книгу и заставить альфу чтобы она играла по ней.
    Эндшпильные базы то же можно дать обоим. Контроль часа по 1.5 каждому. Ну и с хешом прблему как то тоже можно решить. И тогда весь вопрос останется только в железе. И если железо удасться приравнять, (хоть я и болею за стока) думаю перевёс всё же будет за Альфой.
  11. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    31
    Симпатии:
    43
    Репутация:
    2
    Оффлайн
    Ага, а в миттельшпиле заставить чтобы альфа играла так же как стокфиш!

    Если AlphaZero "понимает" дебюты лучше, чем "хорошая книга", то не понятно, зачем её заставлять играть по книге.
    А Stockfish'у можно книгу разрешить, да.

    Насчёт эндшпильной базы -- более трудный вопрос.
    Стокфишу вполне можно её выдать, но это будет бесспорное преимущество у стокфиша.
    Выдавать ли базу AlphaZero -- зависит от вопроса, на который надо ответить. Если "играет ли движок, построенный исключительно на нейронных сетях, лучше классических", то выдавать не надо. А если "надо построить как можно более сильный движок" -- то выдавать нужно.
  12. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    14
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    Имеется в виду переучить A0? Что бы она обучалась по книге?
    думаю что это шаг назад, она и так сыграв 44 млн игр неплохо научилась и содержит в себе книгу ничуть не хуже.
    Вполне можно и даже Cerebellum целиком дать,тем более что это как раз именно та, которая по SF и создана.
    Вопрос довольно не трудный, считается что концовка в теории хорошо отработана и играть там не интересно, эндшпильная база нужна что б не тратить время зазря, раз уже и так известен результат. Мы же не хотим проверить ЭБ? (Про них и так всё изветсно)
    p.S. К тому же до эндшпиля ещё надо как то дожить.... Не всем удается...
  13. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    9
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Нет не обучалась, а просто первые ходы и альфа и сток должны делать строго по книге, и и после определенного хода включаться в игру.
  14. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    14
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    Ну так книга то ведь не Богом данная (чай не Библия :) ), наверняка есть много достойных ходов, которых там нет и A0 их может найти при обучении или при игре.
  15. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    14
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    А вот если чуток вернуться , то я не поленился сделать картинку
    [​IMG]
    Из которой и следует что правильный ход уже рассчитывается после 3 млрд позиций примерно через 42 с (что меньше 1 мин) и более не меняется ,по крайней мере до 1 мин (до 4.6 млрд позиций).
    И он сделан SF8 исключительно из-за маленького хеша
  16. zeroalphazero Новичок

    • Новичок
    Рег.:
    14.12.2017
    Сообщения:
    94
    Симпатии:
    42
    Репутация:
    0
    Оффлайн
    Для AlphaZero уже не совсем актуально.
  17. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    14
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    От версии SF это не зависит, это системная ошибка организаторов матча A0 и SF
  18. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    426
    Симпатии:
    980
    Репутация:
    63
    Оффлайн

Поделиться этой страницей