AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Будет забавно, если Лейла каждый новый дивизион будет проходить со второй попытки - когда полтора разраба все же разберутся с версиями нейросетей.
    А к этому все может и прийти...
  2. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    А к тому времени, когда она наконец доберется до Стокфиша, разработчики того прикрутят ему собственную NN-eval и элементы из поиска UCT.
    NN-Ахиллес никогда не догонит AB-черепаху.
  3. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    656
    Симпатии:
    291
    Репутация:
    7
    Онлайн
    Если Стокфишу прикрутят NN-eval, то он превратится в нейронный движок. И соответственно переборные движки уйдут в прошлое.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    Я думаю, будущее за гибридными методами. Во всяком случае, в поиске. В эндшпиле методу Монте-Карло с брутфорсом тягаться трудно...
  5. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    656
    Симпатии:
    291
    Репутация:
    7
    Онлайн
    Что значит гибридный? Есть два подхода к оценке позиции. Первый - быстрый алгоритмический, второй - медленный нейронный. Разница в скорости оценки в тысячи раз. Как их можно совместить? Либо используем алгоритмическую оценку что позволяет перебирать очень много позиций, и получаем переборный движок. Либо используем нейронную оценку, перебираем в 1000 раз меньше позиций, и получаем нейронный движок.
  6. Пломбир Новичок

    • Новичок
    Рег.:
    09.04.2018
    Сообщения:
    34
    Симпатии:
    25
    Репутация:
    0
    Оффлайн
    Да мне кажется, что в гибридных подходах - огромное не паханное поле для экспериментов. От одновременного параллельного рассчета вариантов до проверки вариантов друг друга. Можно нейросетью не искать лучшие, а выкидывать худшие ветви. Там на самом деле если поразмыслить, то столько идей, что времени и ресурсов не знаешь, где взять для проверки... Все только начинается
    sovaz1997 нравится это.
  7. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    656
    Симпатии:
    291
    Репутация:
    7
    Онлайн
    А кто знает, что значит оценка в пешках у нейронных движков? Они же по идее вероятность победы и поражения должны выдавать. Эта вероятность пересчитывается по какой-то формуле в пешки или как сделано?
  8. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    493
    Симпатии:
    180
    Репутация:
    21
    Оффлайн
    По формуле.
    Undying нравится это.
  9. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    Leela Chess Zero uses a winrate score in the range [0,1]. Winrate is actually an expected score, including draws. This expected score is converted to a traditional centi-pawn (cp) eval. Release v0.7 uses the formula: cp = 290.680623072 * tan(3.096181612 * (expected_score - 0.5)). Future releases will tune this formula to match traditional cp evals.

    https://github.com/LeelaChessZero/lc0/wiki/FAQ
    Michael-13 и Undying нравится это.
  10. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    656
    Симпатии:
    291
    Репутация:
    7
    Онлайн
    Тогда все претензии по поводу неадекватности оценки нужно не нейронному движку предъявлять, а только этой формуле. Вероятность победы 0.6 пересчитывается в 1.57 пешки, вероятность 0.8 - в 4.7 пешки. Это очень много. Для переборного движка 4.7 пешки это гарантированная победа, а 1.57 пешки это вероятность 0.8 где-то. То есть лилины оценки нужно на 3 делить, тогда они будут похожи на правду.
    sovaz1997 нравится это.
  11. Пломбир Новичок

    • Новичок
    Рег.:
    09.04.2018
    Сообщения:
    34
    Симпатии:
    25
    Репутация:
    0
    Оффлайн
    Слова.. слова... о каких "сотнях проггеров" речь, когда за последние два месяца автор, например, движка Ethereal сделал гораздо больше работы, чем команда стокфиша? ))) Так это ладно... для проверки различных идей использовалась машина с 200 ядрами. И все молятся на этого китайца, кто задонатил сею вундервафлю. Когда бы знать, где найти таких помошников, тогда бы может и сдвинулось все с мертвой точки... а так... реальность другая, - а именно: не хватает ни рук, ни железа
  12. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    367
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    Если посмотреть по патчам, то автор Ethereal за последние 2 месяца работал не меньше, чем вся команда Stockfish за эти же 2 месяца.
  13. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.815
    Симпатии:
    291
    Репутация:
    20
    Адрес:
    Киев
    Оффлайн
    Это с таблицами Налимова тяжело тягаться. Смысла доигрывать роллаут дальше значения из таблицы Налимова никакого нет. Но если посмотреть на принципиальный вариант, то оба NN движка считают до голых королей.

    Тут хорошо видно, LC0 считает Principal variation глубоко в недрах таблиц Налимова. Более того, я уверен что с обилием ничейных результатов существенная часть просматриваемых вариантов это таблицы Налимова. Сколько там вариантов без размена ладей в сложном ладейном окончании с пешками “a” и “c”. Хотя оптимально на 51-м ходу оборвать расчёт с оценкой ½-½.

    Screenshot from 2018-08-13 20-32-38.png
  14. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    Кстати, АльфаЗеро со Стокфишем играла с таблицами или без?
  15. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    367
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    А разница между 2-м местом и LC0 всего лишь одно очко
  16. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    Надо было дрессировать ДеусаИкс не на партиях людишек, а на партиях Великой Проги.
  17. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Пора делать свой движок, с преферансом и куртизанками. Эта идея приходила очень многим людям уже в голову. Но судя по всему, никто пока не начал писать свой код.
  18. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Лейла, конечно, не вылетит.
    Но уже почти не верю, что она сможет выйти со 2-го места.
    Только если через часик-полтора сможет Pedone выиграть белым цветом, и то отрыв большой останется...
  19. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    656
    Симпатии:
    291
    Репутация:
    7
    Онлайн
    Что-то нахимичили с движком. Вместо того чтобы прибавить 150 пунктов Лила явно играет слабее, чем в четвертом дивизионе.
  20. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Та да
    Вот будет забавно, если старая версия Деуса (которая слабее прошлой Лейлы) выйдет во второй дивизион, а новая версия Лейлы возьмет и провалится.
  21. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.815
    Симпатии:
    291
    Репутация:
    20
    Адрес:
    Киев
    Оффлайн
    Не факт, что слабее: другие соперники, другие дебюты, просто случайности, ...
  22. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.815
    Симпатии:
    291
    Репутация:
    20
    Адрес:
    Киев
    Оффлайн
    Опять были некоторые шансы, но вместо 50. Rxg4 Лейла перешла в ничейный шестифигурник с лишним качеством.
  23. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
  24. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    367
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    В общем, все это - проблемы тестирования. В данном случае человек выложил тесты против древнего Komodo 9 (сейчас уже есть 12-я версия) из 100 партий. То, что он не разбирается в тестировании, это мягко сказано. Надо создавать распределенную систему тестирования, в общем (на основе OpenBench, например). Иначе мы так и будем в лотерею играть в турнире.

    Распределеная система позволит правильно масштабировать контроль времени NN-движка и AB-далека по-отдельности, можно будет делать тесты большого числа сетей с маленькой погрешностью.
  25. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    А что эти тесты дадут? Лила и дальше вне зависимости от результатов будет обучаться на своих партиях.
  26. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    367
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    Хотя бы для точного определения лучшей сети и дополнительных параметров. Также, возможно, улучшения поиска MCTS и т. д.
  27. loveorigami Учаcтник

    • Участник
    Рег.:
    15.05.2011
    Сообщения:
    101
    Симпатии:
    50
    Репутация:
    1
    Оффлайн
    Дуся (DeusX), тем временем, может выйти на второе место. И на 1,5 очка отрывается от Лилы
  28. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    656
    Симпатии:
    291
    Репутация:
    7
    Онлайн
    Вышел, победив Pedone черными. И имеет отличные шансы финишировать на втором месте. Со всеми лидерами он уже сыграл. А Arasan и Pedone еще между собой играть и с Ethereal.
  29. loveorigami Учаcтник

    • Участник
    Рег.:
    15.05.2011
    Сообщения:
    101
    Симпатии:
    50
    Репутация:
    1
    Оффлайн
    Дуся в плюсе )))
  30. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    После распедонивания Педона укушенная Лила тоже наконец прочухалась и бросилась в погоню. Пока, правда, она только в полтиннике...
    А у Деуса назревает очередной Морфи-стайл против Бобика.
    sovaz1997 нравится это.
  31. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    1,5 очка до 2-го места за 10 туров до конца
    Боюсь, что шансов уже почти нет, да и ни одной победы над прогами из топ-4...
  32. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    367
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    Игра впечатлила. Интересно, что думает Stockfish о такой жертве коня.

    --
    PGN импортироваться не хочет :(
  33. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    656
    Симпатии:
    291
    Репутация:
    7
    Онлайн
    Лила что-то совсем странно играет. Мало того, что любит черными в дебюте жертвовать пешки непонятно за что. Так еще и грубо зевает. Сейчас с Арасаном сидела без пешки, на 29 ходу ей привиделось, что она перехватывает (оценку поменяла с 0.96 до -0.24). А после самого естественного ответа белых обнаружила что проигрывает (оценка после 30. с6+ стала 7.76).

    Хорошо хоть Деус реноме нейронных движков поддерживает.
    WinPooh нравится это.
  34. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    Думается, они хотели как лучше. Но оказались плохо знакомы с творчеством В.С.Черномырдина.
  35. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.593
    Симпатии:
    1.867
    Репутация:
    78
    Адрес:
    Москва
    Онлайн
    Не повезло Деусу - получил с раздачи русскую партию, и полез в вариант, про который даже третьеразрядникам рассказывают, чтоб так не играли.
    sovaz1997 нравится это.

Поделиться этой страницей