AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Пока что лейла сделала 4 ничьи с прогами из нижней части, и будет аж на 2,5 очка (!!!) отставать от Этериала - тот с минуты на минуту будет иметь 5,5 из 6.
    Я вполне допускаю, что дальше у Лейлы будет все лучше, но чет не верю, что Этериал она догонит
  2. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    Ну, здесь играет BobCat, у которого проигрыш в 41 ход обоим NN-движкам))

    Даже если не догонит, должна быть близко. 2.5 очка разницы может сохраниться до конца турнира. Посмотрим, в общем, как все будет.
  3. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Ну одна из ключевых партий на всю первую часть турнира - это встреча Лейлы с Педоном. Ибо если Лейла проиграет черными, то там почти наверняка будет отрыв в 2 очка даже от второго места (этот же Педон сейчас будет играть с аутсайдером Арасаном).

    Пока что Лейла недобирает очки - с тем же Арасаном была шикарная игра с жертвой двух качеств и переходом в эндшпиль, но не хватило...
    sovaz1997 нравится это.
  4. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    Вот в этом и дело, что LCZero стояла хорошо, но не хватило. А когда у движка позиция лучше, вероятность победить выше. В общем, если результаты удалятся и Ethereal опять почти всех победить, а LCZero опять наделает ничьи, то будет повод задуматься.
  5. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Ща будет еще одна ничья Лейлы
    Ну полочка до второго места - это не критично...
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    Да, главное - пройти дальше. 1-м или 2-м - не имеет значения. А дальше будет очередной переход на новый уровень, в котором, возможно, и Ethereal не устоит)

    Интервью с автором Ethereal: http://www.chessdom.com/ethereal-chess-engine-leads-tcec-div-3-convincingly/
  7. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.917
    Симпатии:
    361
    Репутация:
    21
    Адрес:
    Киев
    Оффлайн
    Потому что усиление могло быть просто экспройтами предыдущей версии.
  8. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    У лейлы ща 7-я ничья будет, в 9-ти партиях
  9. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Лилу укусил Гири.
    Или какой-то злоумышленник подсунул ей в перерыве между этапами подборку из партий Леко, Петросяна и первого матча двух К.
  10. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Но про 3450 действительно очень смешно.
  11. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Ну вполне возможно, что на гугловских TPU у нее будет вполне себе 3450
    А вот на этом оборудовании, скорее, ее 3219 и есть
  12. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.917
    Симпатии:
    361
    Репутация:
    21
    Адрес:
    Киев
    Оффлайн
    Скорее это недостаток системы Эло вообще, когда появляются „неудобные“ соперники. Каспаров против Широва набирал 75% очков, но 200 пунктов разницы между ними не было.

    Очень может быть, что в процессе обучения новая сеть становится более неудобной для старой, но сила относительно других программ изменяется слабо.
  13. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    Не знаю, кто говорит про 3450, но то, что судить о силе игры по 9 партиям не стоит уже давно проверено.

    Также, 150 пунктов - это именно относительно AB-движков. Против себя - более 300.
  14. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Не знаю как в абсолютных цифрах, а в относительных обещали усиление в новом дивизионе на +100. А наблюдается пока -32.
  15. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Ну, вот и очередная встреча с лидером. Чтобы сохранить хоть какие-то шансы, Лиле надо всего-навсего совершить белыми подвиг... Но верится что-то с трудом.
  16. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Может, Лейле забыли сказать, что ничья более ценный результат, чем победа? Kappa
    8-я ничья в 10 партиях намечается, на этот раз с безоговорочным лидером.
  17. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    Очень быстро LCZero стала переходит в эндшпиль почему-то
  18. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Современные методы разработки. "Фигак-фигак - и в продакшен турнир".
  19. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    crem: "It turned out that even in div4 non-release binary was playing (I didn't know that). And then there were some configuration changes, and I cannot even find which exactly or where they were discussed."

    В общем, что-то не так с конфигурацией, похоже.
  20. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    "Никогда ещё я не выигрывал партию у противника, который был бы здоров и в хорошей форме" (Тарраш, что ли)
    "Никогда ещё я не выигрывал у программы, которая была бы правильной версии и хорошо сконфигурирована" (Ethereal)
    Undying нравится это.
  21. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    Будет забавно, если Лейла каждый новый дивизион будет проходить со второй попытки - когда полтора разраба все же разберутся с версиями нейросетей.
    А к этому все может и прийти...
  22. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    А к тому времени, когда она наконец доберется до Стокфиша, разработчики того прикрутят ему собственную NN-eval и элементы из поиска UCT.
    NN-Ахиллес никогда не догонит AB-черепаху.
  23. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    857
    Симпатии:
    382
    Репутация:
    9
    Оффлайн
    Если Стокфишу прикрутят NN-eval, то он превратится в нейронный движок. И соответственно переборные движки уйдут в прошлое.
  24. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Я думаю, будущее за гибридными методами. Во всяком случае, в поиске. В эндшпиле методу Монте-Карло с брутфорсом тягаться трудно...
  25. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    857
    Симпатии:
    382
    Репутация:
    9
    Оффлайн
    Что значит гибридный? Есть два подхода к оценке позиции. Первый - быстрый алгоритмический, второй - медленный нейронный. Разница в скорости оценки в тысячи раз. Как их можно совместить? Либо используем алгоритмическую оценку что позволяет перебирать очень много позиций, и получаем переборный движок. Либо используем нейронную оценку, перебираем в 1000 раз меньше позиций, и получаем нейронный движок.
  26. Пломбир Новичок

    • Новичок
    Рег.:
    09.04.2018
    Сообщения:
    35
    Симпатии:
    25
    Репутация:
    0
    Оффлайн
    Да мне кажется, что в гибридных подходах - огромное не паханное поле для экспериментов. От одновременного параллельного рассчета вариантов до проверки вариантов друг друга. Можно нейросетью не искать лучшие, а выкидывать худшие ветви. Там на самом деле если поразмыслить, то столько идей, что времени и ресурсов не знаешь, где взять для проверки... Все только начинается
    sovaz1997 нравится это.
  27. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    857
    Симпатии:
    382
    Репутация:
    9
    Оффлайн
    А кто знает, что значит оценка в пешках у нейронных движков? Они же по идее вероятность победы и поражения должны выдавать. Эта вероятность пересчитывается по какой-то формуле в пешки или как сделано?
  28. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    538
    Симпатии:
    197
    Репутация:
    21
    Онлайн
    По формуле.
    Undying нравится это.
  29. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Leela Chess Zero uses a winrate score in the range [0,1]. Winrate is actually an expected score, including draws. This expected score is converted to a traditional centi-pawn (cp) eval. Release v0.7 uses the formula: cp = 290.680623072 * tan(3.096181612 * (expected_score - 0.5)). Future releases will tune this formula to match traditional cp evals.

    https://github.com/LeelaChessZero/lc0/wiki/FAQ
    Michael-13 и Undying нравится это.
  30. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    857
    Симпатии:
    382
    Репутация:
    9
    Оффлайн
    Тогда все претензии по поводу неадекватности оценки нужно не нейронному движку предъявлять, а только этой формуле. Вероятность победы 0.6 пересчитывается в 1.57 пешки, вероятность 0.8 - в 4.7 пешки. Это очень много. Для переборного движка 4.7 пешки это гарантированная победа, а 1.57 пешки это вероятность 0.8 где-то. То есть лилины оценки нужно на 3 делить, тогда они будут похожи на правду.
    sovaz1997 нравится это.
  31. Пломбир Новичок

    • Новичок
    Рег.:
    09.04.2018
    Сообщения:
    35
    Симпатии:
    25
    Репутация:
    0
    Оффлайн
    Слова.. слова... о каких "сотнях проггеров" речь, когда за последние два месяца автор, например, движка Ethereal сделал гораздо больше работы, чем команда стокфиша? ))) Так это ладно... для проверки различных идей использовалась машина с 200 ядрами. И все молятся на этого китайца, кто задонатил сею вундервафлю. Когда бы знать, где найти таких помошников, тогда бы может и сдвинулось все с мертвой точки... а так... реальность другая, - а именно: не хватает ни рук, ни железа
  32. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    Если посмотреть по патчам, то автор Ethereal за последние 2 месяца работал не меньше, чем вся команда Stockfish за эти же 2 месяца.
  33. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.917
    Симпатии:
    361
    Репутация:
    21
    Адрес:
    Киев
    Оффлайн
    Это с таблицами Налимова тяжело тягаться. Смысла доигрывать роллаут дальше значения из таблицы Налимова никакого нет. Но если посмотреть на принципиальный вариант, то оба NN движка считают до голых королей.

    Тут хорошо видно, LC0 считает Principal variation глубоко в недрах таблиц Налимова. Более того, я уверен что с обилием ничейных результатов существенная часть просматриваемых вариантов это таблицы Налимова. Сколько там вариантов без размена ладей в сложном ладейном окончании с пешками “a” и “c”. Хотя оптимально на 51-м ходу оборвать расчёт с оценкой ½-½.

    Screenshot from 2018-08-13 20-32-38.png
  34. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Кстати, АльфаЗеро со Стокфишем играла с таблицами или без?
  35. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    547
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    А разница между 2-м местом и LC0 всего лишь одно очко

Поделиться этой страницей