AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    Пока что лейла сделала 4 ничьи с прогами из нижней части, и будет аж на 2,5 очка (!!!) отставать от Этериала - тот с минуты на минуту будет иметь 5,5 из 6.
    Я вполне допускаю, что дальше у Лейлы будет все лучше, но чет не верю, что Этериал она догонит
     
  2. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Ну, здесь играет BobCat, у которого проигрыш в 41 ход обоим NN-движкам))

    Даже если не догонит, должна быть близко. 2.5 очка разницы может сохраниться до конца турнира. Посмотрим, в общем, как все будет.
     
  3. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    Ну одна из ключевых партий на всю первую часть турнира - это встреча Лейлы с Педоном. Ибо если Лейла проиграет черными, то там почти наверняка будет отрыв в 2 очка даже от второго места (этот же Педон сейчас будет играть с аутсайдером Арасаном).

    Пока что Лейла недобирает очки - с тем же Арасаном была шикарная игра с жертвой двух качеств и переходом в эндшпиль, но не хватило...
     
    sovaz1997 likes this.
  4. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Вот в этом и дело, что LCZero стояла хорошо, но не хватило. А когда у движка позиция лучше, вероятность победить выше. В общем, если результаты удалятся и Ethereal опять почти всех победить, а LCZero опять наделает ничьи, то будет повод задуматься.
     
  5. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    Ща будет еще одна ничья Лейлы
    Ну полочка до второго места - это не критично...
     
  6. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Да, главное - пройти дальше. 1-м или 2-м - не имеет значения. А дальше будет очередной переход на новый уровень, в котором, возможно, и Ethereal не устоит)

    Интервью с автором Ethereal: http://www.chessdom.com/ethereal-chess-engine-leads-tcec-div-3-convincingly/
     
  7. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Потому что усиление могло быть просто экспройтами предыдущей версии.
     
  8. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    У лейлы ща 7-я ничья будет, в 9-ти партиях
     
  9. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Лилу укусил Гири.
    Или какой-то злоумышленник подсунул ей в перерыве между этапами подборку из партий Леко, Петросяна и первого матча двух К.
     
  10. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Но про 3450 действительно очень смешно.
     
  11. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    Ну вполне возможно, что на гугловских TPU у нее будет вполне себе 3450
    А вот на этом оборудовании, скорее, ее 3219 и есть
     
  12. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Скорее это недостаток системы Эло вообще, когда появляются „неудобные“ соперники. Каспаров против Широва набирал 75% очков, но 200 пунктов разницы между ними не было.

    Очень может быть, что в процессе обучения новая сеть становится более неудобной для старой, но сила относительно других программ изменяется слабо.
     
  13. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Не знаю, кто говорит про 3450, но то, что судить о силе игры по 9 партиям не стоит уже давно проверено.

    Также, 150 пунктов - это именно относительно AB-движков. Против себя - более 300.
     
  14. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Не знаю как в абсолютных цифрах, а в относительных обещали усиление в новом дивизионе на +100. А наблюдается пока -32.
     
  15. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Ну, вот и очередная встреча с лидером. Чтобы сохранить хоть какие-то шансы, Лиле надо всего-навсего совершить белыми подвиг... Но верится что-то с трудом.
     
  16. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    Может, Лейле забыли сказать, что ничья более ценный результат, чем победа? Kappa
    8-я ничья в 10 партиях намечается, на этот раз с безоговорочным лидером.
     
  17. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Очень быстро LCZero стала переходит в эндшпиль почему-то
     
  18. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Современные методы разработки. "Фигак-фигак - и в продакшен турнир".
     
  19. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    crem: "It turned out that even in div4 non-release binary was playing (I didn't know that). And then there were some configuration changes, and I cannot even find which exactly or where they were discussed."

    В общем, что-то не так с конфигурацией, похоже.
     
  20. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    "Никогда ещё я не выигрывал партию у противника, который был бы здоров и в хорошей форме" (Тарраш, что ли)
    "Никогда ещё я не выигрывал у программы, которая была бы правильной версии и хорошо сконфигурирована" (Ethereal)
     
    Last edited: 13 Aug 2018
    Undying likes this.
  21. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    Будет забавно, если Лейла каждый новый дивизион будет проходить со второй попытки - когда полтора разраба все же разберутся с версиями нейросетей.
    А к этому все может и прийти...
     
  22. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    А к тому времени, когда она наконец доберется до Стокфиша, разработчики того прикрутят ему собственную NN-eval и элементы из поиска UCT.
    NN-Ахиллес никогда не догонит AB-черепаху.
     
  23. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Если Стокфишу прикрутят NN-eval, то он превратится в нейронный движок. И соответственно переборные движки уйдут в прошлое.
     
  24. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Я думаю, будущее за гибридными методами. Во всяком случае, в поиске. В эндшпиле методу Монте-Карло с брутфорсом тягаться трудно...
     
  25. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Что значит гибридный? Есть два подхода к оценке позиции. Первый - быстрый алгоритмический, второй - медленный нейронный. Разница в скорости оценки в тысячи раз. Как их можно совместить? Либо используем алгоритмическую оценку что позволяет перебирать очень много позиций, и получаем переборный движок. Либо используем нейронную оценку, перебираем в 1000 раз меньше позиций, и получаем нейронный движок.
     
  26. Пломбир
    Оффлайн

    Пломбир Новичок

    Репутация:
    0
    Да мне кажется, что в гибридных подходах - огромное не паханное поле для экспериментов. От одновременного параллельного рассчета вариантов до проверки вариантов друг друга. Можно нейросетью не искать лучшие, а выкидывать худшие ветви. Там на самом деле если поразмыслить, то столько идей, что времени и ресурсов не знаешь, где взять для проверки... Все только начинается
     
    sovaz1997 likes this.
  27. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А кто знает, что значит оценка в пешках у нейронных движков? Они же по идее вероятность победы и поражения должны выдавать. Эта вероятность пересчитывается по какой-то формуле в пешки или как сделано?
     
  28. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    По формуле.
     
    Undying likes this.
  29. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Leela Chess Zero uses a winrate score in the range [0,1]. Winrate is actually an expected score, including draws. This expected score is converted to a traditional centi-pawn (cp) eval. Release v0.7 uses the formula: cp = 290.680623072 * tan(3.096181612 * (expected_score - 0.5)). Future releases will tune this formula to match traditional cp evals.

    https://github.com/LeelaChessZero/lc0/wiki/FAQ
     
    Michael-13 and Undying like this.
  30. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Тогда все претензии по поводу неадекватности оценки нужно не нейронному движку предъявлять, а только этой формуле. Вероятность победы 0.6 пересчитывается в 1.57 пешки, вероятность 0.8 - в 4.7 пешки. Это очень много. Для переборного движка 4.7 пешки это гарантированная победа, а 1.57 пешки это вероятность 0.8 где-то. То есть лилины оценки нужно на 3 делить, тогда они будут похожи на правду.
     
    sovaz1997 likes this.
  31. Пломбир
    Оффлайн

    Пломбир Новичок

    Репутация:
    0
    Слова.. слова... о каких "сотнях проггеров" речь, когда за последние два месяца автор, например, движка Ethereal сделал гораздо больше работы, чем команда стокфиша? ))) Так это ладно... для проверки различных идей использовалась машина с 200 ядрами. И все молятся на этого китайца, кто задонатил сею вундервафлю. Когда бы знать, где найти таких помошников, тогда бы может и сдвинулось все с мертвой точки... а так... реальность другая, - а именно: не хватает ни рук, ни железа
     
  32. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Если посмотреть по патчам, то автор Ethereal за последние 2 месяца работал не меньше, чем вся команда Stockfish за эти же 2 месяца.
     
  33. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Это с таблицами Налимова тяжело тягаться. Смысла доигрывать роллаут дальше значения из таблицы Налимова никакого нет. Но если посмотреть на принципиальный вариант, то оба NN движка считают до голых королей.

    Тут хорошо видно, LC0 считает Principal variation глубоко в недрах таблиц Налимова. Более того, я уверен что с обилием ничейных результатов существенная часть просматриваемых вариантов это таблицы Налимова. Сколько там вариантов без размена ладей в сложном ладейном окончании с пешками “a” и “c”. Хотя оптимально на 51-м ходу оборвать расчёт с оценкой ½-½.

    Screenshot from 2018-08-13 20-32-38.png
     
  34. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Кстати, АльфаЗеро со Стокфишем играла с таблицами или без?
     
  35. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    А разница между 2-м местом и LC0 всего лишь одно очко