Leela Chess Zero (lc0): турниры, партии, рейтинги...

Discussion in 'Машинное отделение' started by vasa, 10 Oct 2018.

  1. KEV81
    Оффлайн

    KEV81 Учаcтник

    Репутация:
    6
    У меня запись умещается в 6х64 бита, так что в принципе это просто немного другой подход. Не сильно сэкономишь на размере таблицы и по тестам увеличение размера таблицы не слишком повышает силу. Зато я не проверяю ход на легальность и не генерирую ходы если запись найдена.
    —- добавлено: 9 Feb 2019 —-
    Уже нет.
     
    Last edited: 9 Feb 2019
  2. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    А, ну в таком случае это очень даже неплохо.
     
  3. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Здесь Лила сыграла h6: ни Komodo на 128 ядрах, ни Stockfish на 176 ядрах этого не видели. Но потом опомнились.



    Stockfish писал какие-то +0,5, теперь +1,0-1,5 пишет. Это к тому, насколько там ab-движки точные))
     
    Undying likes this.
  4. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Удивительно, что на CCC тем временем Лила проигрывает в одну калитку. Там какая-то другая версия играет, или блиц-контроль настолько хуже ей даётся?
     
  5. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Там играет 40-я (которую не так давно начали обучать).

    Причем, похоже, каждый раз самая новая: "Whatever the latest T40 net is at the start of each game". Т. е. если турнир продлить на год, к концу года будет что-то вроде 11=1111=1==1 в пользу Лилы :D
     
  6. GKA
    Оффлайн

    GKA Старожил

    Репутация:
    6
    Смотрю матч Лилы со Стокфишем.

    Честно говоря это вообще не шахматы в классическом понимании.
    Все принципы всего нарушаются.)))

    Но играют конечно интересно - говорят - что еще и сильно.))...
     
  7. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Лила осознала, что шахматы ждет ничейная смерть и игра на выигрыш бессмысленна. 14 ничьих подряд в финале TCEC и ничьи во всех 14 партиях в ческомовском турнире. А вот более молодые и не столь мудрые Антифиш и Лиленштейн еще иногда побеждают. :)
     
  8. SKY
    Оффлайн

    SKY Учаcтник

    Репутация:
    1
    Может просто разница в силе маленькая,была бы в 2000 эло,то ничьих скорее всего было бы мало.
     
  9. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Статья про будущее Leela Chess Zero: https://medium.com/@veedrac/leela-chess-test40-test50-and-beyond-c15896becfac
    Выглядит очень многообещающее. Как минимум, теперь я уверен, что TCEC 15 будет за Лилой. Конечно, вряд ли все идеи дадут прирост в силе игры, но я думаю, что как минимум 100-200 пунктов их этого выйдет. А может и больше :)
     
    Kirill_A likes this.
  10. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Исторический момент - Лила выходит вперёд в Суперфинале. И, кажется, в ответной партии добьётся ничьей и удержит лидерство.
     
  11. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Тем временем, дело идёт к "плюс два".
     
  12. Polarity
    Оффлайн

    Polarity Новичок

    Репутация:
    0
    Середина суперфинала TCEC позади и Lc0 обыгрывает(!) последнюю версию Stockfish на 2 очка: https://tcec.chessdom.com/
     
  13. Challenger Spy
    Оффлайн

    Challenger Spy Технический специалист Staff Member

    Репутация:
    226
    Друзья, всем спасибо за ценную информацию! Жду замечаний и уточнений.
     
    Rom, Michael-13, Комсюк and 2 others like this.
  14. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    Довольно большая программа исследований, и неизвестно когда закончится , возможно таких сетей будет несколько, и большая сеть будет тренироваться ещё не скоро, не думаю что начало будет ранее начала мая, а обученная - к концу июня
     
  15. Strat7
    Оффлайн

    Strat7 Учаcтник

    Репутация:
    11
    Возможно дело идет к +3
     
    sovaz1997 likes this.
  16. Alhimik88
    Оффлайн

    Alhimik88 Новичок

    Репутация:
    1
    Я надеюсь, что они будут проводить тестирования для определения потенциала новых фич, и их корректность работы. Конечно не дело каждую сеть на 50 миллионов игр тренировать. Разработчикам это должно быть очевидно.
     
  17. Strat7
    Оффлайн

    Strat7 Учаcтник

    Репутация:
    11
    Эх, что-то у лилы не срослось до +3 догнать, хотя преимущество было +7,8 по лиле и +2,27 по стоку
    2019-02-15_08-48-58.png 2019-02-15_08-48-20.png
    http://legacy-tcec.chessdom.com/archive.php?se=14&sf&ga=53

    Что интересно, из 8 проигрышей стока все они черными, лила проиграла 6 раз - 2б 4ч. Таким образом и в дальнейшем побед от лилы стоит ожидать скорее всего белыми.
     
    Last edited: 15 Feb 2019
  18. Strat7
    Оффлайн

    Strat7 Учаcтник

    Репутация:
    11
    А в чем?
    Ну и доп оценка стока +2 с лишним тоже показывает, что у стока были проблемы. Все таки +2 у компов, в отличие от людей, это обычно просто выигрыш.
     
  19. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Лила это в первую очередь нейронная оценка. Можно нейронный движок и на Альфа-Бета сделать. С перебором Лила связана намного меньше, так как просчитывает в 1000 раз меньше позиций, чем движки с алгоритмической оценкой, а играет сильнее. Да и вообще без перебора играет довольно неплохо.
     
    Kirill_A and crem like this.
  20. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Да это ничья была все равно. Такая ничья, которую стокфиш оценивал на +2.27
     
    sovaz1997 likes this.
  21. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    https://lichess.org/@/LeelaNice это лила, которая делает перебор на только на около 30 узлов (местами это 2 полухода, но в основном 1 полуход).
    Это почти без перебора. Совсем-совсем без перебора — почти то же самое.
     
    Alhimik88 and Undying like this.
  22. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Для каждой позиции нейронная сеть выдаёт:
    - Оценку позиции (от -1 до 1). В этом случае её можно выбросить.
    - Для каждого хода, априорную вероятность, что этот ход окажется лучшим (аналог сортировки ходов из классических движков)

    Так вот, если просто брать позицию и выбирать ход с максимальной априорной вероятностью, безо всяких поисков монте-карло вообще, то оно будет играть в силу где-то 2350 Elo.

    Видно например тут: https://docs.google.com/spreadsheet...-HecIyLJ0BEAPvp63L59DTrY4/edit#gid=1729484756
    Нижняя синяя линия — это лила, играющая таким образом, откалиброванная (как-то) по SF9.
     
    Alhimik88 likes this.
  23. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Ну попробуй например 32930, которая сейчас в TCEC играет. На графике у неё "всего" 2300 Elo, но должно быть достаточно. :)
     
    Alhimik88 likes this.
  24. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    :)) как тебе её "сюда" вынести?
    Говорю же, 32930. Вот прямая ссылка: http://lczero.org/get_network?sha=5c222ccd1ccbed2666b3a8ef94d8833d386d2168d51c3e99a0a3fc37a56d2569
    Но вообще любая пойдёт. И test40 уже может даже в такой конфигурации сильнее.

    Я не знаю точно, какая там процедура, но для оценки играются игры со Stockfish 9 на разных количествах узлов на ход (для которых рейтинг известен), а потом при помощи bayeselo вычисляется рейтинг сети.

    Я понимаю, что не верится, что просто сеть без поиска может так сильно играть, но она так сильно играет.

    Например, гроссмейстер Адам Тухаев играл на личесе против LeelaChess в конфигурации "30 узлов на ход" полторы недели назад (с контролем 5+2), и в основном он проигрывал.
     
    Alhimik88 likes this.
  25. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Там есть разница, тонкая и небольшая.
    Есть режим depth=1. В нём мы действительно перебираем все возможные ходы, после каждого делаем оценку с помощью value network, и выбираем ход с наилучшей для нас.
    А есть режим nodes=1. При этом мы в одном-единственном узле запускаем policy network, которая даёт на выходе вектор из вероятностей ходов, и опять выбираем наибольшую.
    Надо только отметить, что сейчас value network и policy network - это одна и та же сеть, с едиными входами и единой структурой. Разница только в выходных "головах" - есть value head, выдающая оценку в виде числа, и есть policy head, возвращающая вектор вероятностей.
    Так вот, 2300 - это результат для режима nodes=1. В случае depth=1 должна, по идее, играть ещё сильнее.
     
  26. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Примерно так, если убрать некоторые "округления".
    - Я не знаю рейтинг IM и как шкалы Elo соотносятся друг с другом, но если верить википедии, 2300-2400 — это FM, а не IM.
    - Во-вторых, не "не сможет обыграть X", а "будет играть на уровне X". Но если под "не сможет обыграть" имеется в виду не отдельная партия, а турнир из десятка-другого партий, то может даже и соглашусь.

    В целом нейросеть "мгновенно, без перебора и уточнений" будет переигрывать человека позиционно и даже будет видеть простую тактику, но будет зевать комбинации и вообще тактику посложнее.
     
  27. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    Но вроде бы и тут, как вы писали, с введением новой матрицы дело пойдет на лад ?
    И сеть будет видеть тактику более чем на 1-2 хода?
    судя по тому, что это не проверяется на сети 50 ,то уже все проверено?
    так берите 32930 и сыграйте....
     
  28. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А в чем разница между LeelaNice и LeelaChess? По силе игры в блиц между ними больше 400 пунктов различие. Это как раз разница между голой нейросетью и считающей 30 узлов ход?

    ps
    Или это нейросетки разные?
     
    Last edited: 15 Feb 2019
  29. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    :):). Я вам два раза уже дал ссылку на сеть, в каком вы виде предпочитаете?
    Совсем не знаю, кто такой Камон, но думаю, эта сеть у него выиграет. Рекомендую взять в одну руку Камона, во вторую сеть, и проверить самостоятельно. О полученных выводах напишите на этом форуме.
     
    Last edited by a moderator: 16 Feb 2019
  30. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Если вы имеете в виду новую policy head, то она будет (как ожидается) лучше распознавать тактические мотивы в разных частях доски, но всё равно потребуется счёт.
    Совсем без счёта сложную тактику не взять, но такое что счёт что-то в упор не видит и не пробует посчитать, должно уменьшиться.
    —- добавлено: 16 Feb 2019 —-
    LeelaChess играет в полную силу на GPU.
    LeelaNice играет на CPU, 30 nodes на ход (то есть можно сказать вообще не думает), и с чуть повышенным cpuct (чтоб приблизить стиль игру к человеческому).

    Когда Адам Тухаев играл с LeelaChess, её временно таким вот образом ослабили, чтобы можно было выиграть.
    После этих игр LeelaChess пару часов висела на таких настройках, и народу понравилась такая конфигурация (играет сильно, но можно словить на тактике), и поэтому после того, как LeelaChess вернулась на свою полную силу, параллельно запустили такую ослабленную LeelaNice.
     
    Last edited: 16 Feb 2019
    Alhimik88 and Undying like this.
  31. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Тем временем вы продолжаете смотреть миниатюру "KEV81 троллит тупостью разработчика Лилы"
     
    Комсюк, Alhimik88 and Undying like this.
  32. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Рейтинг 2100 у LeelaNice по двум причинам. Первое с ней мало кто играет рейтинговые партии. А второе у нее полностью отсутствует случайность в игре. Можно повторять выигранную партию сколько угодно раз. Чем некоторые пользуются: https://lichess.org/IefTOt78#15 Там 44 победы человека, но на самом деле это всего две разные партии. Остальные это просто повторения.

    По хорошему надо в Лилу какой-то рандомизатор добавить. И при играх с человеком его использовать.
     
    Alhimik88 likes this.
  33. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    688
    Да кто вы черт возьми такой чтоб меня не знать ?:no: Я вашу нейросеть труба шатал :gigi:
     
    Комсюк likes this.
  34. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    688
    Ну если ради науки, то придётся ушатать!
     
  35. Alhimik88
    Оффлайн

    Alhimik88 Новичок

    Репутация:
    1
    А как у Камона ник на Личесс? Интересно же как Лила шатается! :)

    Это оценка через несколько секунд после хода, там Стокфиш уже на добавлениях играл. Эту партию в режиме реального времени анализировал Стокфиш на 176 потоках с 7-ми фигурками, вот он выигрыш нашел. Там белые осуществляют прорыв f5.
     
    Last edited: 16 Feb 2019