Leela Chess Zero (lc0): турниры, партии, рейтинги...

Discussion in 'Машинное отделение' started by vasa, 10 Oct 2018.

  1. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    У меня запись умещается в 6х64 бита, так что в принципе это просто немного другой подход. Не сильно сэкономишь на размере таблицы и по тестам увеличение размера таблицы не слишком повышает силу. Зато я не проверяю ход на легальность и не генерирую ходы если запись найдена.
    —- добавлено: 9 Feb 2019 —-
    Уже нет.
  2. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    А, ну в таком случае это очень даже неплохо.
  3. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Здесь Лила сыграла h6: ни Komodo на 128 ядрах, ни Stockfish на 176 ядрах этого не видели. Но потом опомнились.



    Stockfish писал какие-то +0,5, теперь +1,0-1,5 пишет. Это к тому, насколько там ab-движки точные))
    Undying likes this.
  4. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.127
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Удивительно, что на CCC тем временем Лила проигрывает в одну калитку. Там какая-то другая версия играет, или блиц-контроль настолько хуже ей даётся?
  5. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Там играет 40-я (которую не так давно начали обучать).

    Причем, похоже, каждый раз самая новая: "Whatever the latest T40 net is at the start of each game". Т. е. если турнир продлить на год, к концу года будет что-то вроде 11=1111=1==1 в пользу Лилы :D
  6. GKA Старожил

    • Участник
    • Старожил
    Member Since:
    05.11.2009
    Message Count:
    1.288
    Likes Received:
    533
    Репутация:
    6
    Оффлайн
    Смотрю матч Лилы со Стокфишем.

    Честно говоря это вообще не шахматы в классическом понимании.
    Все принципы всего нарушаются.)))

    Но играют конечно интересно - говорят - что еще и сильно.))...
  7. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Лила осознала, что шахматы ждет ничейная смерть и игра на выигрыш бессмысленна. 14 ничьих подряд в финале TCEC и ничьи во всех 14 партиях в ческомовском турнире. А вот более молодые и не столь мудрые Антифиш и Лиленштейн еще иногда побеждают. :)
  8. SKY Учаcтник

    • Участник
    Member Since:
    05.11.2018
    Message Count:
    190
    Likes Received:
    20
    Репутация:
    1
    Оффлайн
    Может просто разница в силе маленькая,была бы в 2000 эло,то ничьих скорее всего было бы мало.
  9. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Статья про будущее Leela Chess Zero: https://medium.com/@veedrac/leela-chess-test40-test50-and-beyond-c15896becfac
    Выглядит очень многообещающее. Как минимум, теперь я уверен, что TCEC 15 будет за Лилой. Конечно, вряд ли все идеи дадут прирост в силе игры, но я думаю, что как минимум 100-200 пунктов их этого выйдет. А может и больше :)
    Kirill_A likes this.
  10. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.127
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Исторический момент - Лила выходит вперёд в Суперфинале. И, кажется, в ответной партии добьётся ничьей и удержит лидерство.
  11. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.127
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Тем временем, дело идёт к "плюс два".
  12. Polarity Новичок

    • Новичок
    Member Since:
    24.04.2018
    Message Count:
    77
    Likes Received:
    17
    Репутация:
    0
    Оффлайн
    Середина суперфинала TCEC позади и Lc0 обыгрывает(!) последнюю версию Stockfish на 2 очка: https://tcec.chessdom.com/
  13. Challenger Spy Технический специалист

    • Команда форума
    Member Since:
    29.01.2011
    Message Count:
    5.295
    Likes Received:
    2.847
    Репутация:
    226
    Оффлайн
    Друзья, всем спасибо за ценную информацию! Жду замечаний и уточнений.
    Rom, Michael-13, Комсюк and 2 others like this.
  14. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    Довольно большая программа исследований, и неизвестно когда закончится , возможно таких сетей будет несколько, и большая сеть будет тренироваться ещё не скоро, не думаю что начало будет ранее начала мая, а обученная - к концу июня
  15. Strat7 Учаcтник

    • Участник
    Member Since:
    06.05.2017
    Message Count:
    806
    Likes Received:
    372
    Репутация:
    11
    Оффлайн
    Возможно дело идет к +3
    sovaz1997 likes this.
  16. Alhimik88 Новичок

    • Новичок
    Member Since:
    10.06.2009
    Message Count:
    81
    Likes Received:
    35
    Репутация:
    1
    Оффлайн
    Я надеюсь, что они будут проводить тестирования для определения потенциала новых фич, и их корректность работы. Конечно не дело каждую сеть на 50 миллионов игр тренировать. Разработчикам это должно быть очевидно.
  17. Strat7 Учаcтник

    • Участник
    Member Since:
    06.05.2017
    Message Count:
    806
    Likes Received:
    372
    Репутация:
    11
    Оффлайн
    Эх, что-то у лилы не срослось до +3 догнать, хотя преимущество было +7,8 по лиле и +2,27 по стоку
    2019-02-15_08-48-58.png 2019-02-15_08-48-20.png
    http://legacy-tcec.chessdom.com/archive.php?se=14&sf&ga=53

    Что интересно, из 8 проигрышей стока все они черными, лила проиграла 6 раз - 2б 4ч. Таким образом и в дальнейшем побед от лилы стоит ожидать скорее всего белыми.
  18. Strat7 Учаcтник

    • Участник
    Member Since:
    06.05.2017
    Message Count:
    806
    Likes Received:
    372
    Репутация:
    11
    Оффлайн
    А в чем?
    Ну и доп оценка стока +2 с лишним тоже показывает, что у стока были проблемы. Все таки +2 у компов, в отличие от людей, это обычно просто выигрыш.
  19. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Лила это в первую очередь нейронная оценка. Можно нейронный движок и на Альфа-Бета сделать. С перебором Лила связана намного меньше, так как просчитывает в 1000 раз меньше позиций, чем движки с алгоритмической оценкой, а играет сильнее. Да и вообще без перебора играет довольно неплохо.
    Kirill_A and crem like this.
  20. pavelgttfj8 Учаcтник

    • Участник
    Member Since:
    07.12.2017
    Message Count:
    290
    Likes Received:
    90
    Репутация:
    3
    Оффлайн
    Да это ничья была все равно. Такая ничья, которую стокфиш оценивал на +2.27
    sovaz1997 likes this.
  21. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    https://lichess.org/@/LeelaNice это лила, которая делает перебор на только на около 30 узлов (местами это 2 полухода, но в основном 1 полуход).
    Это почти без перебора. Совсем-совсем без перебора — почти то же самое.
    Alhimik88 and Undying like this.
  22. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    Для каждой позиции нейронная сеть выдаёт:
    - Оценку позиции (от -1 до 1). В этом случае её можно выбросить.
    - Для каждого хода, априорную вероятность, что этот ход окажется лучшим (аналог сортировки ходов из классических движков)

    Так вот, если просто брать позицию и выбирать ход с максимальной априорной вероятностью, безо всяких поисков монте-карло вообще, то оно будет играть в силу где-то 2350 Elo.

    Видно например тут: https://docs.google.com/spreadsheet...-HecIyLJ0BEAPvp63L59DTrY4/edit#gid=1729484756
    Нижняя синяя линия — это лила, играющая таким образом, откалиброванная (как-то) по SF9.
    Alhimik88 likes this.
  23. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    Ну попробуй например 32930, которая сейчас в TCEC играет. На графике у неё "всего" 2300 Elo, но должно быть достаточно. :)
    Alhimik88 likes this.
  24. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    :)) как тебе её "сюда" вынести?
    Говорю же, 32930. Вот прямая ссылка: http://lczero.org/get_network?sha=5c222ccd1ccbed2666b3a8ef94d8833d386d2168d51c3e99a0a3fc37a56d2569
    Но вообще любая пойдёт. И test40 уже может даже в такой конфигурации сильнее.

    Я не знаю точно, какая там процедура, но для оценки играются игры со Stockfish 9 на разных количествах узлов на ход (для которых рейтинг известен), а потом при помощи bayeselo вычисляется рейтинг сети.

    Я понимаю, что не верится, что просто сеть без поиска может так сильно играть, но она так сильно играет.

    Например, гроссмейстер Адам Тухаев играл на личесе против LeelaChess в конфигурации "30 узлов на ход" полторы недели назад (с контролем 5+2), и в основном он проигрывал.
    Alhimik88 likes this.
  25. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.127
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Там есть разница, тонкая и небольшая.
    Есть режим depth=1. В нём мы действительно перебираем все возможные ходы, после каждого делаем оценку с помощью value network, и выбираем ход с наилучшей для нас.
    А есть режим nodes=1. При этом мы в одном-единственном узле запускаем policy network, которая даёт на выходе вектор из вероятностей ходов, и опять выбираем наибольшую.
    Надо только отметить, что сейчас value network и policy network - это одна и та же сеть, с едиными входами и единой структурой. Разница только в выходных "головах" - есть value head, выдающая оценку в виде числа, и есть policy head, возвращающая вектор вероятностей.
    Так вот, 2300 - это результат для режима nodes=1. В случае depth=1 должна, по идее, играть ещё сильнее.
  26. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    Примерно так, если убрать некоторые "округления".
    - Я не знаю рейтинг IM и как шкалы Elo соотносятся друг с другом, но если верить википедии, 2300-2400 — это FM, а не IM.
    - Во-вторых, не "не сможет обыграть X", а "будет играть на уровне X". Но если под "не сможет обыграть" имеется в виду не отдельная партия, а турнир из десятка-другого партий, то может даже и соглашусь.

    В целом нейросеть "мгновенно, без перебора и уточнений" будет переигрывать человека позиционно и даже будет видеть простую тактику, но будет зевать комбинации и вообще тактику посложнее.
  27. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    Но вроде бы и тут, как вы писали, с введением новой матрицы дело пойдет на лад ?
    И сеть будет видеть тактику более чем на 1-2 хода?
    судя по тому, что это не проверяется на сети 50 ,то уже все проверено?
    так берите 32930 и сыграйте....
  28. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    А в чем разница между LeelaNice и LeelaChess? По силе игры в блиц между ними больше 400 пунктов различие. Это как раз разница между голой нейросетью и считающей 30 узлов ход?

    ps
    Или это нейросетки разные?
  29. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    :):). Я вам два раза уже дал ссылку на сеть, в каком вы виде предпочитаете?
    Совсем не знаю, кто такой Камон, но думаю, эта сеть у него выиграет. Рекомендую взять в одну руку Камона, во вторую сеть, и проверить самостоятельно. О полученных выводах напишите на этом форуме.
  30. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    Если вы имеете в виду новую policy head, то она будет (как ожидается) лучше распознавать тактические мотивы в разных частях доски, но всё равно потребуется счёт.
    Совсем без счёта сложную тактику не взять, но такое что счёт что-то в упор не видит и не пробует посчитать, должно уменьшиться.
    —- добавлено: 16 Feb 2019 —-
    LeelaChess играет в полную силу на GPU.
    LeelaNice играет на CPU, 30 nodes на ход (то есть можно сказать вообще не думает), и с чуть повышенным cpuct (чтоб приблизить стиль игру к человеческому).

    Когда Адам Тухаев играл с LeelaChess, её временно таким вот образом ослабили, чтобы можно было выиграть.
    После этих игр LeelaChess пару часов висела на таких настройках, и народу понравилась такая конфигурация (играет сильно, но можно словить на тактике), и поэтому после того, как LeelaChess вернулась на свою полную силу, параллельно запустили такую ослабленную LeelaNice.
    Alhimik88 and Undying like this.
  31. pavelgttfj8 Учаcтник

    • Участник
    Member Since:
    07.12.2017
    Message Count:
    290
    Likes Received:
    90
    Репутация:
    3
    Оффлайн
    Тем временем вы продолжаете смотреть миниатюру "KEV81 троллит тупостью разработчика Лилы"
    Комсюк, Alhimik88 and Undying like this.
  32. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Рейтинг 2100 у LeelaNice по двум причинам. Первое с ней мало кто играет рейтинговые партии. А второе у нее полностью отсутствует случайность в игре. Можно повторять выигранную партию сколько угодно раз. Чем некоторые пользуются: https://lichess.org/IefTOt78#15 Там 44 победы человека, но на самом деле это всего две разные партии. Остальные это просто повторения.

    По хорошему надо в Лилу какой-то рандомизатор добавить. И при играх с человеком его использовать.
    Alhimik88 likes this.
  33. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    28.05.2012
    Message Count:
    18.579
    Likes Received:
    10.946
    Репутация:
    688
    Оффлайн
    Да кто вы черт возьми такой чтоб меня не знать ?:no: Я вашу нейросеть труба шатал :gigi:
    Комсюк likes this.
  34. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    28.05.2012
    Message Count:
    18.579
    Likes Received:
    10.946
    Репутация:
    688
    Оффлайн
    Ну если ради науки, то придётся ушатать!
  35. Alhimik88 Новичок

    • Новичок
    Member Since:
    10.06.2009
    Message Count:
    81
    Likes Received:
    35
    Репутация:
    1
    Оффлайн
    А как у Камона ник на Личесс? Интересно же как Лила шатается! :)

    Это оценка через несколько секунд после хода, там Стокфиш уже на добавлениях играл. Эту партию в режиме реального времени анализировал Стокфиш на 176 потоках с 7-ми фигурками, вот он выигрыш нашел. Там белые осуществляют прорыв f5.

Share This Page