Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 10 окт 2018.

  1. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    У меня запись умещается в 6х64 бита, так что в принципе это просто немного другой подход. Не сильно сэкономишь на размере таблицы и по тестам увеличение размера таблицы не слишком повышает силу. Зато я не проверяю ход на легальность и не генерирую ходы если запись найдена.
    —- добавлено: 9 фев 2019 —-
    Уже нет.
  2. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    А, ну в таком случае это очень даже неплохо.
  3. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Здесь Лила сыграла h6: ни Komodo на 128 ядрах, ни Stockfish на 176 ядрах этого не видели. Но потом опомнились.



    Stockfish писал какие-то +0,5, теперь +1,0-1,5 пишет. Это к тому, насколько там ab-движки точные))
    Undying нравится это.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.478
    Симпатии:
    3.077
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Удивительно, что на CCC тем временем Лила проигрывает в одну калитку. Там какая-то другая версия играет, или блиц-контроль настолько хуже ей даётся?
  5. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Там играет 40-я (которую не так давно начали обучать).

    Причем, похоже, каждый раз самая новая: "Whatever the latest T40 net is at the start of each game". Т. е. если турнир продлить на год, к концу года будет что-то вроде 11=1111=1==1 в пользу Лилы :D
  6. GKA Старожил

    • Участник
    • Старожил
    Рег.:
    05.11.2009
    Сообщения:
    1.282
    Симпатии:
    530
    Репутация:
    6
    Оффлайн
    Смотрю матч Лилы со Стокфишем.

    Честно говоря это вообще не шахматы в классическом понимании.
    Все принципы всего нарушаются.)))

    Но играют конечно интересно - говорят - что еще и сильно.))...
  7. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    Лила осознала, что шахматы ждет ничейная смерть и игра на выигрыш бессмысленна. 14 ничьих подряд в финале TCEC и ничьи во всех 14 партиях в ческомовском турнире. А вот более молодые и не столь мудрые Антифиш и Лиленштейн еще иногда побеждают. :)
  8. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    190
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    Может просто разница в силе маленькая,была бы в 2000 эло,то ничьих скорее всего было бы мало.
  9. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Статья про будущее Leela Chess Zero: https://medium.com/@veedrac/leela-chess-test40-test50-and-beyond-c15896becfac
    Выглядит очень многообещающее. Как минимум, теперь я уверен, что TCEC 15 будет за Лилой. Конечно, вряд ли все идеи дадут прирост в силе игры, но я думаю, что как минимум 100-200 пунктов их этого выйдет. А может и больше :)
    Kirill_A нравится это.
  10. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.478
    Симпатии:
    3.077
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Исторический момент - Лила выходит вперёд в Суперфинале. И, кажется, в ответной партии добьётся ничьей и удержит лидерство.
  11. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.478
    Симпатии:
    3.077
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Тем временем, дело идёт к "плюс два".
  12. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Середина суперфинала TCEC позади и Lc0 обыгрывает(!) последнюю версию Stockfish на 2 очка: https://tcec.chessdom.com/
  13. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.239
    Симпатии:
    2.812
    Репутация:
    226
    Оффлайн
    Друзья, всем спасибо за ценную информацию! Жду замечаний и уточнений.
    Rom, Michael-13, Комсюк и 2 другим нравится это.
  14. svoitsl Учаcтник

    • Участник
    Рег.:
    06.01.2018
    Сообщения:
    372
    Симпатии:
    90
    Репутация:
    7
    Оффлайн
    Довольно большая программа исследований, и неизвестно когда закончится , возможно таких сетей будет несколько, и большая сеть будет тренироваться ещё не скоро, не думаю что начало будет ранее начала мая, а обученная - к концу июня
  15. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    371
    Репутация:
    11
    Оффлайн
    Возможно дело идет к +3
    sovaz1997 нравится это.
  16. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    81
    Симпатии:
    35
    Репутация:
    1
    Оффлайн
    Я надеюсь, что они будут проводить тестирования для определения потенциала новых фич, и их корректность работы. Конечно не дело каждую сеть на 50 миллионов игр тренировать. Разработчикам это должно быть очевидно.
  17. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    371
    Репутация:
    11
    Оффлайн
    Эх, что-то у лилы не срослось до +3 догнать, хотя преимущество было +7,8 по лиле и +2,27 по стоку
    2019-02-15_08-48-58.png 2019-02-15_08-48-20.png
    http://legacy-tcec.chessdom.com/archive.php?se=14&sf&ga=53

    Что интересно, из 8 проигрышей стока все они черными, лила проиграла 6 раз - 2б 4ч. Таким образом и в дальнейшем побед от лилы стоит ожидать скорее всего белыми.
  18. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    371
    Репутация:
    11
    Оффлайн
    А в чем?
    Ну и доп оценка стока +2 с лишним тоже показывает, что у стока были проблемы. Все таки +2 у компов, в отличие от людей, это обычно просто выигрыш.
  19. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    Лила это в первую очередь нейронная оценка. Можно нейронный движок и на Альфа-Бета сделать. С перебором Лила связана намного меньше, так как просчитывает в 1000 раз меньше позиций, чем движки с алгоритмической оценкой, а играет сильнее. Да и вообще без перебора играет довольно неплохо.
    Kirill_A и crem нравится это.
  20. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    290
    Симпатии:
    90
    Репутация:
    3
    Оффлайн
    Да это ничья была все равно. Такая ничья, которую стокфиш оценивал на +2.27
    sovaz1997 нравится это.
  21. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    https://lichess.org/@/LeelaNice это лила, которая делает перебор на только на около 30 узлов (местами это 2 полухода, но в основном 1 полуход).
    Это почти без перебора. Совсем-совсем без перебора — почти то же самое.
    Alhimik88 и Undying нравится это.
  22. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Для каждой позиции нейронная сеть выдаёт:
    - Оценку позиции (от -1 до 1). В этом случае её можно выбросить.
    - Для каждого хода, априорную вероятность, что этот ход окажется лучшим (аналог сортировки ходов из классических движков)

    Так вот, если просто брать позицию и выбирать ход с максимальной априорной вероятностью, безо всяких поисков монте-карло вообще, то оно будет играть в силу где-то 2350 Elo.

    Видно например тут: https://docs.google.com/spreadsheet...-HecIyLJ0BEAPvp63L59DTrY4/edit#gid=1729484756
    Нижняя синяя линия — это лила, играющая таким образом, откалиброванная (как-то) по SF9.
    Alhimik88 нравится это.
  23. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Ну попробуй например 32930, которая сейчас в TCEC играет. На графике у неё "всего" 2300 Elo, но должно быть достаточно. :)
    Alhimik88 нравится это.
  24. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    :)) как тебе её "сюда" вынести?
    Говорю же, 32930. Вот прямая ссылка: http://lczero.org/get_network?sha=5c222ccd1ccbed2666b3a8ef94d8833d386d2168d51c3e99a0a3fc37a56d2569
    Но вообще любая пойдёт. И test40 уже может даже в такой конфигурации сильнее.

    Я не знаю точно, какая там процедура, но для оценки играются игры со Stockfish 9 на разных количествах узлов на ход (для которых рейтинг известен), а потом при помощи bayeselo вычисляется рейтинг сети.

    Я понимаю, что не верится, что просто сеть без поиска может так сильно играть, но она так сильно играет.

    Например, гроссмейстер Адам Тухаев играл на личесе против LeelaChess в конфигурации "30 узлов на ход" полторы недели назад (с контролем 5+2), и в основном он проигрывал.
    Alhimik88 нравится это.
  25. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.478
    Симпатии:
    3.077
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Там есть разница, тонкая и небольшая.
    Есть режим depth=1. В нём мы действительно перебираем все возможные ходы, после каждого делаем оценку с помощью value network, и выбираем ход с наилучшей для нас.
    А есть режим nodes=1. При этом мы в одном-единственном узле запускаем policy network, которая даёт на выходе вектор из вероятностей ходов, и опять выбираем наибольшую.
    Надо только отметить, что сейчас value network и policy network - это одна и та же сеть, с едиными входами и единой структурой. Разница только в выходных "головах" - есть value head, выдающая оценку в виде числа, и есть policy head, возвращающая вектор вероятностей.
    Так вот, 2300 - это результат для режима nodes=1. В случае depth=1 должна, по идее, играть ещё сильнее.
  26. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Примерно так, если убрать некоторые "округления".
    - Я не знаю рейтинг IM и как шкалы Elo соотносятся друг с другом, но если верить википедии, 2300-2400 — это FM, а не IM.
    - Во-вторых, не "не сможет обыграть X", а "будет играть на уровне X". Но если под "не сможет обыграть" имеется в виду не отдельная партия, а турнир из десятка-другого партий, то может даже и соглашусь.

    В целом нейросеть "мгновенно, без перебора и уточнений" будет переигрывать человека позиционно и даже будет видеть простую тактику, но будет зевать комбинации и вообще тактику посложнее.
  27. svoitsl Учаcтник

    • Участник
    Рег.:
    06.01.2018
    Сообщения:
    372
    Симпатии:
    90
    Репутация:
    7
    Оффлайн
    Но вроде бы и тут, как вы писали, с введением новой матрицы дело пойдет на лад ?
    И сеть будет видеть тактику более чем на 1-2 хода?
    судя по тому, что это не проверяется на сети 50 ,то уже все проверено?
    так берите 32930 и сыграйте....
  28. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    А в чем разница между LeelaNice и LeelaChess? По силе игры в блиц между ними больше 400 пунктов различие. Это как раз разница между голой нейросетью и считающей 30 узлов ход?

    ps
    Или это нейросетки разные?
  29. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    :):). Я вам два раза уже дал ссылку на сеть, в каком вы виде предпочитаете?
    Совсем не знаю, кто такой Камон, но думаю, эта сеть у него выиграет. Рекомендую взять в одну руку Камона, во вторую сеть, и проверить самостоятельно. О полученных выводах напишите на этом форуме.
  30. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Если вы имеете в виду новую policy head, то она будет (как ожидается) лучше распознавать тактические мотивы в разных частях доски, но всё равно потребуется счёт.
    Совсем без счёта сложную тактику не взять, но такое что счёт что-то в упор не видит и не пробует посчитать, должно уменьшиться.
    —- добавлено: 16 фев 2019 —-
    LeelaChess играет в полную силу на GPU.
    LeelaNice играет на CPU, 30 nodes на ход (то есть можно сказать вообще не думает), и с чуть повышенным cpuct (чтоб приблизить стиль игру к человеческому).

    Когда Адам Тухаев играл с LeelaChess, её временно таким вот образом ослабили, чтобы можно было выиграть.
    После этих игр LeelaChess пару часов висела на таких настройках, и народу понравилась такая конфигурация (играет сильно, но можно словить на тактике), и поэтому после того, как LeelaChess вернулась на свою полную силу, параллельно запустили такую ослабленную LeelaNice.
    Alhimik88 и Undying нравится это.
  31. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    290
    Симпатии:
    90
    Репутация:
    3
    Оффлайн
    Тем временем вы продолжаете смотреть миниатюру "KEV81 троллит тупостью разработчика Лилы"
    Комсюк, Alhimik88 и Undying нравится это.
  32. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    Рейтинг 2100 у LeelaNice по двум причинам. Первое с ней мало кто играет рейтинговые партии. А второе у нее полностью отсутствует случайность в игре. Можно повторять выигранную партию сколько угодно раз. Чем некоторые пользуются: https://lichess.org/IefTOt78#15 Там 44 победы человека, но на самом деле это всего две разные партии. Остальные это просто повторения.

    По хорошему надо в Лилу какой-то рандомизатор добавить. И при играх с человеком его использовать.
    Alhimik88 нравится это.
  33. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    18.537
    Симпатии:
    10.881
    Репутация:
    686
    Оффлайн
    Да кто вы черт возьми такой чтоб меня не знать ?:no: Я вашу нейросеть труба шатал :gigi:
    Комсюк нравится это.
  34. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    18.537
    Симпатии:
    10.881
    Репутация:
    686
    Оффлайн
    Ну если ради науки, то придётся ушатать!
  35. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    81
    Симпатии:
    35
    Репутация:
    1
    Оффлайн
    А как у Камона ник на Личесс? Интересно же как Лила шатается! :)

    Это оценка через несколько секунд после хода, там Стокфиш уже на добавлениях играл. Эту партию в режиме реального времени анализировал Стокфиш на 176 потоках с 7-ми фигурками, вот он выигрыш нашел. Там белые осуществляют прорыв f5.

Поделиться этой страницей