Leela Chess Zero (lc0): турниры, партии, рейтинги...

Discussion in 'Машинное отделение' started by vasa, 10 Oct 2018.

  1. Challenger Spy Технический специалист

    • Команда форума
    Member Since:
    29.01.2011
    Message Count:
    5.292
    Likes Received:
    2.845
    Репутация:
    226
    Оффлайн
    Насколько Лила близка к Альфазиро? Результат этого матча можно подвязать к противостоянию Альфы со Стоком или же нет?
  2. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Принцип тот же.
  3. Challenger Spy Технический специалист

    • Команда форума
    Member Since:
    29.01.2011
    Message Count:
    5.292
    Likes Received:
    2.845
    Репутация:
    226
    Оффлайн
    Вроде говорят даже, что Лила это полный клон Альфы, сделанный по его алгоритму. Но насколько точное тут соответствие? И о чем говорит результат текущего матча?
    1. Лила сделана неправильно, хуже Альфы
    2. Сток заметно усилился с матча с Альфой, Альфа/Лила же достигла предела
    3. Результаты Альфы сомнительны, ибо Лила его полный клон и в открытом равном соперничестве уступает
  4. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Не полный клон, но принципы схожие.
    Как Комодо и Гудини. Движки разные, а принципы те же.
    —- добавлено: 9 Feb 2019 —-
    Усилился.
    —- добавлено: 9 Feb 2019 —-
    На самом деле там особо делать нечего.
    Например у минимаксных движков очень много всяких поисковых прунингов, свистелок, перделок. Потому одни играют хорошо, а другие плохо.

    В случае с Альфазерой и Лилой там нечего особо нечего выдумывать. По крайней мере пока.
    Запустил ее на обучение, и жди пока она не достигнет определенного потолка.
    Challenger Spy likes this.
  5. Challenger Spy Технический специалист

    • Команда форума
    Member Since:
    29.01.2011
    Message Count:
    5.292
    Likes Received:
    2.845
    Репутация:
    226
    Оффлайн
    То есть на текущий момент ситуация выглядит так, что технология нейросетей в заметной степени выбрала свой потенциал, ее усиление за счет новых версий сетей дает небольшой прогресс и очень трудоемко, в то время как стандартные "свистопердельные" движки никакого предела для себя не обнаруживают, ибо костылей можно придумать еще уйму?
  6. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.124
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    После премьер-дивизиона проводили тестовый матч со Стокфишем 8, примерно на тех же условиях, что описаны в статье. Лила показала очень близкий к АльфаЗеро результат. Так что можно считать, что сила игры у них сейчас примерно одинаковая.
    Ход же текущего Суперфинала косвенно показывает, почему ДипМайндовцы за прошедший с первой публикации год особенно не стремились играть против новейших версий Стокфиша :)
    FlashNeo and Challenger Spy like this.
  7. Challenger Spy Технический специалист

    • Команда форума
    Member Since:
    29.01.2011
    Message Count:
    5.292
    Likes Received:
    2.845
    Репутация:
    226
    Оффлайн
    То есть текущая Лила близка к Альфе годовалой давности и прогрессировать ей особенно некуда?
  8. FlashNeo Учаcтник

    • Участник
    Member Since:
    23.11.2018
    Message Count:
    587
    Likes Received:
    309
    Репутация:
    2
    Оффлайн
    4. Лейла даже чуть сильнее А0, но Сток заметно усилился.

    Результаты Лейлы против той версии Стока, который встречался с А0, были почти идентичными. Тогда играла более старая сеть, сейчас более новая, но и она очевидно слабее Стока (незначительно, но...)

    С учетом постоянного роста Стока в Эло (реальном, а не самоэло, когда сети 3x и 11248 против Стока показывают результат в пределах погрешности) у Лейлы будет еще максимум две попытки, ну может даже три, чтобы взять корону TCEC. Потом Сток слишком уйдет вперед.


    На самом деле даже нынешняя Лейла способна обыграть Сток, если ей выбрать дебюты, близкие к ее оптимальным (французские, староиндийские, тягучие пирца-уфимцева, но лучше всего французские, она их разыгрывает сильно лучше) в соотношении примерно 70/30. Ну а если книга будет 50/50, что примерно половина или чуть менее идут острые варианты, или игра начинается с -0.6 в позиции, где нужна точность - то лейла будет сливать. Где сток делает ничью в королевском гамбите, там Лейла сольет. Да и реверс-киллы тоже бывают, один вон уже случился в остром английском.
    Challenger Spy likes this.
  9. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Самое главное там не нейросеть, а MCTS.
    —- добавлено: 9 Feb 2019 —-
    Никто не знает потолка. Пока прогрессирует.
    http://lczero.org/?full_elo=1
    —- добавлено: 9 Feb 2019 —-
    Честно говоря уже невидно куда можно минимаксом уйти, кажется что выжали все что можно ))
    Challenger Spy likes this.
  10. FlashNeo Учаcтник

    • Участник
    Member Since:
    23.11.2018
    Message Count:
    587
    Likes Received:
    309
    Репутация:
    2
    Оффлайн
    Безусловно есть куда - там целый набор параметров, которые берутся до обучения. Причем часть из них берется типанаучно, часть - потому что так брал дипмайнд. По идее все это можно протестировать и вроде как усилить сеть. Но здесь в чем загвоздка - обучение идет с нуля, в случае с мощностями Лейлы обучение идет несколько месяцев. Если несколько месяцев тестировать параметр, а он оказался оптимальным (ну так было у дипмайнда, им-то такое количество партий за несколько часов доступно). Т.е столько времени ушло в никуда, а Сток за это время наберет дежурные 15-20 ЭЛО.

    Поэтому я и написал, что если за ближайший год TCEC не возьмет Лейла, то в дальнейшем нужен будет или прорыв в части программирования, или крайне мощное усиление железа (прорыв в выпуске видеокарт). Без этого - увы...

    Каждый год Стокфиш получает примерно 70 ЭЛО и рвет предыдущие версии самого себя и другие движки с большим перевесом.
    В частности он выиграет больше, чем А0, у тех версий, которые проиграли А0... Плюс масштабирование на потоках, плюс сейчас новая методика тестирования патчей появилась, т.е ожидается не 70 ЭЛО за год, а даже больше. Еще есть куда расти.


    P.S те мощности, на которых играют CPU-движки в TCEC, уже выглядят почти устаревшими. Т.е. обновится железо CPU - и нейронным сетям будет куда грустнее...
    Challenger Spy likes this.
  11. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Усиление железа для минимаксных движков особо роли не играет. Там полезность экспоненциальная.

    Вот для MCTS это актуально, так как там чистый нарост статистики и точность уже по линейному закону возрастает.
  12. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    10.05.2006
    Message Count:
    3.626
    Likes Received:
    2.535
    Репутация:
    52
    Оффлайн
    AZ играла на тензорных процах, LZ на видюхах. ДипМайндовцы не дали никакой отладочной информации, вроде скорости нод/сек и даже партии не все дали. В общем, тут только гадать можно о соотношении сил.
  13. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Можно подробнее?
    Я немного отстал.
  14. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.124
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Все равно что-то не верится, что Стокфиш продолжит набирать по 70 пунктов за год ближайшие 5-10 лет. Напоминает расчёт количества конского навоза на улицах Парижа, который к 2000 году должен был составить слой в несколько метров.
    Rom and KEV81 like this.
  15. Kirill_A Новичок

    • Новичок
    Member Since:
    10.05.2018
    Message Count:
    37
    Likes Received:
    22
    Репутация:
    0
    Оффлайн
    Не вижу обоснований для мрачных прогнозов насчет будущего нейросетей и Лилы в частности. Сейчас с последней версией Стокфиш (Stockfish Dev - самая последняя версия, новее 10) играет всего навсего тест30 поколения сетей Лилы. И играет почти на равных и даже выигрывает отдельные некоторые партии. Ну эло 30-40 не хватает еще до уровня Стокфиш (на железе TCEC). Но есть очень важный момент: практически никто из знающих людей и не ожидал, что эта сеть Лилы здесь на голову превзойдет Стокфиш, наоборот - понимали, что здесь есть лишь небольшой шанс (как в случае, если один гроссмейстер может удачно сыграть и выйграть у гроссмейстера, играющего эло на 40 сильнее).
    А теперь я вернусь к главному моменту: тест30 (сеть Лилы из суперфинала со Стокфиш) - это экспериментальное поколение сетей, которое постоянно во время обучения подкручивали, меняли разные параметры, чтобы найти оптимальные. Этот фактор, а также архитектура этих сетей у знающих людей и не вызывала особых иллюзий насчет ее конечной силы, наоборот - приятно удивило, что даже экспериметальное поколение сетей в итоге оказалось довольно сильным и она даже крупно обыграла старенький Стокфиш 8 (хоть это и не мега-достижение, но все же доказала, что результат Альфа Зеро, который с похожим перформансом обыграл Стокфиш 8 - не обман).
    Так вот, поколение сетей Лилы, которое способно превзойти (и скорее всего этого достигнет в скором времени) по силе последнюю версию Стокфиш - это тест40. Тест40 не является экспериментальным. Во время его обучения особого ничего не тестируют и не подкручивают, а используют уже полученные знания их прошлых тестов и из информации от ДипМайнд, чтобы сеть обучалась наилучшим образом. Кроме того, в сетях 40x реализована архитектура нейросетей SE, которой нет даже у Алфа Зеро. Пока еще Лила тест40 находится лишь на втором этапе обучения (из 4-х) и ждать, я думаю, надо примерно месяц-два, перед тем как она значительно превзойдет Стокфиш. Уже сейчас, находясь на очень ранней стадии обучения, эта сеть Лилы близка по уровню к Комодо, Гудини и Стокфиш 8.
    sovaz1997 likes this.
  16. karasik10 Новичок

    • Новичок
    Member Since:
    25.10.2018
    Message Count:
    24
    Likes Received:
    5
    Репутация:
    0
    Location:
    Рига
    Оффлайн
    Сейчас счет 6-5 , есть еще шанс у Лилы стать чемпионом !
  17. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Для нейросетей вообще прогноз хороший. С чего ты взял что мрачный?

    Для шахматной машины Лилы прогноз уже превзошел ожидания. Тоже вроде не плохо?
  18. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Финал TCEC огонь! Результативность 40% в равном матче. Прям какие-то романтические шахматы. ) Лила демонстрирует новый принцип шахмат - рокировку придумали трусы. В 5 победных партиях трижды вообще не рокировалась и еще в одной сделала рокировку на 30 ходу.
    WinPooh, Rom, karasik10 and 1 other person like this.
  19. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    28.05.2012
    Message Count:
    18.570
    Likes Received:
    10.940
    Репутация:
    687
    Нарушения:
    20
    Оффлайн
    Нейросеть должна проигрывать чистому счету, так же как человек проигрывать слабенькому телефону, потому что принципы выбора хода у сетки как у человека, а значит с существенным изъяном. Абстракция проигрывает конкретике.
  20. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Чистому да.
    Но стокфиш не чистый счет.
    sovaz1997 likes this.
  21. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Был бы у SF чистый счет хотя бы на 10-15 ходов, шансов не было бы ни у Лилы, ни у Komodo с Houdini
  22. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    28.05.2012
    Message Count:
    18.570
    Likes Received:
    10.940
    Репутация:
    687
    Нарушения:
    20
    Оффлайн
    Ну будет приближён к чистому, не велика разница.
  23. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    10 ходов это совсем мало. Для сравнения у Deep Blue был чистый счет ходов на 7-8. Играл совсем слабенько. На уровне белковых шахматистов. :) Да и с 15 ходовым чистым счетом движок будет играть намного слабее, чем Стокфиш и Лила на TCEC'овском железе.
    Kirill_A and pavelgttfj8 like this.
  24. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    Даже на горчичное зерно не будет приближен.
    —- добавлено: 9 Feb 2019, опубликовано: 9 Feb 2019 —-
    Возможно ты путаешь ходы с полу-ходами.
    sovaz1997 likes this.
  25. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Если бы у Deep Blue был счет на 7-8 полуходов, то даже я бы его обыграл. :) Не то что Каспаров.
  26. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.124
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Там был чистый аппаратный счёт (без отсечений) в специализированном железе на 7-8 полуходов, который накладывался поверх обычного дерева с эвристиками, который шёл на CPU (их тоже было много). Так что общая глубина получалась вполне достойная.

    http://www.csis.pace.edu/~ctappert/dps/pdf/ai-chess-deep.pdf
    Undying likes this.
  27. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    WinPooh, вы имеет ввиду, что на 7-8 полуходов просто альфа-бета с сортировками? Просто полный перебор все равно смысла не имеет.
    Кстати, в Hedhehog математически точный поиск (если только хеш-таблица иногда может давать сбой из-за коллизий), при этом поиск достаточно быстрый.
    —- добавлено: 9 Feb 2019 —-
    По моим расчетам, чтобы из начальной позиции перебрать на глубину 7 ходов (не полуходов), DeepBlue потребуется 224 секунды (при случае идеальной сортировки ходов). Это будет реальный перебор на 14 полуходов из начальной позиции. Причем реальное время (а не теоретическое) может быть в 5-10 раз больше.
  28. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    The Deep Blue chess computer that defeated Kasparov in 1997 would typically search to a depth of between six and eight moves to a maximum of twenty or even more moves in some situations.

    При этом в среднем Deep Blue перебирал 126 миллионов нод в секунду, т.е. в два раза больше, чем Стокфиш на tcec'овском железе. А играл пунктов на 700 слабее. Чистый перебор в шахматах очень неэффективен.
  29. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Ну, там скорее просто альфа-бета с сортировкой. Либо действительно чистый перебор (все-таки, эта вещь реализовывалась аппаратно и было бы сложнее написать ту же альфа-бета, например).
  30. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.124
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    sovaz1997 likes this.
  31. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Всю прочитал :)
    С 319-й страницы все основные технические детали Deep Blue, кому интересно.

    Интересно было бы сравнить оценочную функцию SF и DeepBlue. У DeepBlue она очень сложная и, судя по всему, не реализуемая программно так, чтобы иметь высокую скорость даже на современных ПК. А может быть и наоборот: она слишком перегруженная и для общего усиления можно было бы добрую часть параметров убрать.
  32. KEV81 Учаcтник

    • Участник
    Member Since:
    06.03.2017
    Message Count:
    240
    Likes Received:
    46
    Репутация:
    6
    Оффлайн
    У меня в таблице не только ход, но и вся позиция целиком, поэтому коллизий в плане лучший-ход-не-в-той-позиции нет, просто иногда не находит позицию с лучшим ходом в таблице.
    Кстати, я временно прикрутил Null move и LMR... на ~200 Elo стало посильнее. Но я еще не закончил скелетную часть.
    sovaz1997 likes this.
  33. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Вы всю позицию в таблице сохраняете? Попробуйте без этого, тогда вы намного больше сохраните записей в таблице. Конечно, это надо тестировать тоже.

    В таблице, конечно, надо хранить полный 64-битный ключ позиции, тогда вероятность коллизии будет очень маленькой. Если сохранять только часть ключа, отвечающую за индекс, будет много коллизий.

    А вообще, это тоже очень интересно - написать математически точный движок. Да, он не будет таким сильным, как SF, но при этом будет решать задачи на определенное число ходов всегда и безошибочно.
  34. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.124
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Есть у меня подозрения, что прогресс в схемотехнике за прошедшие 20 лет позволил бы сейчас аппаратно достичь не 200 миллионов, а 10-100 миллиардов позиций в секунду. И если при этом использовать новые алгоритмы поиска, то 4000 Эло было бы вполне достижимой целью. Только, похоже, это никому не нужно...
    sovaz1997 likes this.
  35. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    А ведь действительно. Может, какой-то ГМ уже сделал такую (на заказ), и потихоньку разрабатывает дебютную теорию? Конечно, он никому об этом не расскажет))

Share This Page