Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 10 окт 2018.

  1. Edwards Ветеран

    • Ветеран
    Рег.:
    11.02.2006
    Сообщения:
    6.331
    Симпатии:
    323
    Репутация:
    21
    Адрес:
    CПб
    Оффлайн
    Вот Лёля - если её обучить нормальным шахматам, то есть рэндому - она всегда поймёт, что не может быть такого, чтобы ладьи (в начальной позиции) стояли на a1 и b1...
    (В рэндоме король всегда стоит между ладьями в нач. позиции)
    Но людишек надо ещё обучать и обучать...
  2. Edwards Ветеран

    • Ветеран
    Рег.:
    11.02.2006
    Сообщения:
    6.331
    Симпатии:
    323
    Репутация:
    21
    Адрес:
    CПб
    Оффлайн
    А вот KEV81 мне напоминает Григория c нашего старого доброго форума.
    Эдакий математик из того анекдота про воздушный шар....
    "Всё, что Вы сказали, было абсолютно точно. И абсолютно бесполезно... Значит, Вы настоящий математик."
    Launder нравится это.
  3. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    Речь не про начальную, а про произвольную позицию. И там важно помнить про ладьи. Например в начальной позиции ладьи стоят на a1 и g1, король на c1. В процессе игры ладья g1 переместилась на b1. Информации о том сохранилась ли левая рокировка недостаточно. Так как непонятно с какой ладьёй будет рокировка.
    Edwards нравится это.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Права на рокировку в шахматах Фишера представлять не намного сложнее, чем в обычных шахматах. Достаточно одной битовой плоскости, с установленными 1 на тех полях, где стоит участвующая в рокировке ладья. Далее, два правила: а) при любом ходе короля белых или чёрных стираем все 1 на соответствующей горизонтали, б) при любом ходе любой фигуры заменяем бит на исходном и конечном поле на 0. Всё.
    Дополнение: оба правила обязательны к применению, т. к. король своим ходом может лишать потенциальной рокировки противника, съедая его ладью.
    sovaz1997 нравится это.
  5. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Вопрос не в том, как закодировать, а в том, как сделать удобным для нейронной сети.
  6. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Просто ещё одна битовая плоскость. Что может быть удобнее для нейронной сети?
    Ход всё так же задаётся двумя полями, начальным и конечным. В случае рокировок Фишера - они однозначно задаются ходом короля на поле соответствующей ладьи. То есть для выхода policy head имеем всё ту же матрицу из вероятностей размером 64x64.
  7. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    1 бит?
  8. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Ну вот не знаю, насчёт одного бита. Вроде бы, архитектура Лилы питается на входе именно битовыми плоскостями для каждого типа фигур (традиционное bitboard-представление). Впрочем, я в детали кода не вдавался, может быть, там всё сложнее.
  9. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    со сверточными действительно не все так просто, но минимальная информация 1 бит ))
  10. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    В принципе, ещё 4 входа — возможна ли рокировка в данный момент. Похоже на feature extraction, признак может быть полезным и для обычных шахмат.
  11. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    1) В Reinforcement Learning переобучения не бывает. Если её сила дропается из-за того, что позиция подобная не встречалась или встречалась редко, то это underfit.
    2) Если бы нейросеть просто запоминала позиции, то сила дропалась бы не на 100 ELO, а гораздо сильнее. Скорее, тут комбинация двух факторов: она умеет достаточно сильно обобщать + помнит конкретные варианты.
    sovaz1997 нравится это.
  12. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    190
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    —- добавлено: 17 мар 2019, опубликовано: 16 мар 2019 —-
    Сейчас глянул эту позицию на проце i7-3770k с семью потками,последний стокфиш "19030520" 31-м полуходом выдал как лучший ход g7-g6.
  13. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    SKY, я уже Лилой смотрел. Она убирает ферзя на c7 (что логично - для освобождения слона). Проверьте этот вариант тоже :)
    (если я не ошибаюсь с партией - но, вроде, та)
  14. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    190
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    sovaz1997,-Заново заставил обдумывать.До хода g7-g6 сток в этот раз додумался на 34 полуходе,а на 35-ом как лучший выдал b4-b3,сейчас до 50 глубины так и держится b4-b3.
  15. Обыватель Новичок

    • Новичок
    Рег.:
    05.12.2016
    Сообщения:
    94
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    Скажите, пожалуйста, если не знать, что бот, то можно догадаться, что бот? Есть признаки "железного человека"?
    Мне очень интересна тема "человечности" Лилы.
  16. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    18.514
    Симпатии:
    10.863
    Репутация:
    685
    Оффлайн
    Вряд ли ее игра еще похожа на человека. У меня рейтинг выше ее, но я не могу играть с ней на равных, получается она играет на 2500 где-то. Но в то же время она допускает грубые ошибки из-за которых ее могут обыгрывать игроки 1900 и ниже. Получается ни то, ни сё.
  17. Обыватель Новичок

    • Новичок
    Рег.:
    05.12.2016
    Сообщения:
    94
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    Подробнее объясню, что имею в виду. Порой смотрю стримы и иногда игроки с невысоким относительно стримера рейтингом обыгрывают шоумена. Тот начинает мрачнеть и злиться уже в середине игры, вопрошать, хмурить брови, "ну-ну"-кать, а после проигрыша лезет проверять и жаловаться в администрацию на читера.
    Не знай, вы, что играете с ботом, полезли бы в голову такие мысли?
    С практической точки зрения, в этот мой вопрос неглубоко вшит другой: можно ли тренироваться, играя с Лилой? Играть с удобным для себя рапидным контролем на площадках не позволяет паранойя ("читер со мной играет"!), а если играть с Лилой, так сразу знаешь, что она робот. Подобрал сетку по своей силе, и "гони гусей"?
  18. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    18.514
    Симпатии:
    10.863
    Репутация:
    685
    Оффлайн
    играйте безрейтинговые партии, если соперник читер, то считай играли с прогой, Лила это тоже прога, не все ли равно какой проге проигрывать и то, и то тренировка.:D некоторые партии Лилы безусловно вызвали бы у меня подозрения. в 90% случаев когда я жаловался на читерство моих соперников банили.
  19. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    1900никам по большим праздникам Лила проигрывает. Проблема в другом. В Лиле нет рандомизатора ходов. Поэтому можно сыграть двадцать партий, выиграть одну и потом ее бесконечно повторять.
  20. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    18.514
    Симпатии:
    10.863
    Репутация:
    685
    Оффлайн
    это не самая главная проблема, у нее нет стабильности, ее класс игры непонятен, она может играть в силу гросса, а может в силу 3 разряда. может выиграть даже у 2600, а потом залечь 1500, и такое я видел. ну а на выходе получается среднеарифметический рейтинг 2200, разводилово :)
  21. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    Кстати, интересно было бы найти закономерности :) Навскидку, в тактических позициях Lc0 должна играть слабее. Плюс насклько позиция входит в обучающий набор, вполне возможно 1500 играет не по теории, в результате чего уникальная позиция для Lc0 возникает раньше. Как гипотеза против Lc0 без перебора надо играть Эльшада!
  22. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    587
    Симпатии:
    309
    Репутация:
    2
    Оффлайн
    Стокфиш сделал реверс-килл в дебюте 1. d4 d5 2. c4 c6 3. c:d c:d 4. Nc3 Nc6. 5 Bf4 e5!
    Еще Лейла крайне бледно выглядела в том варианте Земиша староиндийки, где черные ходят Qh4+ и отдают ферзя за две фигуры и две пешки - проиграла белыми и еле свела вничью черными.
    Примерно такие же дикие, чисто счетные позиции, где требуется глаз да глаз за королем и являются одним из ключей к взлому Лейлы.
  23. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.111
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Только посмотрел, очень круто)
    SKY нравится это.
  24. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Начался финал CCC7.

    А вот и игра: Lc0 пожертвовала ферзя за 2 легкие фигуры и 2 пешки. И победила сегодняшний Stockfish :)

    Undying, Rom, pavelgttfj8 и 2 другим нравится это.
  25. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    В Сицилианке Лила за оба цвета "укатала" Stockfish. Итоговый счет 3-0 между SF и Lc0.



  26. Edwards Ветеран

    • Ветеран
    Рег.:
    11.02.2006
    Сообщения:
    6.331
    Симпатии:
    323
    Репутация:
    21
    Адрес:
    CПб
    Оффлайн
    Вот не только Сергей Юрьевич, но и другие добрые русские люди не очень понимают что такое "CCC" и всё такое.
    Вы б не могли бы как-то на нашу русскую аудиторию скидку делать? чего-то как-то переводить?
    Прям просим.
  27. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    Так Мотылёв обыграл Широва ещё в 2004 году. Не говоря о том, что Nxd4 это рекомендация самого Stockfish. Тут просто проблема дебютной книги, ИМХО.
  28. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Лила расправляется со всеми, как с желторотыми. Суперфинал TCEC обещает быть интересным.
    sovaz1997 нравится это.
  29. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    Ну... в суперфинале играют с 9-го хода, тут с 3-го... Так что тут много зависит от правил турнира. Если играть из начальной позиции без баз, то Lc0 уверенно победит. Но если включать не только позиции после дебюта, но и разные игровые окончания, то, имхо, Lc0 может не сдюжить.
  30. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Не думаю, что отрезок партии с 3 по 9 ход это тот интервал, на котором можно регулярно получать решающее преимущество. Как говорят в Формуле 1 - в первом повороте гонка не выигрывается. Видимо, Лила все-таки уже сильнее во всех игровых стадиях.
  31. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    Ну... для лилы скорее не решающее преимущество, но позиции, более похожие на обучающую выборку с достоверными предсказаниями. А в целом легко проверить.
  32. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    CCC - это турнир движков от chess.com. Турнир проходит здесь: https://www.chess.com/computer-chess-championship
    Архив: https://www.chess.com/news/view/ccc-pgn-archive
  33. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Кстати, Лила уже вышла за пределы погрещности:

    Код:
    # PLAYER         :  RATING  ERROR  POINTS  PLAYED   (%)  CFS(%)    W    D    L  D(%)  OppAvg
    1 Lc0            :  2370.5   39.9    29.0      46    63      99   12   34    0    74  2276.1
    2 Stockfish      :  2289.8   35.5    22.0      46    48      54    4   36    6    78  2305.6
    3 Leelenstein    :  2287.0   34.6    21.5      45    48      87    3   37    5    82  2302.5
    4 Antifish       :  2252.7   38.0    18.5      45    41      —-    4   29   12    64  2317.6
    
  34. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    190
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    Что-то уж очень мало времени на ход получается,глубина совсем небольшая.Уровень игры не высокий,интересно куда они спешат,могли бы и побольше времени давать.
  35. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    TCEC даёт больше времени на ход. Соответственно, выше качество партий. Тем не менее, уровень игры все равно очень высок, т. к. 90 потоков играет против 4xRTX 2080 Ti. Если взять Лилу, к примеру, на 1050 Ti, то ей придется тратить около 5-15 минут на ход, чтобы достигнуть такого же уровня.
    SKY нравится это.

Поделиться этой страницей