Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 10 окт 2018.

  1. Edwards
    Оффлайн

    Edwards Старожил

    Репутация:
    21
    Вот Лёля - если её обучить нормальным шахматам, то есть рэндому - она всегда поймёт, что не может быть такого, чтобы ладьи (в начальной позиции) стояли на a1 и b1...
    (В рэндоме король всегда стоит между ладьями в нач. позиции)
    Но людишек надо ещё обучать и обучать...
     
    Последнее редактирование: 10 мар 2019
  2. Edwards
    Оффлайн

    Edwards Старожил

    Репутация:
    21
    А вот KEV81 мне напоминает Григория c нашего старого доброго форума.
    Эдакий математик из того анекдота про воздушный шар....
    "Всё, что Вы сказали, было абсолютно точно. И абсолютно бесполезно... Значит, Вы настоящий математик."
     
    Launder нравится это.
  3. KEV81
    Оффлайн

    KEV81 Учаcтник

    Репутация:
    6
    Речь не про начальную, а про произвольную позицию. И там важно помнить про ладьи. Например в начальной позиции ладьи стоят на a1 и g1, король на c1. В процессе игры ладья g1 переместилась на b1. Информации о том сохранилась ли левая рокировка недостаточно. Так как непонятно с какой ладьёй будет рокировка.
     
    Edwards нравится это.
  4. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Права на рокировку в шахматах Фишера представлять не намного сложнее, чем в обычных шахматах. Достаточно одной битовой плоскости, с установленными 1 на тех полях, где стоит участвующая в рокировке ладья. Далее, два правила: а) при любом ходе короля белых или чёрных стираем все 1 на соответствующей горизонтали, б) при любом ходе любой фигуры заменяем бит на исходном и конечном поле на 0. Всё.
    Дополнение: оба правила обязательны к применению, т. к. король своим ходом может лишать потенциальной рокировки противника, съедая его ладью.
     
    sovaz1997 нравится это.
  5. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Вопрос не в том, как закодировать, а в том, как сделать удобным для нейронной сети.
     
  6. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Просто ещё одна битовая плоскость. Что может быть удобнее для нейронной сети?
    Ход всё так же задаётся двумя полями, начальным и конечным. В случае рокировок Фишера - они однозначно задаются ходом короля на поле соответствующей ладьи. То есть для выхода policy head имеем всё ту же матрицу из вероятностей размером 64x64.
     
  7. KEV81
    Оффлайн

    KEV81 Учаcтник

    Репутация:
    6
    1 бит?
     
  8. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Ну вот не знаю, насчёт одного бита. Вроде бы, архитектура Лилы питается на входе именно битовыми плоскостями для каждого типа фигур (традиционное bitboard-представление). Впрочем, я в детали кода не вдавался, может быть, там всё сложнее.
     
  9. KEV81
    Оффлайн

    KEV81 Учаcтник

    Репутация:
    6
    со сверточными действительно не все так просто, но минимальная информация 1 бит ))
     
  10. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    В принципе, ещё 4 входа — возможна ли рокировка в данный момент. Похоже на feature extraction, признак может быть полезным и для обычных шахмат.
     
  11. Polarity
    Оффлайн

    Polarity Новичок

    Репутация:
    0
    1) В Reinforcement Learning переобучения не бывает. Если её сила дропается из-за того, что позиция подобная не встречалась или встречалась редко, то это underfit.
    2) Если бы нейросеть просто запоминала позиции, то сила дропалась бы не на 100 ELO, а гораздо сильнее. Скорее, тут комбинация двух факторов: она умеет достаточно сильно обобщать + помнит конкретные варианты.
     
    sovaz1997 нравится это.
  12. SKY
    Оффлайн

    SKY Учаcтник

    Репутация:
    1
    —- добавлено: 17 мар 2019, опубликовано: 16 мар 2019 —-
    Сейчас глянул эту позицию на проце i7-3770k с семью потками,последний стокфиш "19030520" 31-м полуходом выдал как лучший ход g7-g6.
     
  13. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    SKY, я уже Лилой смотрел. Она убирает ферзя на c7 (что логично - для освобождения слона). Проверьте этот вариант тоже :)
    (если я не ошибаюсь с партией - но, вроде, та)
     
  14. SKY
    Оффлайн

    SKY Учаcтник

    Репутация:
    1
    sovaz1997,-Заново заставил обдумывать.До хода g7-g6 сток в этот раз додумался на 34 полуходе,а на 35-ом как лучший выдал b4-b3,сейчас до 50 глубины так и держится b4-b3.
     
    Последнее редактирование: 17 мар 2019
  15. Обыватель
    Оффлайн

    Обыватель Новичок

    Репутация:
    0
    Скажите, пожалуйста, если не знать, что бот, то можно догадаться, что бот? Есть признаки "железного человека"?
    Мне очень интересна тема "человечности" Лилы.
     
  16. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    691
    Вряд ли ее игра еще похожа на человека. У меня рейтинг выше ее, но я не могу играть с ней на равных, получается она играет на 2500 где-то. Но в то же время она допускает грубые ошибки из-за которых ее могут обыгрывать игроки 1900 и ниже. Получается ни то, ни сё.
     
  17. Обыватель
    Оффлайн

    Обыватель Новичок

    Репутация:
    0
    Подробнее объясню, что имею в виду. Порой смотрю стримы и иногда игроки с невысоким относительно стримера рейтингом обыгрывают шоумена. Тот начинает мрачнеть и злиться уже в середине игры, вопрошать, хмурить брови, "ну-ну"-кать, а после проигрыша лезет проверять и жаловаться в администрацию на читера.
    Не знай, вы, что играете с ботом, полезли бы в голову такие мысли?
    С практической точки зрения, в этот мой вопрос неглубоко вшит другой: можно ли тренироваться, играя с Лилой? Играть с удобным для себя рапидным контролем на площадках не позволяет паранойя ("читер со мной играет"!), а если играть с Лилой, так сразу знаешь, что она робот. Подобрал сетку по своей силе, и "гони гусей"?
     
  18. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    691
    играйте безрейтинговые партии, если соперник читер, то считай играли с прогой, Лила это тоже прога, не все ли равно какой проге проигрывать и то, и то тренировка.:D некоторые партии Лилы безусловно вызвали бы у меня подозрения. в 90% случаев когда я жаловался на читерство моих соперников банили.
     
  19. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    1900никам по большим праздникам Лила проигрывает. Проблема в другом. В Лиле нет рандомизатора ходов. Поэтому можно сыграть двадцать партий, выиграть одну и потом ее бесконечно повторять.
     
  20. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    691
    это не самая главная проблема, у нее нет стабильности, ее класс игры непонятен, она может играть в силу гросса, а может в силу 3 разряда. может выиграть даже у 2600, а потом залечь 1500, и такое я видел. ну а на выходе получается среднеарифметический рейтинг 2200, разводилово :)
     
  21. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Кстати, интересно было бы найти закономерности :) Навскидку, в тактических позициях Lc0 должна играть слабее. Плюс насклько позиция входит в обучающий набор, вполне возможно 1500 играет не по теории, в результате чего уникальная позиция для Lc0 возникает раньше. Как гипотеза против Lc0 без перебора надо играть Эльшада!
     
  22. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    Стокфиш сделал реверс-килл в дебюте 1. d4 d5 2. c4 c6 3. c:d c:d 4. Nc3 Nc6. 5 Bf4 e5!
    Еще Лейла крайне бледно выглядела в том варианте Земиша староиндийки, где черные ходят Qh4+ и отдают ферзя за две фигуры и две пешки - проиграла белыми и еле свела вничью черными.
    Примерно такие же дикие, чисто счетные позиции, где требуется глаз да глаз за королем и являются одним из ключей к взлому Лейлы.
     
  23. просроченый_кмс
    Оффлайн

    просроченый_кмс Старожил

    Репутация:
    6
    Только посмотрел, очень круто)
     
    SKY нравится это.
  24. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Начался финал CCC7.

    А вот и игра: Lc0 пожертвовала ферзя за 2 легкие фигуры и 2 пешки. И победила сегодняшний Stockfish :)

     
    Undying, Rom, pavelgttfj8 и 2 другим нравится это.
  25. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    В Сицилианке Лила за оба цвета "укатала" Stockfish. Итоговый счет 3-0 между SF и Lc0.



     
  26. Edwards
    Оффлайн

    Edwards Старожил

    Репутация:
    21
    Вот не только Сергей Юрьевич, но и другие добрые русские люди не очень понимают что такое "CCC" и всё такое.
    Вы б не могли бы как-то на нашу русскую аудиторию скидку делать? чего-то как-то переводить?
    Прям просим.
     
  27. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Так Мотылёв обыграл Широва ещё в 2004 году. Не говоря о том, что Nxd4 это рекомендация самого Stockfish. Тут просто проблема дебютной книги, ИМХО.
     
  28. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Лила расправляется со всеми, как с желторотыми. Суперфинал TCEC обещает быть интересным.
     
    sovaz1997 нравится это.
  29. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Ну... в суперфинале играют с 9-го хода, тут с 3-го... Так что тут много зависит от правил турнира. Если играть из начальной позиции без баз, то Lc0 уверенно победит. Но если включать не только позиции после дебюта, но и разные игровые окончания, то, имхо, Lc0 может не сдюжить.
     
  30. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Не думаю, что отрезок партии с 3 по 9 ход это тот интервал, на котором можно регулярно получать решающее преимущество. Как говорят в Формуле 1 - в первом повороте гонка не выигрывается. Видимо, Лила все-таки уже сильнее во всех игровых стадиях.
     
  31. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Ну... для лилы скорее не решающее преимущество, но позиции, более похожие на обучающую выборку с достоверными предсказаниями. А в целом легко проверить.
     
  32. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    CCC - это турнир движков от chess.com. Турнир проходит здесь: https://www.chess.com/computer-chess-championship
    Архив: https://www.chess.com/news/view/ccc-pgn-archive
     
  33. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Кстати, Лила уже вышла за пределы погрещности:

    Код:
    # PLAYER         :  RATING  ERROR  POINTS  PLAYED   (%)  CFS(%)    W    D    L  D(%)  OppAvg
    1 Lc0            :  2370.5   39.9    29.0      46    63      99   12   34    0    74  2276.1
    2 Stockfish      :  2289.8   35.5    22.0      46    48      54    4   36    6    78  2305.6
    3 Leelenstein    :  2287.0   34.6    21.5      45    48      87    3   37    5    82  2302.5
    4 Antifish       :  2252.7   38.0    18.5      45    41      —-    4   29   12    64  2317.6
    
     
  34. SKY
    Оффлайн

    SKY Учаcтник

    Репутация:
    1
    Что-то уж очень мало времени на ход получается,глубина совсем небольшая.Уровень игры не высокий,интересно куда они спешат,могли бы и побольше времени давать.
     
  35. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    TCEC даёт больше времени на ход. Соответственно, выше качество партий. Тем не менее, уровень игры все равно очень высок, т. к. 90 потоков играет против 4xRTX 2080 Ti. Если взять Лилу, к примеру, на 1050 Ti, то ей придется тратить около 5-15 минут на ход, чтобы достигнуть такого же уровня.
     
    SKY нравится это.