Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 9 окт 2018.

  1. Edwards Ветеран

    • Ветеран
    Рег.:
    10.02.2006
    Сообщения:
    6.300
    Симпатии:
    235
    Репутация:
    13
    Адрес:
    CПб
    Оффлайн
    Вот Лёля - если её обучить нормальным шахматам, то есть рэндому - она всегда поймёт, что не может быть такого, чтобы ладьи (в начальной позиции) стояли на a1 и b1...
    (В рэндоме король всегда стоит между ладьями в нач. позиции)
    Но людишек надо ещё обучать и обучать...
  2. Edwards Ветеран

    • Ветеран
    Рег.:
    10.02.2006
    Сообщения:
    6.300
    Симпатии:
    235
    Репутация:
    13
    Адрес:
    CПб
    Оффлайн
    А вот KEV81 мне напоминает Григория c нашего старого доброго форума.
    Эдакий математик из того анекдота про воздушный шар....
    "Всё, что Вы сказали, было абсолютно точно. И абсолютно бесполезно... Значит, Вы настоящий математик."
    Launder нравится это.
  3. KEV81 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    06.03.2017
    Сообщения:
    216
    Симпатии:
    39
    Репутация:
    6
    Нарушения:
    31
    Оффлайн
    Речь не про начальную, а про произвольную позицию. И там важно помнить про ладьи. Например в начальной позиции ладьи стоят на a1 и g1, король на c1. В процессе игры ладья g1 переместилась на b1. Информации о том сохранилась ли левая рокировка недостаточно. Так как непонятно с какой ладьёй будет рокировка.
    Edwards нравится это.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Права на рокировку в шахматах Фишера представлять не намного сложнее, чем в обычных шахматах. Достаточно одной битовой плоскости, с установленными 1 на тех полях, где стоит участвующая в рокировке ладья. Далее, два правила: а) при любом ходе короля белых или чёрных стираем все 1 на соответствующей горизонтали, б) при любом ходе любой фигуры заменяем бит на исходном и конечном поле на 0. Всё.
    Дополнение: оба правила обязательны к применению, т. к. король своим ходом может лишать потенциальной рокировки противника, съедая его ладью.
    sovaz1997 нравится это.
  5. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    122
    Симпатии:
    152
    Репутация:
    12
    Оффлайн
    Вопрос не в том, как закодировать, а в том, как сделать удобным для нейронной сети.
  6. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Просто ещё одна битовая плоскость. Что может быть удобнее для нейронной сети?
    Ход всё так же задаётся двумя полями, начальным и конечным. В случае рокировок Фишера - они однозначно задаются ходом короля на поле соответствующей ладьи. То есть для выхода policy head имеем всё ту же матрицу из вероятностей размером 64x64.
  7. KEV81 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    06.03.2017
    Сообщения:
    216
    Симпатии:
    39
    Репутация:
    6
    Нарушения:
    31
    Оффлайн
    1 бит?
  8. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Ну вот не знаю, насчёт одного бита. Вроде бы, архитектура Лилы питается на входе именно битовыми плоскостями для каждого типа фигур (традиционное bitboard-представление). Впрочем, я в детали кода не вдавался, может быть, там всё сложнее.
  9. KEV81 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    06.03.2017
    Сообщения:
    216
    Симпатии:
    39
    Репутация:
    6
    Нарушения:
    31
    Оффлайн
    со сверточными действительно не все так просто, но минимальная информация 1 бит ))
  10. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.918
    Симпатии:
    363
    Репутация:
    21
    Адрес:
    Киев
    Оффлайн
    В принципе, ещё 4 входа — возможна ли рокировка в данный момент. Похоже на feature extraction, признак может быть полезным и для обычных шахмат.
  11. Polarity Новичок

    • Новичок
    Рег.:
    23.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    1) В Reinforcement Learning переобучения не бывает. Если её сила дропается из-за того, что позиция подобная не встречалась или встречалась редко, то это underfit.
    2) Если бы нейросеть просто запоминала позиции, то сила дропалась бы не на 100 ELO, а гораздо сильнее. Скорее, тут комбинация двух факторов: она умеет достаточно сильно обобщать + помнит конкретные варианты.
    sovaz1997 нравится это.
  12. SKY Новичок

    • Новичок
    Рег.:
    05.11.2018
    Сообщения:
    46
    Симпатии:
    1
    Репутация:
    0
    Оффлайн
    —- добавлено: 16 мар 2019, опубликовано: 16 мар 2019 —-
    Сейчас глянул эту позицию на проце i7-3770k с семью потками,последний стокфиш "19030520" 31-м полуходом выдал как лучший ход g7-g6.
  13. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    550
    Симпатии:
    79
    Репутация:
    3
    Оффлайн
    SKY, я уже Лилой смотрел. Она убирает ферзя на c7 (что логично - для освобождения слона). Проверьте этот вариант тоже :)
    (если я не ошибаюсь с партией - но, вроде, та)
  14. SKY Новичок

    • Новичок
    Рег.:
    05.11.2018
    Сообщения:
    46
    Симпатии:
    1
    Репутация:
    0
    Оффлайн
    sovaz1997,-Заново заставил обдумывать.До хода g7-g6 сток в этот раз додумался на 34 полуходе,а на 35-ом как лучший выдал b4-b3,сейчас до 50 глубины так и держится b4-b3.
  15. Обыватель Новичок

    • Новичок
    Рег.:
    05.12.2016
    Сообщения:
    61
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Скажите, пожалуйста, если не знать, что бот, то можно догадаться, что бот? Есть признаки "железного человека"?
    Мне очень интересна тема "человечности" Лилы.
  16. Camon14 магистр

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    15.310
    Симпатии:
    7.253
    Репутация:
    530
    Нарушения:
    6
    Оффлайн
    Вряд ли ее игра еще похожа на человека. У меня рейтинг выше ее, но я не могу играть с ней на равных, получается она играет на 2500 где-то. Но в то же время она допускает грубые ошибки из-за которых ее могут обыгрывать игроки 1900 и ниже. Получается ни то, ни сё.
  17. Обыватель Новичок

    • Новичок
    Рег.:
    05.12.2016
    Сообщения:
    61
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Подробнее объясню, что имею в виду. Порой смотрю стримы и иногда игроки с невысоким относительно стримера рейтингом обыгрывают шоумена. Тот начинает мрачнеть и злиться уже в середине игры, вопрошать, хмурить брови, "ну-ну"-кать, а после проигрыша лезет проверять и жаловаться в администрацию на читера.
    Не знай, вы, что играете с ботом, полезли бы в голову такие мысли?
    С практической точки зрения, в этот мой вопрос неглубоко вшит другой: можно ли тренироваться, играя с Лилой? Играть с удобным для себя рапидным контролем на площадках не позволяет паранойя ("читер со мной играет"!), а если играть с Лилой, так сразу знаешь, что она робот. Подобрал сетку по своей силе, и "гони гусей"?
  18. Camon14 магистр

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    15.310
    Симпатии:
    7.253
    Репутация:
    530
    Нарушения:
    6
    Оффлайн
    играйте безрейтинговые партии, если соперник читер, то считай играли с прогой, Лила это тоже прога, не все ли равно какой проге проигрывать и то, и то тренировка.:D некоторые партии Лилы безусловно вызвали бы у меня подозрения. в 90% случаев когда я жаловался на читерство моих соперников банили.
  19. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    1900никам по большим праздникам Лила проигрывает. Проблема в другом. В Лиле нет рандомизатора ходов. Поэтому можно сыграть двадцать партий, выиграть одну и потом ее бесконечно повторять.
  20. Camon14 магистр

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    15.310
    Симпатии:
    7.253
    Репутация:
    530
    Нарушения:
    6
    Оффлайн
    это не самая главная проблема, у нее нет стабильности, ее класс игры непонятен, она может играть в силу гросса, а может в силу 3 разряда. может выиграть даже у 2600, а потом залечь 1500, и такое я видел. ну а на выходе получается среднеарифметический рейтинг 2200, разводилово :)
  21. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.918
    Симпатии:
    363
    Репутация:
    21
    Адрес:
    Киев
    Оффлайн
    Кстати, интересно было бы найти закономерности :) Навскидку, в тактических позициях Lc0 должна играть слабее. Плюс насклько позиция входит в обучающий набор, вполне возможно 1500 играет не по теории, в результате чего уникальная позиция для Lc0 возникает раньше. Как гипотеза против Lc0 без перебора надо играть Эльшада!
  22. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    119
    Симпатии:
    83
    Репутация:
    1
    Оффлайн
    Стокфиш сделал реверс-килл в дебюте 1. d4 d5 2. c4 c6 3. c:d c:d 4. Nc3 Nc6. 5 Bf4 e5!
    Еще Лейла крайне бледно выглядела в том варианте Земиша староиндийки, где черные ходят Qh4+ и отдают ферзя за две фигуры и две пешки - проиграла белыми и еле свела вничью черными.
    Примерно такие же дикие, чисто счетные позиции, где требуется глаз да глаз за королем и являются одним из ключей к взлому Лейлы.
  23. просроченый_кмс Учаcтник

    • Участник
    Рег.:
    15.02.2010
    Сообщения:
    960
    Симпатии:
    69
    Репутация:
    0
    Оффлайн
    Только посмотрел, очень круто)
    SKY нравится это.

Поделиться этой страницей