AlphaZero. Нейронная сеть играет в шахматы

WinPooh · 21 Sep 2018

Sergey1983 said: ↑

Одна игра это десятки позиций разыграть каждую это десятки игр в каждой опять же десятки позиций....
Это дерево с почти бесконечным числом вариантов, кроме того где гарантия что арбитр будет качественно оценивать позиции, а не повторится история с текущей LCZero.
Click to expand...

Если заменить текущую версию на кентавра с простейшим правилом: "если на доске больше, чем 8 (10, 12...) фигур, то включать Лилу, иначе включать Стокфиш" - такая программа явно шла бы сейчас на более высоком месте, чем 3-4.
А полную гарантию, как известно, может дать только страховой полис. Да и то не всегда.

WinPooh · 21 Sep 2018

Кстати, уже ведутся работы по обучению специальной сети для эндшпиля:
https://github.com/dkappe/leela-chess-weights/releases/tag/Ender38
Когда её отладят, видимо, наступит этап "прививания" этих весов к основной сети. Слышал, что с нейросетями такие штуки можно делать.
Я, правда, вижу концептуальное препятствие: десятки терабайт точных эндшпильных таблиц сжать в небольшую нейросеть не получится чисто по теории информации. Для эндшпиля надо менять не только (не столько) оценку, но и алгоритм поиска. Впрочем, не скажу, что этот путь 100% тупиковый, попробовать, конечно, стоит.

Undying · 21 Sep 2018

WinPooh said: ↑

Если заменить текущую версию на кентавра с простейшим правилом: "если на доске больше, чем 8 (10, 12...) фигур, то включать Лилу, иначе включать Стокфиш" - такая программа явно шла бы сейчас на более высоком месте, чем 3-4.
А полную гарантию, как известно, может дать только страховой полис. Да и то не всегда.
Click to expand...

Проще просто обучить Лилу малофигурным эндшпилям. После обучения они будут элементарны для нейронки.

—- добавлено: 21 Sep 2018 —-

WinPooh said: ↑

Ну, эта не громит. Эта с топами ничьи штампует, одну за другой.
Click to expand...

Движки второго эшелона уже громит. А штамповать ничьи с топами тоже неплохо для начала.

Sergey1983 · 21 Sep 2018

WinPooh, нейросетка это не эндшпильные базы это скорее набор правил для игры в эндшпиле.

WinPooh · 21 Sep 2018

Undying said: ↑

Движки второго эшелона уже громит. А штамповать ничьи с топами тоже неплохо для начала.
Click to expand...

С движками Ethereal и Andscacs счёт пока тоже равный. Это какого эшелона движки - первого, второго, полуторного?

WinPooh · 21 Sep 2018

Sergey1983 said: ↑

WinPooh, нейросетка это не эндшпильные базы это скорее набор правил для игры в эндшпиле.
Click to expand...

Так в том-то и дело, что не для всех эндшпилей можно сформулировать чёткие правила. Простейший пример - ферзь против ладьи. Из брошюры Авербаха для начинающих все знают правила: отгоняйте ладью от короля, загоняйте короля в угол, угрожайте матом и вилкой. А на практике против компа, да ещё в блиц, эти правила вдруг не помогают. Потому что надо конкретику и знать, и считать. В более сложных окончаниях вообще наступает полный хаос.

Мат в 72 хода. Выигрывает 1. Kh7, все остальные ходы - ничья.

Мат в 262 хода.

Mustitz · 21 Sep 2018

Ну... там с окончаниями много нюансов. Во-первых, нейросеть имеет ограниченную мощность, которую лучше потратить на миттельшпильные позиции. Во-вторых, эндшпильных позиций меньше в обучающей выборке. В-третьих, эндшпиль сложен для игры, поэтому оценка для него берёться из статистики доигрываний, где велика вероятность ошибочного результата.

Undying · 21 Sep 2018

Mustitz said: ↑

Ну... там с окончаниями много нюансов. Во-первых, нейросеть имеет ограниченную мощность, которую лучше потратить на миттельшпильные позиции. Во-вторых, эндшпильных позиций меньше в обучающей выборке. В-третьих, эндшпиль сложен для игры, поэтому оценка для него берёться из статистики доигрываний, где велика вероятность ошибочного результата.
Click to expand...

В многофигурных эндшпилях Лила же сильно играет. А малофигурные проще намного.

—- добавлено: 21 Sep 2018 —-

WinPooh said: ↑

Потому что надо конкретику и знать, и считать. В более сложных окончаниях вообще наступает полный хаос.
Click to expand...

Конечно, в силу таблиц Налимова нейронка играть не будет. Так в эту силу и алгоритмические движки не играют. Если нейронку обучить, то играть в малофигурных эндшпилях она будет очень сильно, но конечно не идеально.

Undying · 21 Sep 2018

Mustitz said: ↑

Во-первых, нейросеть имеет ограниченную мощность, которую лучше потратить на миттельшпильные позиции.
Click to expand...

Если это окажется критичным, можно для эндшпилей отдельную нейронку натренировать и переключаться на нее, когда до эндшпиля дело доходит.

WinPooh · 21 Sep 2018

Ну вот, очередная ничья с Ethereal на подходе. Оценка Лилы +2, оценка Ethereal 0.00. На доске 11 фигур, то есть до таблиц ещё очень далеко.
Я понял, что мне напоминает стиль Лилы - это пресловутое "накопление позиционных преимуществ" в своём самом худшем смысле. Вот здесь у нас защищённая проходная, вот здесь ладью на открытой линии поставили, вот ещё король централизован - давайте себе +5 или +10 нарисуем. А, что, не выигрывается? КЛЯТЫЕ ТАБЛИЦЫ НАЛИМОВА!

Визуальной аналогией может служить, например, вот такой образец творчества нейронных сетей. Вроде, в каждом отдельном месте всё правильно нарисовано, а в сумме лажа какая-то

Undying · 21 Sep 2018

WinPooh said: ↑

Ну вот, очередная ничья с Ethereal на подходе. Оценка Лилы +2, оценка Ethereal 0.00. На доске 11 фигур, то есть до таблиц ещё очень далеко.
Click to expand...

Так в этом положении Лила досчитала до малофигурок и посчитала, что там все хорошо. Это все та же проблема.

Kesandr · 21 Sep 2018

Да что тот рейтинг сегодня лила рухнул резко вниз. З чем ето связано? http://lczero.org

WinPooh · 21 Sep 2018

Kesandr said: ↑

Да что тот рейтинг сегодня лила рухнул резко вниз. З чем ето связано? http://lczero.org
Click to expand...

Что-то они странное делают. Периодически с нуля начинают обучать...
Нормальный график самообучения должен выглядеть вот так, как у настоящей Лилы, которая в Го играет: https://zero.sjeng.org/

Sergey1983 · 22 Sep 2018

Как я понял они изменили какой-то параметр в результате временное(?) падение силы игры.

svoitsl · 22 Sep 2018

Интересно, а настройки обучения (и другие параметры ) масштабируются на сеть большего размера?
Можно ли отработать все это дело например на сетях 6х64 и 10х128 и потом уже с этими настройками обучать большую сеть.
Или так нельзя?

WinPooh · 23 Sep 2018

WinPooh said: ↑

sovaz1997 said: ↑

WinPooh, выборка очень маленькая. А так, Lc0 добилась выигранной позиции против SF и получила небольшой перевес против H черными
Click to expand...

Вернёмся к этой теме через пару-тройку кругов.
Click to expand...

Итак, после 20 партий (беру только этот этап) против первой тройки: 19 ничьих, 1 поражение.
Кто-то ещё сомневается в том, что у программы из топ-3 данная версия выиграть не способна в принципе?

Undying · 23 Sep 2018

WinPooh said: ↑

Итак, после 20 партий (беру только этот этап) против первой тройки: 19 ничьих, 1 поражение.
Кто-то ещё сомневается в том, что у программы из топ-3 данная версия выиграть не способна в принципе?
Click to expand...

С эндшпильными таблицами способна. Партия со Стокфишем это наглядно показала.

А чтобы реально прорыв был. Надо все-таки нейронку на играх с алгоритмическими движками тренировать.

WinPooh · 23 Sep 2018

Undying said: ↑

WinPooh said: ↑

Итак, после 20 партий (беру только этот этап) против первой тройки: 19 ничьих, 1 поражение.
Кто-то ещё сомневается в том, что у программы из топ-3 данная версия выиграть не способна в принципе?
Click to expand...

С эндшпильными таблицами способна. Партия со Стокфишем это наглядно показала.
Click to expand...

Ну, это из серии известных суждений об отличии бабушки от дедушки. Счёт - он на табло.

Вообще, я считаю эндшпильные таблицы в данном контексте читерством.
Нейросеть должна познавать глубинные законы шахмат. Если она не может этого сделать для простейшего класса позиций, то чего стоят её выводы в более сложных случаях?

Undying · 23 Sep 2018

WinPooh said: ↑

Кто-то ещё сомневается в том, что у программы из топ-3 данная версия выиграть не способна в принципе?
Click to expand...

То что в принципе Лила способна обыграть движок из топ-3 сомнений уже никаких. И Комодо и Стокфиш спаслись чудом. Т.е. примерно в одной из десяти партий Лила получает большой перевес. А чудесные спасения вечными быть не могут.

WinPooh said: ↑

Вообще, я считаю эндшпильные таблицы в данном контексте читерством.
Click to expand...

Читерство в другом. Все движки играют с эндшпильными таблицами, а Лила почему-то без. Соперники в неравным условиях находятся.

WinPooh said: ↑

Нейросеть должна познавать глубинные законы шахмат.
Click to expand...

Это вы сами придумали. Задача чисто практическая. Показать превосходство нейросети над алгоритмическом подходом даже в такой переборной игре как шахматы. Глубинность законов это дело десятое.

WinPooh said: ↑

Если она не может этого сделать для простейшего класса позиций, то чего стоят её выводы в более сложных случаях?
Click to expand...

Для этого Лилу надо на простейших позициях потренировать. А при обучении этого явно не делалось.

И может быть это вообще большая ошибка. По крайней мере человек учится от простого к сложному. И если человеку в принципе не давать играть простые эндшпили (определяя всегда результат по таблицам), то мне кажется это приведет к каким-то пробелам в его понимании шахмат, что может влиять даже на миттельшпиль. Конечно, может быть подобные аналогии между нейронкой и человеком неверны. Но я бы все-таки попробовал обучать нейронку честно без использования таблиц.

WinPooh · 23 Sep 2018

Кстати, против Ethereal тоже ещё ни разу "не шмогла".

WinPooh · 23 Sep 2018

Undying said: ↑

Показать превосходство нейросети над алгоритмическом подходом даже в такой переборной игре как шахматы. Глубинность законов это дело десятое.
Click to expand...

И вдруг оказывается, что превосходства-то никакого и нет, если с определённого момента в партии не использовать костыль в виде алгоритмически же подсчитанных таблиц.

Выскажу вообще крамольную мысль, что нынешние топ-программы уже вплотную подобрались к асимптотически недостижимому идеальному игроку, и дальнейшее усиление на достаточно большую величину просто невозможно.

Undying · 23 Sep 2018

WinPooh said: ↑

Кстати, против Ethereal тоже ещё ни разу "не шмогла".
Click to expand...

Ethereal Лила уже обыгрывала. На первом этапе. Но вообще Ethereal явно неудобный соперник для Лилы. После поражения он тут же отыгрался и больше пока не проигрывал.

—- добавлено: 23 Sep 2018, опубликовано: 23 Sep 2018 —-

WinPooh said: ↑

И вдруг оказывается, что превосходства-то никакого и нет, если с определённого момента в партии не использовать костыль в виде алгоритмически же подсчитанных таблиц.
Click to expand...

Вы всерьез считаете, что нейронка в принципе не способна понять, что две связанные пешки и слон против коня не выигрывают?

Явно в партии со Стокфишем нейронка в первый раз в "жизни" такую позицию увидела.

WinPooh said: ↑

Выскажу вообще крамольную мысль, что нынешние топ-программы уже вплотную подобрались к асимптотически недостижимому идеальному игроку, и дальнейшее усиление на достаточно большую величину просто невозможно.
Click to expand...

Далеко не подобрались. Кмс адвансер голый движок легко обыграет в матче. Потому что адвансер понимает в каких позициях алгоритмические движки плавают. А Лила не понимает, потому что нет у нее опыта игры с алгоритмическими движками.

Комсюк · 23 Sep 2018

Undying said: ↑

Кмс адвансер голый движок легко обыграет в матче.
Click to expand...

не подтвердилось на Иммортале

WinPooh · 23 Sep 2018

KEV81 said: ↑

Легко взглянуть на график прогресса лилы что бы понять что предел близок.
Click to expand...

Вихляющийся туда-сюда на плюс-минус тысячу единиц график Лилы скорее наводит на мысль, что близка шизофрения.

sovaz1997 · 23 Sep 2018

WinPooh said: ↑

Undying said: ↑

Показать превосходство нейросети над алгоритмическом подходом даже в такой переборной игре как шахматы. Глубинность законов это дело десятое.
Click to expand...

И вдруг оказывается, что превосходства-то никакого и нет, если с определённого момента в партии не использовать костыль в виде алгоритмически же подсчитанных таблиц.

Выскажу вообще крамольную мысль, что нынешние топ-программы уже вплотную подобрались к асимптотически недостижимому идеальному игроку, и дальнейшее усиление на достаточно большую величину просто невозможно.
Click to expand...

До предела еще очень далеко. Программы ошибаются (даже программы ТОП-уровня), нет идеального алгоритма. Да, они неплохо отсекают, но они не могут точно считать на ту глубину, которую они выдают. Есть позиция, которую половина ТОП-движков не решают (мат в 5 ходов там xD). Поставьте 32-фигурную базу и SF максимум 1-2 ничьи возьмет из 1000 партий.

По поводу игры LCZero: ее сила очень близка к силе игры ТОП-3 на этом железе. Причем играет не самая лучшая сеть. Да, с тактикой у нее все очень плохо. Но она играет не в тактические шахматы, а в чисто позиционные. И тут она превосходит всех в позиционном понимании. То, что она видит 15 пешек в ничейном окончании - свойство алгоритма.

Если за 6 месяцев программа практически достигла уровня Houdini и Komodo, то вряд ли она вдруг остановится в развитии. Проект по сути только начал свое развитие и мы не можем сказать, что будет через год. Давайте лучше дождемся и не будем делать предварительных выводов о том, что Lc0 никогда не достигнет уровня SF.

—- добавлено: 23 Sep 2018 —-

KEV81 said: ↑

Легко взглянуть на график прогресса лилы что бы понять что предел близок.
Click to expand...

Предел близок для конкретной сети (20x256)

Undying · 23 Sep 2018

KEV81 said: ↑

Легко взглянуть на график прогресса лилы что бы понять что предел близок.
Click to expand...

Во-первых, есть возможность чисто экстенсивного роста. Потенциал 4 V100 Лила сейчас использует процентов на десять. То есть в несколько раз еще точно ускорить можно. Во-вторых, откуда уверенность, что нынешняя версия Лилы обучена наилучшим образом. Разработчики всего месяц назад что-то подправили и получили сразу +150 пунктов к силе в сравнении с версией, которая в 4 дивизионе TCEC играла. В-третьих, обучение на играх с алгоритмическими движками выглядит очень перспективным направлением в плане увеличения практической силы игры.

WinPooh · 23 Sep 2018

WinPooh said: ↑

WinPooh said: ↑

sovaz1997 said: ↑

WinPooh, выборка очень маленькая. А так, Lc0 добилась выигранной позиции против SF и получила небольшой перевес против H черными
Click to expand...

Вернёмся к этой теме через пару-тройку кругов.
Click to expand...

Итак, после 20 партий (беру только этот этап) против первой тройки: 19 ничьих, 1 поражение.
Кто-то ещё сомневается в том, что у программы из топ-3 данная версия выиграть не способна в принципе?
Click to expand...

Хе-хе, в очередной раз убеждаюсь, какой я замечательный предсказатель.
Сейчас, кажется, выиграет у Комодо
В прошлый раз, помнится, я в 2007 предсказывал невозможность достижение силы про в Го в ближайшие лет 50.

Undying · 23 Sep 2018

WinPooh said: ↑

Хе-хе, в очередной раз убеждаюсь, какой я замечательный предсказатель.
Сейчас, кажется, выиграет у Комодо
Click to expand...

Вот она историческая победа.

WinPooh said: ↑

В прошлый раз, помнится, я в 2007 предсказывал невозможность достижение силы про в Го в ближайшие лет 50.
Click to expand...

Для алгоритмических движков правильно предсказывали.

sovaz1997 · 23 Sep 2018

LC0 и у Stockfish-а выигрывала в бонусе)

Чисто позиционно выиграла. Конечно, окончание партии Lc0 всегда затягивает.

Сила игры Lc0 в данной конфигурации, может, и выше, чем у Komodo. Но может и нет. Слишком мало партий, чтобы сделать выводы. Опять же, не самая лучшая сеть играет.

P. S. PGN опять не встраивается

Комсюк · 23 Sep 2018

sovaz1997 said: ↑

PGN опять не встраивается
Click to expand...

совсем шапку убирай, словами опишешь

Undying · 23 Sep 2018

sovaz1997 said: ↑

Чисто позиционно выиграла. Конечно, окончание партии Lc0 всегда затягивает.
Click to expand...

Когда есть прямая игра, Лила очень красиво играет. А вот когда нет, тогда ее бесконечные повторения ходов портят все эстетическое впечатление.

sovaz1997 said: ↑

Сила игры Lc0 в данной конфигурации, может, и выше, чем у Komodo. Но может и нет.
Click to expand...

У Лилы явный синдром Леко. Сильным не проигрывает, у слабых не выигрывает. В матче даже против Стокфиша результат неочевиден, а против Комодо я бы однозначно на Лилу ставил. А вот в разношерстном турнире типа первого этапа cccc шансов на соперничество с топ-3 никаких.

Undying · 24 Sep 2018

Все-таки Лилу надо честно обучать, без использования эндшпильных таблиц. А иначе в глубоком эндшпиле так и будут начинаться чудеса.

Вот такую позицию Лила в партии с Этзереалем оценила как совершенно выигранную (-7.53) и смело перешла в нее из реально выигранной позиции:

Подключение таблиц здесь не поможет. Эндшпиль 9 фигурный.

WinPooh · 24 Sep 2018

Я вот о чём задумался. В оригинальном препринте ДипМайнд сообщалось об универсальной программе, которая научилась играть и в шахматы, и в Го, и в сёги - архитектура сети и поиска одна и та же, только исходные данные разные, в виде правил и генераторов ходов. Энтузиасты написали сейчас по мотивам препринта реализации Лилы для шахмат и для Го, совершенно разные. А вот что с сёги? Кто-нибудь, интересно, пробовал написать зеро программу для этой игры? Правда, там информации для сравнения мало, даже партий не предоставили..

Mustitz · 24 Sep 2018

Undying said: ↑

Вы всерьез считаете, что нейронка в принципе не способна понять, что две связанные пешки и слон против коня не выигрывают?
Click to expand...

Почему не выигрывают?

1... Nf5 Loose in 25

Моё мнение, что шахматы это конкретная игра, и надо считать варианты.

—- добавлено: 24 Sep 2018, опубликовано: 24 Sep 2018 —-

sovaz1997 said: ↑

Если за 6 месяцев программа практически достигла уровня Houdini и Komodo, то вряд ли она вдруг остановится в развитии.
Click to expand...

Ну... график роста силы AlphaZero выходил на плато примерно на этом уровне.

Undying said: ↑

Все-таки Лилу надо честно обучать, без использования эндшпильных таблиц. А иначе в глубоком эндшпиле так и будут начинаться чудеса.
Click to expand...

Ещё раз (1) таблицы дадут более точную оценку в том числе для обучения; (2) таблицы увеличат число рассматриваемых вариантов.

Предположим, что Leela на этапе обучения сыграла 100 ладейных окончаний с пешками «f» и «h». Поскольку она играла их без таблиц, то могла допускать ошибки при защите (допустить ошибку там легко), поэтому оценка этого окончания будет в целом как выиграно для сильнейшей стороны. И нейросеть будет обучаться на основании этой оценки. Ну а дальше Leela будет переходить в подобные окончания как технически выигранные. Таким образом таблицы окончаний увеличат силу на этапе обучения, дадут более точные оценки окончаний, что увеличит качество нейросети.

Undying · 24 Sep 2018

Еще один глюк у Лилы в окончаниях. Проводя пешку она ставит ладью, а не ферзя. Например, в партии №229 с Андскашем. И это не первый раз такое уже.

—- добавлено: 24 Sep 2018, опубликовано: 24 Sep 2018 —-

Mustitz said: ↑

Ещё раз (1) таблицы дадут более точную оценку в том числе для обучения; (2) таблицы увеличат число рассматриваемых вариантов.
Click to expand...

В реальности использование таблиц при обучении привело к тому, что Лила в принципе не понимает, что одинокий слон не может сбить блокаду. Результат ничьи со Стокфишем и Этзереалем в абсолютно выигранных позициях. Причем, если в первом случае это не стало бы проблемой умей Лила пользоваться эндшпильными таблицами во время игры, то втором случае таблицы бы не помогли. Ничейный эндшпиль, который Лила считала абсолютно выигранным, 9 фигурный.

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

WinPooh В.М.

WinPooh В.М.

Undying Учаcтник

Sergey1983 Учаcтник

WinPooh В.М.

WinPooh В.М.

Mustitz Заслуженный

Undying Учаcтник

Undying Учаcтник

WinPooh В.М.

Undying Учаcтник

Kesandr Учаcтник

WinPooh В.М.

Sergey1983 Учаcтник

svoitsl Учаcтник

WinPooh В.М.

Undying Учаcтник

WinPooh В.М.

Undying Учаcтник

WinPooh В.М.

WinPooh В.М.

Undying Учаcтник

Комсюк народный модератор

WinPooh В.М.

sovaz1997 Учаcтник

Undying Учаcтник

WinPooh В.М.

Undying Учаcтник

sovaz1997 Учаcтник

Комсюк народный модератор

Undying Учаcтник

Undying Учаcтник

WinPooh В.М.

Mustitz Заслуженный

Undying Учаcтник

Share This Page