AlphaZero. Нейронная сеть играет в шахматы

Boroda · 11 Jun 2018

Вечером было 3000, утром стало 2600, вообщем ни чо не понятно!

svoitsl · 11 Jun 2018

Boroda said: ↑

вообщем ни чо не понятно!
Click to expand...

Это наверное очередная калибровка прошла и уточнение каких нибудь коэффициентов,
Но особого эффекта от устранение последнего бага что то не очень заметно.
А вот саморейтинг при 6х64 даже снизился

.

Boroda · 12 Jun 2018

Вообщем ни какого избиения Стокфиша, в этом году ждать не приходится, максимум на что можно надеяться, так это на выход в 3 дивизион на ТСЕС, или, если быть совсем отъявленным оптимистом, то на выход во второй! И то если там разрешат играть на GPU. Хотя, что говорить это всё равно будет круто!
Но учтите, господа разработчики, в 2019г, мы ждём от вас убедительно превосходства Лилы над всеми грандами компьютерных шахмат!

xmuzaax · 12 Jun 2018

а вот объясните мне, непонимающему, как в MCTS работает этап симуляции (выиграшная позиция или нет):
если в альфазеро (ну или в более простом варианте) нейросеть определяет качество текущей позиции играя партию до конца, то почему не использовать этот метод для всей партии и тогда вообще зачем MCTS? Почему тогда играя партию до конца не запоминаются эти позиции в деверо с соответсвующим результатом?

Polarity · 12 Jun 2018

Партии до конца не играются. Доигрывание узла дерева до конца называется роллаутом. Так делали раньше. Минус такого подхода - большая дисперсия оценки и она может быть сильно смещена.
С MCTS всё очень просто. Это алгоритм поиска. Он улучшает оценку нейросети, т. к. она очевидно работает не идеально.
Что делать в конце, если доигрывания нет? Просто берётся выход нейросети, отвечающий за качество позиции и всё.

Сергей63 · 17 Jun 2018

А где Стиль?

Boroda · 24 Jun 2018

Что то как то тихо в лесу... Кто нить знает, когда окончательно перезапустят обучение? Неужели не все баги еще исправили?

Sergey1983 · 24 Jun 2018

Boroda said: ↑

Что то как то тихо в лесу... Кто нить знает, когда окончательно перезапустят обучение? Неужели не все баги еще исправили?
Click to expand...

Мне это тоже интересно.

Sergey1983 · 24 Jun 2018

LcZero(вроде Cuda версия) сыграла две ничьи со Stockfish 9

Polarity · 25 Jun 2018

Пытались долгое время повторить результат самого первого теста.
Недавно нашли баг, который мог сильно повлиять на все тесты со 2 по 7.
В 8 тесте выбрали не совсем удачную стратегию понижения LR, поэтому она видимо скатилась в локальный минимум, из которого уже не смогла выбраться.
А вот тест 9 уже вышел сравнимым по силе с тестом 1, так что дальше прогресс я думаю пойдёт намного быстрее. Судя по тому, как в последнее время всё движется, мне кажется, что стоит ожидать относительно скоро выхода 20x256 сети в основной пайплайн.

Ну и ничья со стокфишем - это давно уже пройденный этап.
Вот примеры ничейных результатов разных версий Leela с dev версией стокфиша на 20 ядрах:
https://lichess.org/P2GRf7Y3
https://lichess.org/Lxh7LwcD
https://lichess.org/JhlZDEBx
https://lichess.org/zrGroCM5

Sergey1983 · 25 Jun 2018

Как сеть 20x256, они же собирались перезапускать обучение?

Polarity · 28 Jun 2018

Ещё рано говорить о перезапуске, нужно отладить параметры и убедиться что всё работает хорошо. Но полноценный перезапуск уже не за горами.
Совсем недавно перезапустили тест, теперь там 20x256 сеть. Отслеживать прогресс можно тут:http://testserver.lczero.org/

svoitsl · 28 Jun 2018

Polarity said: ↑

Но полноценный перезапуск уже не за горами.
Click to expand...

Пока только известно что не на этой ни на следующей недели его не будет

Polarity said: ↑

Отслеживать прогресс
Click to expand...

отслеживать придется долго, из за большой сети скорость наигрывания существенно упала
(всего 2 с небольшим тысячи игр в сутки,то есть на 3 порядка, кажется )

Boroda · 28 Jun 2018

Как это две тысячи, если сегодня только уже 40000 с лишним тысяч наиграли?

pavelgttfj8 · 7 Jul 2018

21.Bc4 Норм
https://www.youtube.com/watch?v=2m5oXlZ_e_A

Sergey1983 · 7 Jul 2018

Здесь в 6 пункте http://blog.lczero.org/2018/07/02/project-update/
пишется что осуществляется переход на 16 битную арифметику, но поддержка будет только на видеокартах Titan, это что же все владельцы видеокарт GTX остаются за "бортом", или же для них будет какая-то альтернатива на GPU?

Rom · 7 Jul 2018

Sergey1983 said: ↑

Здесь в 6 пункте http://blog.lczero.org/2018/07/02/project-update/
пишется что осуществляется переход на 16 битную арифметику, но поддержка будет только на видеокартах Titan, это что же все владельцы видеокарт GTX остаются за "бортом", или же для них будет какая-то альтернатива на GPU?
Click to expand...

Просто у владельцев Титанов скорость стала в два раза выше. Остальных это не коснулось. Сравнить скорости до и после можно здесь:
https://docs.google.com/spreadsheet...7Vul4DpRNfn6K8oeCjBILe6uA/edit#gid=1508569046

P.S. Насколько я знаю 1080 Ti поддерживает int8, так что и для владельцев таких карт ещё не всё потеряно.

Sergey1983 · 7 Jul 2018

То есть, будут сетки и в старой арифметике? Если так, то хорошо.

Rom · 7 Jul 2018

Sergey1983 said: ↑

То есть, будут сетки и в старой арифметике? Если так, то хорошо.
Click to expand...

Не исключено, что они все будут в старой арифметике, просто на Титанах будет производится округление. Впрочем, деталей я не знаю.

Boroda · 8 Jul 2018

Народ подскажите, а можно в арене задать условия турнира, чтобы движок,
(например Лила) играла с несколькими противниками, а они между собой не играли? А то решил протестировать Лилу с разными движками, но неохота каждый раз создавать новый турнир.

Vladruss · 8 Jul 2018

Boroda said: ↑

Народ подскажите, а можно в арене задать условия турнира, чтобы движок,
(например Лила) играла с несколькими противниками, а они между собой не играли? А то решил протестировать Лилу с разными движками, но неохота каждый раз создавать новый турнир.
Click to expand...

Видимо, надо делать так:

Хотя я не люблю Арену и тоже в ней плохо разбираюсь.

Boroda · 8 Jul 2018

Спасибо попробую!

Sergey1983 · 10 Jul 2018

Как я понял обновление основного сервера не за горами https://blog.lczero.org//2018/07/09/project-update/

Sergey1983 · 10 Jul 2018

Crem, а нельзя ли после перезапуска сервера добавить поддержку шахмат Фишера?

Mustitz · 10 Jul 2018

Sergey1983 said: ↑

Crem, а нельзя ли после перезапуска сервера добавить поддержку шахмат Фишера?
Click to expand...

А кто будет тренировать нейросеть?

Sergey1983 · 10 Jul 2018

Её хоть так хоть так тренируют(и я в том числе), а шахматы фишера это лишь новые позиции которые улучшат понимание шахмат LcZero.
подобная идея уже была https://groups.google.com/forum/#!topic/lczero/C2PY8Lm8GMA

Boroda · 11 Jul 2018

На основном сервере, новым сетям наконец то удалось обыграть 390 сеть, для этого понадбилось почти 100 поколений сети!

WinPooh · 11 Jul 2018

Sergey1983 said: ↑

Её хоть так хоть так тренируют(и я в том числе), а шахматы фишера это лишь новые позиции которые улучшат понимание шахмат LcZero.
Click to expand...

Ещё и другие ходы - рокировки нетривиального вида. Насколько они хорошо лягут на существующую архитектуру сети?

Sergey1983 · 11 Jul 2018

Но, если ляжет почему бы не сделать?По ссылке выше писали что позиции во многом похожие поэтому замедление обучения не должно быть таким уж большим, кроме того я в том числе спрашиваю мнение других хотя окончательно прояснит ситуацию пожалуй лишь Crem.

Polarity · 12 Jul 2018

Я согласен, что для анализа позиций это может быть полезным. Но для игры - скорее всего, нет, т. к. это уменьшает capacity нейронной сети для ходов из реальной игры.

Mustitz · 12 Jul 2018

В любом случае для анализа позиций куда более полезны позиции из классических шахмат. Если у нас король с b8 может рокировать на g8, то эта особенность может быть надо будет учитывать в шахматах Фишера, но для классических шахмат она более чем бесполезна.

Я просто не сильно владею на тему того, как именно используются тестовые партии в обучении. И насколько велика вероятность, что сеть будет стремится к тому, чтобы глубоко знать небольшое количество дебютов. А это вполне себе локальный максимум, который использует большинство белковых шахматистов — иметь свой дебютный репертуар. В принципе, чтобы проверить это, надо просто посмотреть на статистику по дебютам в тестовых партиях. Если дебюты однообразны — сеть будет настроена на узкий дебютный репертуар.

Но этого вполне можно избежать, если наигрывание тестовых партий реализовывать как большой MCTS где в UCT увеличить коэффициент исследования. Тогда в тестовых партиях будут разыгрываться самые разные дебюты, сеть будет учиться на большом количестве разнообразных позиций.

Rom · 12 Jul 2018

С одной стороны специализация на одной начальной расстановке должна дать результаты "глубже", чем необходимость разбрасываться по разным расстановкам шахмат Фишера, невозможным в реальной партии. С другой стороны, не возникает ли в классической расстановке некоторый аналог переобучения нейросети, из-за ограниченного количества позиций в начальной стадии партии, что в итоге даже снизит общую силу игры. (Вопросы рокировки в шахматах Фишера при обучении можно как-нибудь решить.)

—- добавлено: 12 Jul 2018, опубликовано: 12 Jul 2018 —-

Кстати, к вопросу о вариативности. Уж коли мы не можем раздавать некоторым не столь продвинутым видеокартам данные для самоигры в половинной точности (см. обсуждение на предыдущей странице), и поскольку половинная точность не слишком сказывается на качестве игры, то нельзя ли раздавать таким видеокартам для самоигры нейросетки с рандомными значениями последних значащих цифр? А мастер-сеть хранить только на сервере для обучения? Не знаю правда, не трудно ли это с точки зрения реализации и даст ли необходимую вариативность?

Polarity · 12 Jul 2018

Переобучение возникает, когда данных недостаточно. Тут данные можно генерировать бесконечно.

Rom · 12 Jul 2018

Polarity said: ↑

Переобучение возникает, когда данных недостаточно. Тут данные можно генерировать бесконечно.
Click to expand...

В начале партии количество позиций ограничено. То есть дебютные позиции нейросеть по сути запоминает, вместо того, чтобы заниматься обобщением.

WinPooh · 12 Jul 2018

Rom said: ↑

Polarity said: ↑

Переобучение возникает, когда данных недостаточно. Тут данные можно генерировать бесконечно.
Click to expand...

В начале партии количество позиций ограничено. То есть дебютные позиции нейросеть по сути запоминает, вместо того, чтобы заниматься обобщением.
Click to expand...

Так против запоминания есть всякие специальные техники, типа дропаута, добавления случайного шума и т.д.

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

Boroda Новичок

svoitsl Учаcтник

Boroda Новичок

xmuzaax Начинающий

Polarity Новичок

Сергей63 Новичок

Boroda Новичок

Sergey1983 Учаcтник

Sergey1983 Учаcтник

Polarity Новичок

Sergey1983 Учаcтник

Polarity Новичок

svoitsl Учаcтник

Boroda Новичок

pavelgttfj8 Учаcтник

Sergey1983 Учаcтник

Rom Старожил

Sergey1983 Учаcтник

Rom Старожил

Boroda Новичок

Vladruss НедоКМС, победитель второразрядников.

Boroda Новичок

Sergey1983 Учаcтник

Sergey1983 Учаcтник

Mustitz Заслуженный

Sergey1983 Учаcтник

Boroda Новичок

WinPooh В.М.

Sergey1983 Учаcтник

Polarity Новичок

Mustitz Заслуженный

Rom Старожил

Polarity Новичок

Rom Старожил

WinPooh В.М.

Share This Page