AlphaZero. Нейронная сеть играет в шахматы

Boroda · 11 июн 2018

Вечером было 3000, утром стало 2600, вообщем ни чо не понятно!

svoitsl · 11 июн 2018

Boroda пишет: ↑

вообщем ни чо не понятно!
Нажмите, чтобы раскрыть...

Это наверное очередная калибровка прошла и уточнение каких нибудь коэффициентов,
Но особого эффекта от устранение последнего бага что то не очень заметно.
А вот саморейтинг при 6х64 даже снизился

.

Boroda · 12 июн 2018

Вообщем ни какого избиения Стокфиша, в этом году ждать не приходится, максимум на что можно надеяться, так это на выход в 3 дивизион на ТСЕС, или, если быть совсем отъявленным оптимистом, то на выход во второй! И то если там разрешат играть на GPU. Хотя, что говорить это всё равно будет круто!
Но учтите, господа разработчики, в 2019г, мы ждём от вас убедительно превосходства Лилы над всеми грандами компьютерных шахмат!

xmuzaax · 12 июн 2018

а вот объясните мне, непонимающему, как в MCTS работает этап симуляции (выиграшная позиция или нет):
если в альфазеро (ну или в более простом варианте) нейросеть определяет качество текущей позиции играя партию до конца, то почему не использовать этот метод для всей партии и тогда вообще зачем MCTS? Почему тогда играя партию до конца не запоминаются эти позиции в деверо с соответсвующим результатом?

Polarity · 12 июн 2018

Партии до конца не играются. Доигрывание узла дерева до конца называется роллаутом. Так делали раньше. Минус такого подхода - большая дисперсия оценки и она может быть сильно смещена.
С MCTS всё очень просто. Это алгоритм поиска. Он улучшает оценку нейросети, т. к. она очевидно работает не идеально.
Что делать в конце, если доигрывания нет? Просто берётся выход нейросети, отвечающий за качество позиции и всё.

Сергей63 · 17 июн 2018

А где Стиль?

Boroda · 24 июн 2018

Что то как то тихо в лесу... Кто нить знает, когда окончательно перезапустят обучение? Неужели не все баги еще исправили?

Sergey1983 · 24 июн 2018

Boroda пишет: ↑

Что то как то тихо в лесу... Кто нить знает, когда окончательно перезапустят обучение? Неужели не все баги еще исправили?
Нажмите, чтобы раскрыть...

Мне это тоже интересно.

Sergey1983 · 24 июн 2018

LcZero(вроде Cuda версия) сыграла две ничьи со Stockfish 9

Polarity · 25 июн 2018

Пытались долгое время повторить результат самого первого теста.
Недавно нашли баг, который мог сильно повлиять на все тесты со 2 по 7.
В 8 тесте выбрали не совсем удачную стратегию понижения LR, поэтому она видимо скатилась в локальный минимум, из которого уже не смогла выбраться.
А вот тест 9 уже вышел сравнимым по силе с тестом 1, так что дальше прогресс я думаю пойдёт намного быстрее. Судя по тому, как в последнее время всё движется, мне кажется, что стоит ожидать относительно скоро выхода 20x256 сети в основной пайплайн.

Ну и ничья со стокфишем - это давно уже пройденный этап.
Вот примеры ничейных результатов разных версий Leela с dev версией стокфиша на 20 ядрах:
https://lichess.org/P2GRf7Y3
https://lichess.org/Lxh7LwcD
https://lichess.org/JhlZDEBx
https://lichess.org/zrGroCM5

Sergey1983 · 25 июн 2018

Как сеть 20x256, они же собирались перезапускать обучение?

Polarity · 28 июн 2018

Ещё рано говорить о перезапуске, нужно отладить параметры и убедиться что всё работает хорошо. Но полноценный перезапуск уже не за горами.
Совсем недавно перезапустили тест, теперь там 20x256 сеть. Отслеживать прогресс можно тут:http://testserver.lczero.org/

svoitsl · 28 июн 2018

Polarity пишет: ↑

Но полноценный перезапуск уже не за горами.
Нажмите, чтобы раскрыть...

Пока только известно что не на этой ни на следующей недели его не будет

Polarity пишет: ↑

Отслеживать прогресс
Нажмите, чтобы раскрыть...

отслеживать придется долго, из за большой сети скорость наигрывания существенно упала
(всего 2 с небольшим тысячи игр в сутки,то есть на 3 порядка, кажется )

Boroda · 28 июн 2018

Как это две тысячи, если сегодня только уже 40000 с лишним тысяч наиграли?

pavelgttfj8 · 7 июл 2018

21.Bc4 Норм
https://www.youtube.com/watch?v=2m5oXlZ_e_A

Sergey1983 · 7 июл 2018

Здесь в 6 пункте http://blog.lczero.org/2018/07/02/project-update/
пишется что осуществляется переход на 16 битную арифметику, но поддержка будет только на видеокартах Titan, это что же все владельцы видеокарт GTX остаются за "бортом", или же для них будет какая-то альтернатива на GPU?

Rom · 7 июл 2018

Sergey1983 пишет: ↑

Здесь в 6 пункте http://blog.lczero.org/2018/07/02/project-update/
пишется что осуществляется переход на 16 битную арифметику, но поддержка будет только на видеокартах Titan, это что же все владельцы видеокарт GTX остаются за "бортом", или же для них будет какая-то альтернатива на GPU?
Нажмите, чтобы раскрыть...

Просто у владельцев Титанов скорость стала в два раза выше. Остальных это не коснулось. Сравнить скорости до и после можно здесь:
https://docs.google.com/spreadsheet...7Vul4DpRNfn6K8oeCjBILe6uA/edit#gid=1508569046

P.S. Насколько я знаю 1080 Ti поддерживает int8, так что и для владельцев таких карт ещё не всё потеряно.

Sergey1983 · 7 июл 2018

То есть, будут сетки и в старой арифметике? Если так, то хорошо.

Rom · 7 июл 2018

Sergey1983 пишет: ↑

То есть, будут сетки и в старой арифметике? Если так, то хорошо.
Нажмите, чтобы раскрыть...

Не исключено, что они все будут в старой арифметике, просто на Титанах будет производится округление. Впрочем, деталей я не знаю.

Boroda · 8 июл 2018

Народ подскажите, а можно в арене задать условия турнира, чтобы движок,
(например Лила) играла с несколькими противниками, а они между собой не играли? А то решил протестировать Лилу с разными движками, но неохота каждый раз создавать новый турнир.

Vladruss · 8 июл 2018

Boroda пишет: ↑

Народ подскажите, а можно в арене задать условия турнира, чтобы движок,
(например Лила) играла с несколькими противниками, а они между собой не играли? А то решил протестировать Лилу с разными движками, но неохота каждый раз создавать новый турнир.
Нажмите, чтобы раскрыть...

Видимо, надо делать так:

Хотя я не люблю Арену и тоже в ней плохо разбираюсь.

Boroda · 8 июл 2018

Спасибо попробую!

Sergey1983 · 10 июл 2018

Как я понял обновление основного сервера не за горами https://blog.lczero.org//2018/07/09/project-update/

Sergey1983 · 10 июл 2018

Crem, а нельзя ли после перезапуска сервера добавить поддержку шахмат Фишера?

Mustitz · 10 июл 2018

Sergey1983 пишет: ↑

Crem, а нельзя ли после перезапуска сервера добавить поддержку шахмат Фишера?
Нажмите, чтобы раскрыть...

А кто будет тренировать нейросеть?

Sergey1983 · 10 июл 2018

Её хоть так хоть так тренируют(и я в том числе), а шахматы фишера это лишь новые позиции которые улучшат понимание шахмат LcZero.
подобная идея уже была https://groups.google.com/forum/#!topic/lczero/C2PY8Lm8GMA

Boroda · 11 июл 2018

На основном сервере, новым сетям наконец то удалось обыграть 390 сеть, для этого понадбилось почти 100 поколений сети!

WinPooh · 11 июл 2018

Sergey1983 пишет: ↑

Её хоть так хоть так тренируют(и я в том числе), а шахматы фишера это лишь новые позиции которые улучшат понимание шахмат LcZero.
Нажмите, чтобы раскрыть...

Ещё и другие ходы - рокировки нетривиального вида. Насколько они хорошо лягут на существующую архитектуру сети?

Sergey1983 · 11 июл 2018

Но, если ляжет почему бы не сделать?По ссылке выше писали что позиции во многом похожие поэтому замедление обучения не должно быть таким уж большим, кроме того я в том числе спрашиваю мнение других хотя окончательно прояснит ситуацию пожалуй лишь Crem.

Polarity · 12 июл 2018

Я согласен, что для анализа позиций это может быть полезным. Но для игры - скорее всего, нет, т. к. это уменьшает capacity нейронной сети для ходов из реальной игры.

Mustitz · 12 июл 2018

В любом случае для анализа позиций куда более полезны позиции из классических шахмат. Если у нас король с b8 может рокировать на g8, то эта особенность может быть надо будет учитывать в шахматах Фишера, но для классических шахмат она более чем бесполезна.

Я просто не сильно владею на тему того, как именно используются тестовые партии в обучении. И насколько велика вероятность, что сеть будет стремится к тому, чтобы глубоко знать небольшое количество дебютов. А это вполне себе локальный максимум, который использует большинство белковых шахматистов — иметь свой дебютный репертуар. В принципе, чтобы проверить это, надо просто посмотреть на статистику по дебютам в тестовых партиях. Если дебюты однообразны — сеть будет настроена на узкий дебютный репертуар.

Но этого вполне можно избежать, если наигрывание тестовых партий реализовывать как большой MCTS где в UCT увеличить коэффициент исследования. Тогда в тестовых партиях будут разыгрываться самые разные дебюты, сеть будет учиться на большом количестве разнообразных позиций.

Rom · 12 июл 2018

С одной стороны специализация на одной начальной расстановке должна дать результаты "глубже", чем необходимость разбрасываться по разным расстановкам шахмат Фишера, невозможным в реальной партии. С другой стороны, не возникает ли в классической расстановке некоторый аналог переобучения нейросети, из-за ограниченного количества позиций в начальной стадии партии, что в итоге даже снизит общую силу игры. (Вопросы рокировки в шахматах Фишера при обучении можно как-нибудь решить.)

—- добавлено: 12 июл 2018, опубликовано: 12 июл 2018 —-

Кстати, к вопросу о вариативности. Уж коли мы не можем раздавать некоторым не столь продвинутым видеокартам данные для самоигры в половинной точности (см. обсуждение на предыдущей странице), и поскольку половинная точность не слишком сказывается на качестве игры, то нельзя ли раздавать таким видеокартам для самоигры нейросетки с рандомными значениями последних значащих цифр? А мастер-сеть хранить только на сервере для обучения? Не знаю правда, не трудно ли это с точки зрения реализации и даст ли необходимую вариативность?

Polarity · 12 июл 2018

Переобучение возникает, когда данных недостаточно. Тут данные можно генерировать бесконечно.

Rom · 12 июл 2018

Polarity пишет: ↑

Переобучение возникает, когда данных недостаточно. Тут данные можно генерировать бесконечно.
Нажмите, чтобы раскрыть...

В начале партии количество позиций ограничено. То есть дебютные позиции нейросеть по сути запоминает, вместо того, чтобы заниматься обобщением.

WinPooh · 12 июл 2018

Rom пишет: ↑

Polarity пишет: ↑

Переобучение возникает, когда данных недостаточно. Тут данные можно генерировать бесконечно.
Нажмите, чтобы раскрыть...

В начале партии количество позиций ограничено. То есть дебютные позиции нейросеть по сути запоминает, вместо того, чтобы заниматься обобщением.
Нажмите, чтобы раскрыть...

Так против запоминания есть всякие специальные техники, типа дропаута, добавления случайного шума и т.д.

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

Boroda Новичок

svoitsl Учаcтник

Boroda Новичок

xmuzaax Начинающий

Polarity Новичок

Сергей63 Новичок

Boroda Новичок

Sergey1983 Учаcтник

Sergey1983 Учаcтник

Polarity Новичок

Sergey1983 Учаcтник

Polarity Новичок

svoitsl Учаcтник

Boroda Новичок

pavelgttfj8 Учаcтник

Sergey1983 Учаcтник

Rom Старожил

Sergey1983 Учаcтник

Rom Старожил

Boroda Новичок

Vladruss НедоКМС, победитель второразрядников.

Boroda Новичок

Sergey1983 Учаcтник

Sergey1983 Учаcтник

Mustitz Заслуженный

Sergey1983 Учаcтник

Boroda Новичок

WinPooh В.М.

Sergey1983 Учаcтник

Polarity Новичок

Mustitz Заслуженный

Rom Старожил

Polarity Новичок

Rom Старожил

WinPooh В.М.

Поделиться этой страницей