AlphaZero. Нейронная сеть играет в шахматы

Sergey1983 · 4 Apr 2018

По моему он натурально глючит, вчера работал более менее (но не без проблем!) - сегодня тратит на ход ~10 секунд а реально на обдумывание меньше секунды.

Кажется я понял это изза того что я прописал ему рейтинг(ChessMaster).

Kesandr · 4 Apr 2018

Sergey1983 said: ↑

Имя файла нейронки в кавычки не брали?
Если нет то попробуйте подключить в ScidVsPc там у меня заработало.
Click to expand...

А что откривать и где указать имя нейронки и какое оно должно бить? Бо я просто нейронку закинул у папку там где все файли. Имя нейронки после распаковки много безсмисленних литер.

Sergey1983 · 3 Apr 2018

Как подключить файл нейронки я писал выше:

Sergey1983 said: ↑

Что-то не работает движок просто не делает ходов и в списке процессов нету (poliglot, LcZero) даже log не создаётся.

—- добавлено: 3 Apr 2018, опубликовано: 3 Apr 2018 —-

Kesandr said: ↑

Нет Sergey1983 не указал и даже незнаю как это сделать. Если знаете как помогите мне пожалуйста.
Click to expand...

Поищите в настройках подключения движка(не в настройках самого движка!) строку ввода: "Параметры коммандной строки" (или просто "коммандная строка", не помню уже) и там введите -w "имя файла", где "имя файла" имя файла нейросети файл должен присутствовать в папке с движком.

—- добавлено: 3 Apr 2018 —-

Rom, включил log он мне пишет: Main(): Icorrect use of option "-t1", хотя опции -t1 нигде нет.
Click to expand...

Поповоду имени,файл нейронки можно переименовать и после ключа -w указать естественно новое имя.

—- добавлено: 4 Apr 2018 —-

Посмотрел сейчас Arenu: Engines->Manage->Details->General->Command Line Parametrs

Sergey1983 · 4 Apr 2018

Сделал турнир LcZero(Нейросеть 83) в ChessMaster, cоперниками были персонажи с рейтингами от 1600 до 2200, играла на 8-ядрах(i7 Skylake), набрала 4 из 5-ти очков, 1-е место(делит с двумя другими), по рейтингу третья 1804(Первое место 1847).

roman57 · 5 Apr 2018

Sergey1983 said: ↑

Сделал турнир LcZero(Нейросеть 83) в ChessMaster, cоперниками были персонажи с рейтингами от 1600 до 2200, играла на 8-ядрах(i7 Skylake), набрала 4 из 5-ти очков, 1-е место(делит с двумя другими), по рейтингу третья 1804(Первое место 1847).
Click to expand...

А если её запустить а Аквариум к стокфишу

Sergey1983 · 5 Apr 2018

Стокфиш должен всухую обыгрывать Магнуса у которого рейтинг >2800, делал в своё время подсчёт.

roman57 · 5 Apr 2018

Sergey1983 said: ↑

Стокфиш должен всухую обыгрывать Магнуса у которого рейтинг >2800, делал в своё время подсчёт.
Click to expand...

Ну одну то партию у стокфиша должен каждый выиграть , хотя бы в блиц , иначе все мои труды напрасны ^_^

Sergey1983 · 5 Apr 2018

Какие труды?

roman57 · 5 Apr 2018

Sergey1983 said: ↑

Какие труды?
Click to expand...

Есть система с помощью которой можно переиграть любой движок , на "Chess Book" во вконтакте показаны видео примеры , конечно для повторения нужно понять систему или запомнить нужный вариант для определённой версии , например stockfish в последнее время часто обновляется и варианты использования системы получаются разные , но в каждом видео обязательно написана версия движка , пробуйте - у многих уже получилось , а если будет желание понять систему глубже - я обязательно отвечу и расскажу все тонкости

admd · 5 Apr 2018

Рейтинг Лилы остановился:
http://lczero.org

Rom · 5 Apr 2018

Рано или поздно возможности данной нейросети будут исчерпаны и нужно будет увеличивать её размерность, чтобы добиться дальнейшего прогресса. Хочу только заметить, что поскольку при обучении Лила как бы изыскивает слабости у самой себя, то небольшой регресс совсем не означает, что нейросеть становится слабее.

Sergey1983 · 5 Apr 2018

По сравнению со многими другими движками Лила играет довольно слабо, так что скорее дело в насыщении или другой проблеме с сетью.

Rom · 5 Apr 2018

Текущая нейросеть очень небольшая. Можно сказать крошечная. Размерность у неё всего 6х64. У Гугла, для сравнения, нейросеть была 20х256. То есть в 50 раз больше, если не учитывать полносвязный выходной слой. Когда дорастём до такой величины, размер файла нейросети в распакованном виде превысит 300 Мб. Но, возможно, придётся увеличивать нейросеть ещё больше.

P.S. Не уверен, что текущая нейросеть уже достигла своего предела.

Sergey1983 · 5 Apr 2018

А не знаете когда они планируют увеличить размер сети и вообще нет ли какого планового графика развития движка?

Rom · 5 Apr 2018

Планового графика нет. В игре Го, например, увеличивают по факту стагнации (в ближайшие дни ожидается увеличение размерности до 15х192 или 20х256, в зависимости от результата тестов):
http://zero.sjeng.org/

crem · 5 Apr 2018

Увеличивать планировали скоро, но нашли серьёзный баг, который скорее всего съел существенную часть ёмкости сети. После его исправления сеть будет опять обучаться быстро. Будут ли одновременно с исправлением ошибки увеличивать сеть, ещё не решили, но пока большинство за то, чтобы так сделать.

Баг заключается в том, что по задумке ходы для чёрных и для белых должны были выглядеть одинаково. То есть и чёрные и белые например видят свои пешки на втором ряду, и ходят e2e4 (но для чёрных это на самом деле обозначает e7e5).
Так вот, доску для чёрных отображали как надо (свои пешки внизу), но ход от неё всё равно ждали не перевёрнутый, e7e5 вместо e2e4.

Получается, что сеть должна была отдельно учиться играть за белых и за чёрных, и на это тратилась ёмкость сети.

Есть ещё другой баг (ходы соперника при передаче истории кодируются неправильно перевёрнутыми), и он тоже ещё не исправлен, но он не настолько серьёзный. Но его исправят одновременно с этим.

Sergey1983 · 5 Apr 2018

Crem, Rom, откуда вы берёте информацию, если не секрет?

crem · 5 Apr 2018

Три источника:
https://github.com/glinscott/leela-chess/issues — список багов
https://groups.google.com/forum/#!forum/lczero — форум
https://discord.gg/pKujYxD — чат

Sergey1983 · 5 Apr 2018

Спасибо.

svoitsl · 6 Apr 2018

crem said: ↑

Увеличивать планировали скоро,
Click to expand...

Пожалуй с этим лучше не спешить, даже такая небольшая сеть требует громадных ресурсов, лучше на существующей все хорошо отработать (разумеется не только код), а тут ещё не початый край.

nn · 6 Apr 2018

Сыграл с новой версией на хард. Кажется связки и вскрытые шахи она еще не понимает.

svoitsl · 7 Apr 2018

А между тем LCZERO уже наиграла 100 сетей!!!
И пора бы уже допилить код,но он пока v. 0.4

Sergey1983 · 7 Apr 2018

Скоро должна выйти 0.5.

svoitsl · 8 Apr 2018

Считается, что хотя в фиктивных ЭЛО роста и нет, но миллион игр не куда не делись и в настоящих ЭЛО все же рост есть!
(хоть какой то )
Худо ли, бедно и но сеть до 1-го разряда дошла все же
(в отличии от меня например)

Yury_Solomatin · 8 Apr 2018

А люди могут играть с Лилой, чтобы ее обучать?

—- добавлено: 8 Apr 2018 —-

Мне кажется, такой находящийся в пеленках искусственный интеллект, с которым можно бороться любителям, привлек бы внимание шахматного сообщества и пофандрайзить тоже помог бы.
Только вам нужна еще модель, которая была бы лицом Лилы и чтобы она приятным голосом разговаривала.

Успехов.

svoitsl · 8 Apr 2018

Yury_Solomatin said: ↑

А люди могут играть с Лилой, чтобы ее обучать?
Click to expand...

Вообще кажется, что авторы этого движка наотрез отказываются от какого либо иного обучения, кроме самообучения.
Даже двух ходовый вариант (например научиться у Стокфиша играть уверенно ничью, а уж потом заняться самообучением) и то не устраивает.
Основная причина - отсутствие красоты теории, раньше считалось, что чтобы сделать неплохой шахматный движок надо бы и самому не дурно играть, но сейчас такая надобность вроде бы отпала.

Rom · 8 Apr 2018

Yury_Solomatin said: ↑

А люди могут играть с Лилой, чтобы ее обучать?
Click to expand...

Играть можно хоть сейчас, а вот нормально обучать не получится, поскольку нужны миллионы партий высокого качества. А где их взять?

Тренировочный пример (позиция с общей оценкой и оценкой каждого возможного хода), должен предоставлять сведения качественней, чем выдаёт сама нейросеть. Только в этом случае мы можем её обучать. В процессе обучения тренировочный пример как бы "прогоняется" через всю нейросеть в обратном направлении, от выхода ко входу. При этом коэффициенты нейросети немножко изменяются, как бы "подтягиваясь" к рекомендациям примера, чтобы в следующий раз, уже при игре, вывод нейросети стал чуть-чуть лучше.

Человеческие партии используются только для проверки, что система работает. Средний уровень базы из миллионов человеческих партий крайне невысок. Обычно нейросеть и на своих партиях достигает такого уровня очень быстро. Так что смысла особого нет. В начале тренировки самое главное оптимизировать код и отловить баги.

Как же получить тренировочные примеры уровнем выше чем выдаёт сама нейросеть? Очень просто. Поскольку нейросеть+перебор оценивает заведомо лучше чем чистая нейросеть, то нужно только позволить ей играть с самой собой с неглубоким, но достаточным, перебором вариантов. Перебор вскроет ошибки и таким образом даст лучшие оценки. Все партии самоигры, вместе с оценками позиций, сохраняются в общей базе.

Когда накопится достаточно партий для начала тренировочного цикла, они нарезаются на позиции с оценками, добавляются к предыдущим тренировочным примерам лучшего качества и хорошенько перетасовываются. После чего начинается описанный выше цикл обучения. После обучения измененная нейросеть снова начинает играть. Но обычно уже лучше. Далее всё повторяется, и таким образом нейросеть постепенно, шаг за шагом, подтягивает сама себя к вершинам мастерства, прямо как альпинист.

Mustitz · 8 Apr 2018

Rom said: ↑

Человеческие партии используются только для проверки, что система работает. Средний уровень базы из миллионов человеческих партий крайне невысок. Обычно нейросеть и на своих партиях достигает такого уровня очень быстро. Так что смысла особого нет. В начале тренировки самое главное оптимизировать код и отловить баги.
Click to expand...

Есть партии движков. Есть переписочные.

Партии человека слабы стратегически или тактически? В целом прогнать автокодировщиком базу человеческих партий не самая плохая идея...

Rom · 9 Apr 2018

Mustitz said: ↑

Есть партии движков. Есть переписочные.

Партии человека слабы стратегически или тактически? В целом прогнать автокодировщиком базу человеческих партий не самая плохая идея...
Click to expand...

Пробовали. И движковые и человеческие. Уровень тех сетей давно уже пройден нынешней Лилой, всего за пару недель. Конечно, сыграло свою роль то, что те сетки были небольшими - 6х64. Но если бы наигрывали сразу большие, то получили бы минус к скорости сейчас.

Sergey1983 · 9 Apr 2018

svoitsl said: ↑

Считается, что хотя в фиктивных ЭЛО роста и нет, но миллион игр не куда не делись и в настоящих ЭЛО все же рост есть!
(хоть какой то )
Худо ли, бедно и но сеть до 1-го разряда дошла все же
(в отличии от меня например)
Click to expand...

А вот по этим https://docs.google.com/spreadsheets/d/18UWR4FVhPi0vNwwPreu_avd9ycujGQ5ayR2LzJOWP4s/edit#gid=0 данным роста не было (он появился лишь за последние 1-2 дня(если появился))

Mustitz · 9 Apr 2018

Rom, причина может быть не в том, что уровень партий слабый. Причина может быть в том, что они не подходят по стилю. У людей и движков популярна сицилианка, в результате которой получаются достаточно насыщенные тактикой позиции, где недостаточно ни глубины нейросети, ни количества партий в узле. Поэтому сила игры стакается, потому что результат партии представляет собой рулетку.

Пломбир · 9 Apr 2018

Интересно, а каким образом будет происходить переход от маленькой сети 6х64 к большой? Как перенести накопленную информацию? Пытаюсь разобраться в вопросе, но мой английский никакой.
Кстати, никак не получается LCZero запустить на GPU. На трех машинах одно и тоже - вылетает. Все делал по инструкции. Тест какой-то в начале проходит, но работать не хочет. А при работе на CPU не могу никак заставить дольше считать. За это отвечает, команда "-p" как я понял.. она не распознается у меня почему-то.

crem · 9 Apr 2018

Переход от маленькой сети к большой осуществляется при помощи методов net2net ( https://arxiv.org/pdf/1511.05641.pdf ).

Вкратце: в ширину сеть увеличивается засчёт "расщипления" существующих узлов на несколько таким образом, чтобы они давали тот же результат что и до расщипления. Грубо говоря, если раньше было a = 5*b, то расщипляют b на c и d, и делают a = 2*c + 3*d.

В высоту сеть увеличивают засчёт добавления слоёв, которые с начальными коэффициентами ничего не делают, то есть выдают на выходе то, что пришло на вход. Если при этом добавить чуть-чуть шума, в дальнейшем сеть будет учиться быстрее.

По поводу GPU: попробуйте указать параметр -gpu 1 (или другой номер), чтобы явно указать, какой gpu используется.

Параметры -p и -v используются только когда внешняя программа GUI не сообщает сколько времени осталось. Если есть контроль времени, lczero.exe пытается сама решить сколько думать исходя из этого.

Rom · 9 Apr 2018

Добавлю только, что существует ещё один способ перехода на сеть большей размерности. Можно просто создать "пустую" нейросеть большей размерности, и натренировать её с нуля на партиях предыдущей сети. Поскольку тренировка сети выполняется примерно в 1000 раз быстрее, чем наигрывание партий при самоигре, то процесс протекает относительно быстро, даже на одном компьютере.

Хочу ещё отметить, что в Го использование net2net натолкнулось на некоторые затруднения, которые (кажется) только что успешно преодолены. При тренировке Лила Го Зеро переход с помощью net2net на 10х128 не вызвал проблем и сразу дал большую прибавку, а вот при переходе на 15х192 пришлось вернуться достаточно далеко "в прошлое", выполнить net2net на старой сети и последние 1,5 миллиона партий дотренировывать увеличенную сеть указанным выше способом.

crem · 9 Apr 2018

Да, сейчас тренируют сеть 6x64, и одновременно сеть 10x128 (для сравнения скорости игры и тренировки), именно таким образом заново с нуля, с исправленными багами. Планируется, что это займёт около суток. Но чтоб пользоваться этой сетью, нужна будет новая версия lczero.exe, v0.5, с исправленными этими же багами.

На больших сетях это будет не так быстро, и там уже будет net2net.

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

Sergey1983 Учаcтник

Kesandr Учаcтник

Sergey1983 Учаcтник

Sergey1983 Учаcтник

roman57 Учаcтник

Sergey1983 Учаcтник

roman57 Учаcтник

Sergey1983 Учаcтник

roman57 Учаcтник

admd Заблокирован

Rom Старожил

Sergey1983 Учаcтник

Rom Старожил

Sergey1983 Учаcтник

Rom Старожил

crem Учаcтник

Sergey1983 Учаcтник

crem Учаcтник

Sergey1983 Учаcтник

svoitsl Учаcтник

nn Заблокирован

svoitsl Учаcтник

Sergey1983 Учаcтник

svoitsl Учаcтник

Yury_Solomatin Учаcтник

svoitsl Учаcтник

Rom Старожил

Mustitz Заслуженный

Rom Старожил

Sergey1983 Учаcтник

Mustitz Заслуженный

Пломбир Новичок

crem Учаcтник

Rom Старожил

crem Учаcтник

Share This Page