AlphaZero. Нейронная сеть играет в шахматы

grizly · 6 дек 2017

Заодно AlphaZero научили играть в шахматы. Тестовый матч при контроле 1 мин/ход 4TPU ALphaZero против 64core Stockfish AlphaZero выиграла W-D-L 28-72-0
https://arxiv.org/pdf/1712.01815.pdf

Комсюк · 6 дек 2017

grizly, а как партии скачать?

grizly · 6 дек 2017

Здесь их выкладывают, наверно, те которые в статье.

И еще та же AlphaZero выиграла у AlphaGo Zero 60-40 в го, естественно

Комсюк · 6 дек 2017

забавно...

grizly · 6 дек 2017

Немного намухлевали, конечно. Контроль выбрали удобным для AlphaZero, для которого Стокфиш не оптимизирована, и он не дает возможности разрешить fail low, а также потратить больше времени где нужно, и версия TCEC 2016. Наверно, если бы новая версия была с общепринятым контролем, они бы были очень близко.

Комсюк · 6 дек 2017

grizly пишет: ↑

Наверно, если бы новая версия была с общепринятым контролем, они бы были очень близко.
Нажмите, чтобы раскрыть...

нет, разница в сотню Эло, а вяленый с тех пор прибавил только 40

nn · 6 дек 2017

Комсюк пишет: ↑

нет, разница в несколько сот Эло, а вяленый с тех пор прибавил только 40
Нажмите, чтобы раскрыть...

Мне кажется, что если стокфиш дать не 1 мин/ход, а 40мин/40 ходов, то это еще 20-30 ело

Комсюк · 6 дек 2017

nn, посчитайте разницу рейтов, пожалуйста

grizly пишет: ↑

W-D-L 28-72-0
Нажмите, чтобы раскрыть...

nn · 6 дек 2017

примерно было бы вместо 98 в лучшем варианте 98 - 43 - 30 = 25

Вычислительные мощности еще непонятно как сравнить. Это, конечно, все равно огромное достижение. Они тренировали всего лишь день, и удовлетворились таким результатом с таким контролем. Потренировали бы дольше, играла бы сильнее.

Но главное достижение это то, что одна и та же сеть решает широкий круг задач на ранее недостижимом уровне.

4547 · 6 дек 2017

grizly пишет: ↑

Заодно AlphaZero научили играть в шахматы. Тестовый матч при контроле 1 мин/ход 4TPU ALphaZero против 64core Stockfish AlphaZero выиграла W-D-L 28-72-0
Нажмите, чтобы раскрыть...

Они играли в "Шахматы с друзьями" вконтакте?

Комсюк · 6 дек 2017

Комсюк пишет: ↑

разница в несколько сот Эло
Нажмите, чтобы раскрыть...

не поленился, завёл результаты такого матча во Фритц
оболочка выдала ровно 100 пунктов разницы

UPD. поправил предыдущий пост

nn · 6 дек 2017

Комсюк пишет: ↑

оболочка выдала ровно 100 пунктов разницы
Нажмите, чтобы раскрыть...

Из разложения Тейлора приблизительная формула 28/2 * 7

Комсюк · 6 дек 2017

вы меня переоцениваете

4547 · 6 дек 2017

Объясните чем эта АльфаЗеро принципиально отличается? Почему ее ходы более "человечные"?

Комсюк · 6 дек 2017

nn пишет: ↑

Они тренировали всего лишь день, и удовлетворились таким результатом с таким контролем. Потренировали бы дольше, играла бы сильнее.
Нажмите, чтобы раскрыть...

дайте телефончик этик кадров... мне в адванс надо пару партий посмотреть
Заодно и Альфу потренируем!

—- добавлено: 6 дек 2017, опубликовано: 6 дек 2017 —-

4547 пишет: ↑

Объясните чем эта АльфаЗеро принципиально отличается? Почему ее ходы более "человечные"?
Нажмите, чтобы раскрыть...

Rom · 6 дек 2017

4547 пишет: ↑

Объясните чем эта АльфаЗеро принципиально отличается? Почему ее ходы более "человечные"?
Нажмите, чтобы раскрыть...

Внутри у ней нейронка.

nn · 6 дек 2017

Комсюк пишет: ↑

дайте телефончик этик кадров... мне в адванс надо пару партий посмотреть
Заодно и Альфу потренируем!
Нажмите, чтобы раскрыть...

Телефон не знаю , можно наверно найти, если постараться. Возглавляет Demis Hassabis
https://twitter.com/demishassabis
https://ratings.fide.com/card.phtml?event=401307

Комсюк · 6 дек 2017

nn пишет: ↑

можно наверно найти, если постараться.
Нажмите, чтобы раскрыть...

зарегался на arXiv'е
ну, гады-сопернички, держитесь!

nn · 6 дек 2017

Вот еще есть pgn и партии на личесс с компьютерной оценкой
https://lichess.org/zbCOTavB
https://lichess.org/CXpk8N5X
https://lichess.org/zDJ4IyBP
https://lichess.org/tnbEgxLG
https://lichess.org/ZMuecDNu
https://lichess.org/Y6tIfcqu
https://lichess.org/KRYcCvtd
https://lichess.org/tJzewmVJ
https://lichess.org/SfaOcHXM
https://lichess.org/B6ebUyzC

Комсюк · 6 дек 2017

nn пишет: ↑

с компьютерной оценкой
Нажмите, чтобы раскрыть...

4547 · 6 дек 2017

что-то лажа какая-то или это какой-то урезанный сток. он даже на личесс показывает более сильные ходы..

Scaramuccia · 6 дек 2017

Комсюк пишет: ↑

забавно...

Нажмите, чтобы раскрыть...

Скучные компьютерные шахматы.

Комсюк · 6 дек 2017

4547 пишет: ↑

что-то лажа какая-то или это какой-то урезанный сток. он даже на личесс показывает более сильные ходы..
Нажмите, чтобы раскрыть...

лажа у тебя с восприятием
в матче играл 64-ядерный (с минутой на ход) а на Личессе?

—- добавлено: 6 дек 2017 —-

Scaramuccia пишет: ↑

Скучные компьютерные шахматы
Нажмите, чтобы раскрыть...

счёт нескучный

Scaramuccia · 6 дек 2017

Комсюк пишет: ↑

Scaramuccia пишет: ↑

Скучные компьютерные шахматы
Нажмите, чтобы раскрыть...

счёт нескучный
Нажмите, чтобы раскрыть...

САРКАЗМ надо теперь большими буквами писать? Вон в лондоне супер-элита вроде бы не сыграла ни одной хотя бы приблизительно близкой по интересу партии.

Michael-13 · 6 дек 2017

Жесть, будущее здесь. Даже не верится
Впрочем, даже частные любительские нейронные сети вроде Giraffe играли на уровне международного мастера:https://geektimes.ru/post/262612/

Комсюк · 6 дек 2017

36-ой ход Стока очень сомнителен
Нет в статье про контемпт?

sovaz1997 · 6 дек 2017

Комсюк, ход нормальный. Нет, здесь, очевидно, AlphaZero переигрывает, но все это происходит на другой архитектуре процессора и на другом алгоритме, что не реализуемо на x86 на данный момент. Не совсем честное сравнение, получается. Но думаю, этот проект еще будет долго развиваться и вполне может изменить шахматные движки в ближайшем будущем.
Код:
info depth 38 seldepth 68 multipv 1 score cp 83 nodes 403692131 nps 9375107 hashfull 874 tbhits 0 time 43060 pv c2c1 d7d8 h6e3 g8h8 e3a3 f7f8 a3f8 h8f8 c1g1 b7c8 g1g6 c8d7 g6g7 d7e8 d2e3 f8h8 f6f7 e8f7 g7f7 h8h4 f7b7 h4h3 e3f4 h3h4 f4g5 h4d4 g5f6 d4a4 b7b6 a4b4 f6e6 d5d4 e6f6 d4d3 b6d6 d8c7 d6d3 b4f4 f6g5 f4b4 e5e6 b4b5 g5f6 b5b1 e6e7 b1f1 f6e6 f1e1 e6f7 a5a4 e7e8q e1e8 f7e8 c7c6 d3d4 c6b5 e8d7 a4a3

Котэ · 6 дек 2017

Предложение модераторам: может создать отдельную тему для обсуждения AlphaZero и перенести последние посты из этой темы в нее?

Комсюк · 6 дек 2017

sovaz1997 пишет: ↑

Комсюк, ход нормальный.
Нажмите, чтобы раскрыть...

тогда 30.Сg6 гениальный ход и у белых выиграно?

sovaz1997 · 6 дек 2017

Комсюк, и 30-й - тоже ход Stockfish-а. Но его делает AlphaZero:

Код:

info depth 40 seldepth 61 multipv 1 score cp 127 nodes 1512979939 nps 8762465 hashfull 945 tbhits 0 time 172666 pv d3g6 e7g5 g4g5 f7g6 f4f5 h8g8 g5h6 e8f7 f5f6 d7d8 e3d2 b7c8 c2c6 c8d7 c6b6 d8c7 b6d6 c7b8 d2c3 d7c8 c3b2 g6g5 h4g5 g8g6 h6h8 g6g8 h8h4 f7g6 d6c6 g6g5 h4g5 g8g5 b2c3 g5g2 c3d3 b8b7 d3e3 g2g3 e3f4 g3g8 c6a6 b7c7 a6d6 c8d7 f4e3 g8h8 d6a6 d7c8 a6d6 h8h1 e3f3

Crest · 7 дек 2017

По виду, это был чисто рекламный матч!
Против АльфаЗеро играл какой-то кастрат на слабом железе, которого назвали громким именем Стокфиш.
Выглядит как явная подстава.
Думаю, обычный Стокфиш на моём домашнем стационаре наберёт против этого нового распиаренного монстра намного больше очков, чем тот самый кастрат.

JackPuffon · 7 дек 2017

Crest пишет: ↑

По виду, это был чисто рекламный матч!
Против АльфаЗеро играл какой-то кастрат на слабом железе, которого назвали громким именем Стокфиш.
Выглядит как явная подстава.
Думаю, обычный Стокфиш на моём домашнем стационаре наберёт против этого нового распиаренного монстра намного больше очков, чем тот самый кастрат.
Нажмите, чтобы раскрыть...

Сергей Юрьевич, то что железо и формат встречи был не в пользу стока - это понятно, но, тем не менее, не кажется ли вам что сам факт того, что нейронные сети играют сильнее движков, не имея чисто шахматных алгоритмов, и еще способны к самообучению говорит о скорой революции и переоценке ценностей в компьюетрных шахматах и компьютерной подготовке гроссов?

Michael-13 · 7 дек 2017

Вот статья на английском про программу в вики.
https://en.wikipedia.org/wiki/AlphaGo_Zero
Т.е. "AlphaGo Zero" - это новая версия "AlphaGo" выученная для игры именно в го.
А собственно нужная нам "AlphaZero" - универсальная программа, не заточенная под конкретную игру (шахматы, го , сеги), а способная играть в в любую игру - го, шахматы и сеги. Т.е., видимо, при желании ее можно аналогично дольше (не 1 день, а месяц) учить каждой игре (шахматы) по очереди, что еще значительно ее усилит.
Впрочем, увидим, как она играет в другие игры - фишера, крезихаус (шведки, bughouse), шашки... и тогда посмотрим, настолько ли она универсальна и сильна, как нам хотелось бы
И конечно ждем как минимум еще 2 независимых групп исследователей вроде CCRL и TCEC, чтобы оценить ее в эло (пока что предполагается что играет на 100 пунктов сильнее, чем стокфиш), т.е. ожидается около 3525.

Комсюк · 7 дек 2017

Crest пишет: ↑

По виду, это был чисто рекламный матч!
Против АльфаЗеро играл какой-то кастрат на слабом железе, которого назвали громким именем Стокфиш.
Выглядит как явная подстава.
Думаю, обычный Стокфиш на моём домашнем стационаре наберёт против этого нового распиаренного монстра намного больше очков, чем тот самый кастрат.
Нажмите, чтобы раскрыть...

ещё от гроссов

Демченко пишет:

10 приведенных партий от Альфа Зеро превосходны и впечатляют, конечно. Некоторые просто шедевральны. Тут просто весь спектр идей, от медленного позиционного удушения, до неистовой атаки. Но... ряд решений Стокфиша вызывают большие вопросы. Что это за жертва коня за е5 за 2 пешки в Берлине? Почему он с таким упорством играл плохой вариант новоиндийской? И вообще, Стокфиш ли это был? Посмотреть партии с движком мне сейчас затруднительно - сижу в аэропорту, да и ближайшее время будет не до этого.
Но вот что я хотел бы пока что сказать. Я, по правде говоря, в целом не слишком большой поклонник глобализации и к огромным корпорациям, вроде Гугла, есть определенное интуитивное недоверие. Всегда есть подозрение, не вешают ли они, грубо говоря, лапшу на уши доверчивым юзерам.
Применительно к матчу Стокфиш-Альфа Зеро - мне кажется, что вопрос нахождения слабых мест у Стокфиша - дело времени, хороших компьютерных мощностей и грамотного профессионала. В принципе, хорошие переписочники и занимаются тем, что, в сущности, обыгрывают движок. Можно наиграть со временем хоть 10000 партий, (профессионал+движок на суперкомпьютере против Стокфиша) и какие-то из них окажутся выигранными, и притом в весьма эффектном стиле. Добавляем к результату боевые ничьи, выкладываем все это в интернет - и проект Альфа Зеро готов!
Это - один из возможных вариантов. Конечно, не исключена и возможность того, что дело обстоит куда печальнее и тайна шахмат действительно будет вскорости решена. Мы и представления можем ведь не иметь, какие технологии есть в распоряжении у транснациональных корпораций. И когда каждый получит на свой ПК программу Альфа Зеро, мы как бы заглянем в дуло нацеленного на нас ружья.
Фактически это может означать конец шахмат как игры. Мне, как профессионалу, конечно, это грустно сознавать, но зато будет стимул заняться чем-то более общественно полезным. Осуществлю, может, свою давнюю мечту - и стану выращивать картошку и разводить пчел навыки логического мышления и в этих делах пригодятся. Так что - авось, не пропадем с Божьей помощью!
А пока подождем новостей от гугловского Deux ex machina.
Нажмите, чтобы раскрыть...

—- добавлено: 7 дек 2017 —-

а вот Спай про своего инсайдера молчит

Crest · 7 дек 2017

JackPuffon пишет: ↑

Сергей Юрьевич, то что железо и формат встречи был не в пользу стока - это понятно, но...
Нажмите, чтобы раскрыть...

Простите, но я не понимаю этого "но".
Устроили избиения младенца, лишённого ресурсов - и радуются!
При неравенстве железа даже слабые шахматные программы могут обыграть заметно более сильные. И что же из этого следует?
Да ничего. Просто для корректного сравнения "мозгов" нужны мало-мальски равные условия.

JackPuffon пишет: ↑

... но, тем не менее, не кажется ли вам что сам факт того, что нейронные сети играют сильнее движков, не имея чисто шахматных алгоритмов, и еще способны к самообучению говорит о скорой революции и переоценке ценностей в компьюетрных шахматах и компьютерной подготовке гроссов?
Нажмите, чтобы раскрыть...

Да, нейронные сети - это сила. Да, сопоставления N сыгранных партий заметно сильнее, чем попытка сыграть одну-единственную.
Но это вполне понятная разница между кардинально разными возможностями.
Не сюрприз.

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

grizly Учаcтник

Комсюк народный модератор

grizly Учаcтник

Комсюк народный модератор

grizly Учаcтник

Комсюк народный модератор

nn Старожил

Комсюк народный модератор

nn Старожил

4547 Учаcтник

Комсюк народный модератор

nn Старожил

Комсюк народный модератор

4547 Учаcтник

Комсюк народный модератор

Rom Старожил

nn Старожил

Комсюк народный модератор

nn Старожил

Комсюк народный модератор

4547 Учаcтник

Scaramuccia Старожил

Комсюк народный модератор

Scaramuccia Старожил

Michael-13 Господин

Комсюк народный модератор

sovaz1997 Учаcтник

Котэ Восьмикратный чемпион подъезда

Комсюк народный модератор

sovaz1997 Учаcтник

Crest Админ, МГ

JackPuffon Новичок

Michael-13 Господин

Комсюк народный модератор

Crest Админ, МГ

Поделиться этой страницей