AlphaZero. Нейронная сеть играет в шахматы

Комсюк · 11 дек 2017

Undying пишет: ↑

о есть Стокфиш начинает что-то подозревать на глубине порядка 50 полуходов. Ему не то, что взгляда на эту позицию недостаточно, а надо на 25(!) ходов вперед посчитать, чтобы качественно правильную оценку дать.
Нажмите, чтобы раскрыть...

он фигуру отдал за 2 пешки в начале партии... и будет играть любую позу, пока не станет -10
Ему пофиг на правильные оценки

Undying пишет: ↑

Какие вам еще нужны доказательства, что Стокфиш хреново понимает такого типа позиции?
Нажмите, чтобы раскрыть...

мне надо 7 выигранных Вяленым партий в Паульсене

—- добавлено: 11 дек 2017 —-

sovaz1997 пишет: ↑

35-й ход:
Нажмите, чтобы раскрыть...

эту позу я смотрел, там Кс4

—- добавлено: 11 дек 2017, опубликовано: 11 дек 2017 —-

Пока на данный момент известно:
1. играл Стокфиш 8
2. проиграл менее 100 Эло
3. фора в книгу подарила Альфе 160 Эло

Итого:
в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ

Опровергайте!

hornet · 11 дек 2017

Предлагаю усиления игры в партии (указанные на скрине):

Мобуту · 11 дек 2017

sovaz1997 пишет: ↑
35-й ход: Rc1, до этого выдавал ход, сделанный в партии. Здесь просто позиция и так проиграна для SF.
Код:
info depth 52 seldepth 71 multipv 1 score cp -130 nodes 20666850394 nps 8286319 hashfull 999 tbhits 0 time 2494093 pv g1c1 c5c4 e5c4 f8c5 c2c3 c5f2 c1b1 a7a2 c4b2 f2e3 b3b4 e3d2 b2d1 h3f1 b1b2 a2b2 d1b2 d2c3 h1g1 f1h3 b2c4 c3d4 g1h1 h3f1 c4d6 g8f8 e4e5 f1h3 d6b5 d4b6 d3d4 h3f1 b5d6 b6d4 h2h4 d4c3 b4b5 c3d4 h1h2 d4c5 d6e4 c5b6 g3g4 f1b5 e4d6 b5e2 h2g3 b6a5 h4h5 a5e1 g3h3 e2d3 d6f5 f8f7 h3g2 d3e4 g2h3 e1b4 h3h4 e4c2 f5d4 c2d1 d4f5 b4d2 h4g3 d2e1 g3h3 d1e2 f5d6 f7f8
47-й ход - этот ход делал AZ.
Все чисто здесь.
Нажмите, чтобы раскрыть...
Я про другое. В этих позициях Стокфиш даже на небольшой глубине ставит разумные оценки. То есть нет той картинки, которую про него пытаются намалевать: мол, Стокфиш не понимает невыгод позиции ферзя на h8 или что фигура может быть сильнее четырёх пешек. Причина проигрыша не в этом.

Vladruss · 11 дек 2017

Комсюк пишет: ↑

Пока на данный момент известно:
1. играл Стокфиш 8
2. проиграл менее 100 Эло
3. фора в книгу подарила Альфе 160 Эло

Итого:
в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ

Опровергайте!
Нажмите, чтобы раскрыть...

Круто! Стокфиш, оказывается, сильнее АльфыЗеры играет.

Комсюк · 11 дек 2017

Vladruss, арифметика не врёт
А то тут все рассуждают про нейросети с умным видом, а суть в другом
Альфа ПОКА слабее

sovaz1997 · 11 дек 2017

Комсюк, а у вас какая глубина была? У меня он тоже Kc4 долго показывал. Но там и так, и так проиграно было.

vsvor · 11 дек 2017

sovaz1997 пишет: ↑

внедрение нейросетей в оценочную функцию будет актуально тогда, когда процессоры будут быстро с ними работать.
Нажмите, чтобы раскрыть...

Еще раз: графические процессоры _уже_ неплохо работают с нейросетями. Лучший массовый графический чип в несколько раз слабее тензорного, но это потому, что графика затачивается под 32-битовые числа, а чипы для машинного обучения - под 16 бит, и потому, что конвееры GPU устроены намного сложнее. Адаптированный вариант AZ вряд ли сможет играть в такую же силу на машине с 1080 Ti (хотя кто знает), но и 64 ядер на массовых компьютерах пока еще нет. А вот через пару поколений графических чипов, весьма вероятно, жить станет проще.

Vladruss · 11 дек 2017

Комсюк пишет: ↑

Vladruss, арифметика не врёт
А то тут все рассуждают про нейросети с умным видом, а суть в другом
Альфа ПОКА слабее
Нажмите, чтобы раскрыть...

Теоретически. А фактически мы наблюдаем уверенную игру Зерушки.
Анекдот напомнить про теоретическую вероятность и фактическую реальность?

sovaz1997 · 11 дек 2017

vsvor пишет: ↑

sovaz1997 пишет: ↑

внедрение нейросетей в оценочную функцию будет актуально тогда, когда процессоры будут быстро с ними работать.
Нажмите, чтобы раскрыть...

Еще раз: графические процессоры _уже_ неплохо работают с нейросетями. Лучший массовый графический чип в несколько раз слабее тензорного, но это потому, что графика затачивается под 32-битовые числа, а чипы для машинного обучения - под 16 бит, и потому, что конвееры GPU устроены намного сложнее. Адаптированный вариант AZ вряд ли сможет играть в такую же силу на машине с 1080 Ti (хотя кто знает), но и 64 ядер на массовых компьютерах пока еще нет. А вот через пару поколений графических чипов, весьма вероятно, жить станет проще.
Нажмите, чтобы раскрыть...

если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF. Да и не у каждого сейчас есть мощная видеокарта. Но то, что нейросети для шахматных движков будут актуальны - это точно. Также, возможно, нейросети помогут просчитать 8-фигурные базы, используя хитрое сжатие похожих позиций. Я, конечно, не уверен здесь.

Комсюк · 11 дек 2017

sovaz1997 пишет: ↑

Комсюк, а у вас какая глубина была?
Нажмите, чтобы раскрыть...

42 вроде, у тебя комп мощней, тебе не надо полчаса держать

—- добавлено: 11 дек 2017 —-

Vladruss пишет: ↑

А фактически мы наблюдаем уверенную игру Зерушки.
Нажмите, чтобы раскрыть...

я бы тебя послал подальше, но ты давний приятель...
Пойди ближе, к "лунатикам" - отведи душу

sovaz1997 · 11 дек 2017

Комсюк, у меня ещё компиляция собственная. Обычный SF медленнее работает. Хеш 4 Гб поставил. Но если бы я ещё оставил его думать, он бы мог опять к Kc4 вернуться. Так что разменивание фигуры на 2 пешки было плохим решением.

Vladruss · 11 дек 2017

Комсюк пишет: ↑

я бы тебя послал подальше, но ты давний приятель...
Нажмите, чтобы раскрыть...

"Боксера каждый обидеть может. Но не каждый успеет извиниться" © Костя Дзю.

Комсюк · 11 дек 2017

sovaz1997, неправильно
Ставь Стокфиш 8 официальный!

Мы же не улучшаем его игру в матче, а проверяем, его ли ходы
Хотя для меня очевидно, что его
Какой смысл палиться Гуглу, выставляя ослабленную версию, если куча народу будет проверять партии?

Jadn · 11 дек 2017

Комсюк пишет: ↑

3. фора в книгу подарила Альфе 160 Эло
Итого:
в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ
Опровергайте!
Нажмите, чтобы раскрыть...

Нельзя бездумно переносить преимущество от книги при игре против своих копий на игры против других программ (особенно сильно отличающихся). Так же как и лишнее ядро, книга особенно полезна в первом случае.
Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы). Но вот на сколько - неизвестно. Многое бы прояснили не выложенные партии. Если там, например, из оставшихся 18 побед 15 во французкой с небольшими вариациями, это один разговор, если все партии разные - другой.

Комсюк · 11 дек 2017

Vladruss пишет: ↑

"Боксера каждый обидеть может. Но не каждый успеет извиниться" © Костя Дзю.
Нажмите, чтобы раскрыть...

а ты трубой этого Костю из-за угла... и фактически ты выиграл
А пока он будет лежать в коме, ты ему анек расскажи

Vladruss пишет: ↑

Анекдот напомнить про теоретическую вероятность и фактическую реальность?
Нажмите, чтобы раскрыть...

crem · 11 дек 2017

Кстати, вот твит Демиса Хассабиса о том, что скоро опубликуют более подробную статью, после рецензирования:
https://twitter.com/demishassabis/status/939260541591347200

Комсюк · 11 дек 2017

Jadn пишет: ↑

Нельзя бездумно переносить преимущество от книги при игре против своих копий на игры против других программ (особенно сильно отличающихся). Так же как и лишнее ядро, книга особенно полезна в первом случае.
Нажмите, чтобы раскрыть...

я это знаю..
Это был гротеск
Предложите умный перенос

—- добавлено: 11 дек 2017 —-

Jadn пишет: ↑

Многое бы прояснили не выложенные партии. Если там, например, из оставшихся 18 побед 15 во французкой с небольшими вариациями, это один разговор, если все партии разные - другой.
Нажмите, чтобы раскрыть...

Если не во французской, то в этом же варианте новоиндийки, в этом уверен на 99%
Рандомность у Стока есть, но она проявится уже тогда, когда поза "готова" и игра идёт на два результата

—- добавлено: 11 дек 2017 —-

Там много партий-близнецов, поэтому легко объяснить, что выложили только 10

sovaz1997 · 11 дек 2017

Комсюк пишет: ↑

sovaz1997, неправильно
Ставь Стокфиш 8 официальный!

Мы же не улучшаем его игру в матче, а проверяем, его ли ходы
Хотя для меня очевидно, что его
Какой смысл палиться Гуглу, выставляя ослабленную версию, если куча народу будет проверять партии?
Нажмите, чтобы раскрыть...

Все совпадает. Если несовпадает, я проверяю 8-й версией .

vsvor · 11 дек 2017

sovaz1997 пишет: ↑

если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF.
Нажмите, чтобы раскрыть...

Не факт. До сих пор классическим движкам уделялось на порядки больше внимания. Как оно будет, когда фокус сместится на нейросети, и когда их заоптимизируют - кто его знает. Так было с го: против Седоля играли на 64 TPU, но новая версия победила всухую предыдущую, обходясь 4 TPU.

Конечно, проблема еще в том, что _для игры_ может быть достаточно видеокарты, но для обучения потребуется как минимум программа распределенных вычислений.

Jadn пишет: ↑

Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы).
Нажмите, чтобы раскрыть...

Есть другая причина. Возможно, создателям хотелось посмотреть на шахматы без какого-либо предварительного знания о дебютах с обеих сторон и проверить, не появится ли что-нибудь вовсе неизвестное. Типа выгодной вариации в дебюте Гроба. И нет бы найти вариант новоиндийской до того, как он стал модным - теперь многие не верят, что это не было подстроено.

sovaz1997 · 11 дек 2017

Но ход Rf8 был слабый (там, где ферзь загнан в угол). Думаю, это все коллизии хеша.

—- добавлено: 11 дек 2017 —-

vsvor пишет: ↑

sovaz1997 пишет: ↑

если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF.
Нажмите, чтобы раскрыть...

Не факт. До сих пор классическим движкам уделялось на порядки больше внимания. Как оно будет, когда фокус сместится на нейросети, и когда их заоптимизируют - кто его знает.

Конечно, проблема еще в том, что _для игры_ может быть достаточно видеокарты, но для обучения потребуется как минимум программа распределенных вычислений.

Jadn пишет: ↑

Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы).
Нажмите, чтобы раскрыть...

Есть другая причина. Возможно, создателям хотелось посмотреть на шахматы без какого-либо предварительного знания о дебютах с обеих сторон и проверить, не появится ли что-нибудь вовсе неизвестное. Типа выгодной вариации в дебюте Гроба. И нет бы найти вариант новоиндийской до того, как он стал модным - теперь многие не верят, что это не было подстроено.
Нажмите, чтобы раскрыть...

Уже в SF пытаются это внедрять. Думаю, нас ждут изменения в движках. Надеюсь, что в следующем TCEC будет хоть какой-то движок на основе нейросети. Пусть он будет и не самым сильным, не важно.

Neo94 · 11 дек 2017

Undying пишет: ↑

То есть Стокфиш начинает что-то подозревать на глубине порядка 50 полуходов. Ему не то, что взгляда на эту позицию недостаточно, а надо на 25(!) ходов вперед посчитать, чтобы качественно правильную оценку дать. Какие вам еще нужны доказательства, что Стокфиш хреново понимает такого типа позиции?
Нажмите, чтобы раскрыть...

Для такого и дают адекватный контроль времени - ну там час на партию, хотя бы.
А не минута на ход...

Комсюк · 11 дек 2017

sovaz1997 пишет: ↑

Но ход Rf7 был слабый (там, где ферзь загнан в угол)
Нажмите, чтобы раскрыть...

Rf8

Jadn · 11 дек 2017

Комсюк пишет: ↑

я это знаю..
Это был гротеск
Предложите умный перенос
Нажмите, чтобы раскрыть...

Это только тесты могут показать.
В общем, это не имеет большого значения. Альфа-бета нормально не масштабируется на много потоков. Нейросети - масштабируются очень хорошо. А учитывая, что гигагерцы в ближайшее время расти не будут (в отличие от количества ядер), ясно, какое направление перспективней, и Гугл показал, что успех возможен. Значит через месяц или через год появится версия для обычных видеокарт, которые в магазине можно купить. Может от Гугл, может от кого-нибудь другого.

FIBM · 11 дек 2017

tiger пишет: ↑

Статья на arxiv совершенно не соответсвует никаким даже самым низким научным стандартам. Единственное объяснение, что большие компании пытаются сидеть на двух стульях: скрывать детали от конкурентов, и делать вид, что все это серьезная наука. В этом смысле, например, финансовый сектор честнее, хотя бы не публикуют пародии на научные статьи.
Нажмите, чтобы раскрыть...

Вы работаете в науке, или так лишь бы с апломбом что-нибудь написать? Эта работа слишком серьезная, чтобы ее публиковать в левом журнале, а в "приличном журнале" должна пройти рецензии специалистов. Так что проблем нет.

—- добавлено: 11 дек 2017 —-

tiger пишет: ↑

Challenger Spy пишет: ↑

Много содержательного от программиста SuperZerror (из обсуждения на канале):
SuperZerror
.... Мой опыт построения таких алгоритмов говорит о том, что сложнее всего сделать сильную программу играя самим с собой. Ты неизбежно попадаешь на локальные минимумы, из которых почти невозможно вытащить самообучалку.
Нажмите, чтобы раскрыть...

Все-таки вероятность локального минимума у функции большого числа переменных близка к нулю. Проблема не минимумах, а в том что почти гарантировано попадание на локально почти плоскую часть. Алгоритмы поиска минимума часто не могут уйти вниз с плоских частей, хотя статистически (с очень большой вероятностью) это можно сделать по нескольким направлениям.
Нажмите, чтобы раскрыть...

Понял, вы вообще в этом ничего НЕ понимаете.

N1mTzo · 11 дек 2017

Undying пишет: ↑

Если бы Альфа Зеро был просто переборным движком, то со своими перебираемыми 80 тысячами позиций в секунду, не имел бы никаких шансов против Стокфиша с его 70 миллионами позиций в секунду.
Нажмите, чтобы раскрыть...

Не стал бы в лоб сравнивать перебор разных движков (если A0 можно к ним отнести), использующих разные алгоритмы. Тем более после той истории с Райлихом и его Рыбкой, которая считала одно кол-во позиций, а выводила на экран совсем другое. Да и смысл этих цифр какой? Важна ИМХО эффективность, масштабируемость и , самое главное, сила игры в шахматы У Вяленого большАя часть этих пресловутых "килоноденсов"- это по сути мусор из-за особенностей алгоритма при распараллеливании потоков. А у А0 что "под капотом" мало кто знает, реально не хватает человека, который бы "разложил" по полочкам особенности архитектуры А0 (и всего остального) для простого смертного.

sovaz1997 пишет: ↑

Надеюсь, что в следующем TCEC будет хоть какой-то движок на основе нейросети. Пусть он будет и не самым сильным, не важно.
Нажмите, чтобы раскрыть...

Для этого придется как минимум переписывать регламент (по сути создать новый), т.к. там все правила под обычное железо заточены.

Baron · 11 дек 2017

Baron, полчаса даётся чтобы компенсировать разницу между моим компом и тем, на котором играл Сток...
Нажмите, чтобы раскрыть...

...И он таки проиграл, даже на "том" компе. Стокфишу однозначно надо дать фору по времени, ибо нейросеть за 1 минуту находит исключительно глубокие идеи, недоступные для терминатора Т-100.

в этот раз Сток давал фору отсутствием книги
Нажмите, чтобы раскрыть...

Самое забавное, что если поменять соперников местами после дебюта, то Альфазеро, скорее всего, все равно будет уделывать Стокфиша. Грубая аналогия - мастер черными в латышском гамбите обыграет кандидата в мастера. И кстати это идея заставить Альфу играть плохие варианты в дебюте. Посмотрел бы как нового бога опускают на землю обычные железяки. А с лишним конем даже я обыграл бы боженьку (правда не уверен, но с лишним ферзем - это точно).

N1mTzo · 11 дек 2017

crem пишет: ↑

Кстати, вот твит Демиса Хассабиса о том, что скоро опубликуют более подробную статью, после рецензирования:
https://twitter.com/demishassabis/status/939260541591347200
Нажмите, чтобы раскрыть...

Полистал твиттер Демиса и убедился, что даже победа над Седолем в го такого резонанса (при всем пиаре того матча) не вызвала ( такого количества ретвитов и комментариев) из-за, казалось бы, одной статьи на arxiv.org с десятком шахматных партий.

vsvor · 11 дек 2017

Baron пишет: ↑

кстати это идея заставить Альфу играть плохие варианты в дебюте
Нажмите, чтобы раскрыть...

Не обязательно плохие. Белыми у SF был приличный счет в сицилианке.

FIBM · 11 дек 2017

Мобуту пишет: ↑

Undying пишет: ↑

И что принципиально изменилось в оценке позиции? По-прежнему в основе лежит простой подсчет материала. Чуть-чуть учитывается пространство, активность фигур, безопасность короля. Учитывать это лучше не получается в силу врожденной примитивности алгоритмического подхода. Более тонкие вещи, вроде плохих фигур и игры по полям, вообще учитывать не получается. А у Альфа Зеро получается. Что наглядно продемонстрировано в выложенных партиях.
Нажмите, чтобы раскрыть...

Не вижу, чтобы было так уж продемонстрировано непонимание Стокфиша. Если смотреть на его оценки, то он довольно трезво оценивает происходящее. Нет такого, чтобы он ставил -2 там, где должно быть +2. Проиграл по другой причине. Обычно возникали острые позиции с нарушенным соотношением сил сказалось колоссальное превосходство противника в счётных способностях, в железе. А избежать этих позиций он не мог, так как был лишён вариативности игры, которую ему могла бы дать дебютная книжка, возможность самому определять время на раздумье.
Нажмите, чтобы раскрыть...

А зачем нам "оценки железяки"? Мы что сами не видим, что стокфиш проигрывал всегда по одной и той же схеме: не развитость фигур . Если не знать, что играет машина, то любой тренер бы сказал: "Мальчик, фигуры нужно развивать!".

Комсюк · 11 дек 2017

Baron пишет: ↑

И кстати это идея заставить Альфу играть плохие варианты в дебюте. Посмотрел бы как нового бога опускают на землю обычные железяки.
Нажмите, чтобы раскрыть...

Есть 7 (семь!) проигранных вашим богом партий в одном варианте сицилианки
Но мы их не увидим

sovaz1997 · 11 дек 2017

Интересно, почему Alpha Zero вообще проигрывал с таким уровнем позиционной игры. Возможно, где-то в тактике проссчитывался? Жалко, не дали нам эти партии.

Комсюк · 11 дек 2017

vsvor пишет: ↑

Белыми у SF был приличный счет даже после одного ходя c4.
Нажмите, чтобы раскрыть...

Вы неправильно трактуете таблицу... там победа Альфы 8-2
А вот в Паульсене 7-3 в пользу Стока

vsvor · 11 дек 2017

Комсюк пишет: ↑

Вы неправильно трактуете таблицу... там победа Альфы 8-2
Нажмите, чтобы раскрыть...

Да, я уже вспомнил.

sovaz1997 пишет: ↑

Интересно, почему Alpha Zero вообще проигрывал с таким уровнем позиционной игры.
Нажмите, чтобы раскрыть...

Ну, если посмотреть в статье, при обучении сицилианки было немного. Возможно, не хватало понимания дебюта, даже против SF без книги.

Mellio · 11 дек 2017

Хотелось бы напомнить уважаемой аудитории, которая тут до хрипоты спорит как дебютная книга даёт +9000 ELO стокфишу, что в препринте приведена статистика по 10 самым популярным человеческим дебютам и в каждом из них A0 сыграла по 100 партий с вяленным (50 белыми и черными, то есть всего 1100 партий включая 100 партий матча со свободным дебютом). И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения. Более интересно, что эти 10 дебютов составляли не более 30 % партий в конце самообучения, то есть еще 70 % игр тренировалось что-то другое.

И ELO рейтинг в шахматах "сжимается" при высоком уровне игры, так как ничейные тенденции все сильнее проявляются (это кстати в препринте отмечено). Такого например нет в Го, так как там нет ничьих в принципе.

Комсюк · 11 дек 2017

Mellio пишет: ↑

И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения.
Нажмите, чтобы раскрыть...

а Стокфиш не играл вообще
-4 Альфы чёрными это просто уничтожение, да

—- добавлено: 11 дек 2017 —-

ладно, пустое это... я ушёл

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

Комсюк народный модератор

hornet Учаcтник

Мобуту спаситель нации

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

sovaz1997 Учаcтник

vsvor Новичок

Vladruss НедоКМС, победитель второразрядников.

sovaz1997 Учаcтник

Комсюк народный модератор

sovaz1997 Учаcтник

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

Jadn Заслуженный

Комсюк народный модератор

crem Учаcтник

Комсюк народный модератор

sovaz1997 Учаcтник

vsvor Новичок

sovaz1997 Учаcтник

Neo94 Учаcтник

Комсюк народный модератор

Jadn Заслуженный

FIBM Учаcтник

N1mTzo Учаcтник

Baron Учаcтник

N1mTzo Учаcтник

vsvor Новичок

FIBM Учаcтник

Комсюк народный модератор

sovaz1997 Учаcтник

Комсюк народный модератор

vsvor Новичок

Mellio Новичок

Комсюк народный модератор

Поделиться этой страницей