AlphaZero. Нейронная сеть играет в шахматы

Комсюк · 11 Dec 2017

Undying said: ↑

о есть Стокфиш начинает что-то подозревать на глубине порядка 50 полуходов. Ему не то, что взгляда на эту позицию недостаточно, а надо на 25(!) ходов вперед посчитать, чтобы качественно правильную оценку дать.
Click to expand...

он фигуру отдал за 2 пешки в начале партии... и будет играть любую позу, пока не станет -10
Ему пофиг на правильные оценки

Undying said: ↑

Какие вам еще нужны доказательства, что Стокфиш хреново понимает такого типа позиции?
Click to expand...

мне надо 7 выигранных Вяленым партий в Паульсене

—- добавлено: 11 Dec 2017 —-

sovaz1997 said: ↑

35-й ход:
Click to expand...

эту позу я смотрел, там Кс4

—- добавлено: 11 Dec 2017, опубликовано: 11 Dec 2017 —-

Пока на данный момент известно:
1. играл Стокфиш 8
2. проиграл менее 100 Эло
3. фора в книгу подарила Альфе 160 Эло

Итого:
в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ

Опровергайте!

hornet · 11 Dec 2017

Предлагаю усиления игры в партии (указанные на скрине):

Мобуту · 11 Dec 2017

sovaz1997 said: ↑
35-й ход: Rc1, до этого выдавал ход, сделанный в партии. Здесь просто позиция и так проиграна для SF.
Code:
info depth 52 seldepth 71 multipv 1 score cp -130 nodes 20666850394 nps 8286319 hashfull 999 tbhits 0 time 2494093 pv g1c1 c5c4 e5c4 f8c5 c2c3 c5f2 c1b1 a7a2 c4b2 f2e3 b3b4 e3d2 b2d1 h3f1 b1b2 a2b2 d1b2 d2c3 h1g1 f1h3 b2c4 c3d4 g1h1 h3f1 c4d6 g8f8 e4e5 f1h3 d6b5 d4b6 d3d4 h3f1 b5d6 b6d4 h2h4 d4c3 b4b5 c3d4 h1h2 d4c5 d6e4 c5b6 g3g4 f1b5 e4d6 b5e2 h2g3 b6a5 h4h5 a5e1 g3h3 e2d3 d6f5 f8f7 h3g2 d3e4 g2h3 e1b4 h3h4 e4c2 f5d4 c2d1 d4f5 b4d2 h4g3 d2e1 g3h3 d1e2 f5d6 f7f8
47-й ход - этот ход делал AZ.
Все чисто здесь.
Click to expand...
Я про другое. В этих позициях Стокфиш даже на небольшой глубине ставит разумные оценки. То есть нет той картинки, которую про него пытаются намалевать: мол, Стокфиш не понимает невыгод позиции ферзя на h8 или что фигура может быть сильнее четырёх пешек. Причина проигрыша не в этом.

Vladruss · 11 Dec 2017

Комсюк said: ↑

Пока на данный момент известно:
1. играл Стокфиш 8
2. проиграл менее 100 Эло
3. фора в книгу подарила Альфе 160 Эло

Итого:
в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ

Опровергайте!
Click to expand...

Круто! Стокфиш, оказывается, сильнее АльфыЗеры играет.

Комсюк · 11 Dec 2017

Vladruss, арифметика не врёт
А то тут все рассуждают про нейросети с умным видом, а суть в другом
Альфа ПОКА слабее

sovaz1997 · 11 Dec 2017

Комсюк, а у вас какая глубина была? У меня он тоже Kc4 долго показывал. Но там и так, и так проиграно было.

vsvor · 11 Dec 2017

sovaz1997 said: ↑

внедрение нейросетей в оценочную функцию будет актуально тогда, когда процессоры будут быстро с ними работать.
Click to expand...

Еще раз: графические процессоры _уже_ неплохо работают с нейросетями. Лучший массовый графический чип в несколько раз слабее тензорного, но это потому, что графика затачивается под 32-битовые числа, а чипы для машинного обучения - под 16 бит, и потому, что конвееры GPU устроены намного сложнее. Адаптированный вариант AZ вряд ли сможет играть в такую же силу на машине с 1080 Ti (хотя кто знает), но и 64 ядер на массовых компьютерах пока еще нет. А вот через пару поколений графических чипов, весьма вероятно, жить станет проще.

Vladruss · 11 Dec 2017

Комсюк said: ↑

Vladruss, арифметика не врёт
А то тут все рассуждают про нейросети с умным видом, а суть в другом
Альфа ПОКА слабее
Click to expand...

Теоретически. А фактически мы наблюдаем уверенную игру Зерушки.
Анекдот напомнить про теоретическую вероятность и фактическую реальность?

sovaz1997 · 11 Dec 2017

vsvor said: ↑

sovaz1997 said: ↑

внедрение нейросетей в оценочную функцию будет актуально тогда, когда процессоры будут быстро с ними работать.
Click to expand...

Еще раз: графические процессоры _уже_ неплохо работают с нейросетями. Лучший массовый графический чип в несколько раз слабее тензорного, но это потому, что графика затачивается под 32-битовые числа, а чипы для машинного обучения - под 16 бит, и потому, что конвееры GPU устроены намного сложнее. Адаптированный вариант AZ вряд ли сможет играть в такую же силу на машине с 1080 Ti (хотя кто знает), но и 64 ядер на массовых компьютерах пока еще нет. А вот через пару поколений графических чипов, весьма вероятно, жить станет проще.
Click to expand...

если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF. Да и не у каждого сейчас есть мощная видеокарта. Но то, что нейросети для шахматных движков будут актуальны - это точно. Также, возможно, нейросети помогут просчитать 8-фигурные базы, используя хитрое сжатие похожих позиций. Я, конечно, не уверен здесь.

Комсюк · 11 Dec 2017

sovaz1997 said: ↑

Комсюк, а у вас какая глубина была?
Click to expand...

42 вроде, у тебя комп мощней, тебе не надо полчаса держать

—- добавлено: 11 Dec 2017 —-

Vladruss said: ↑

А фактически мы наблюдаем уверенную игру Зерушки.
Click to expand...

я бы тебя послал подальше, но ты давний приятель...
Пойди ближе, к "лунатикам" - отведи душу

sovaz1997 · 11 Dec 2017

Комсюк, у меня ещё компиляция собственная. Обычный SF медленнее работает. Хеш 4 Гб поставил. Но если бы я ещё оставил его думать, он бы мог опять к Kc4 вернуться. Так что разменивание фигуры на 2 пешки было плохим решением.

Vladruss · 11 Dec 2017

Комсюк said: ↑

я бы тебя послал подальше, но ты давний приятель...
Click to expand...

"Боксера каждый обидеть может. Но не каждый успеет извиниться" © Костя Дзю.

Комсюк · 11 Dec 2017

sovaz1997, неправильно
Ставь Стокфиш 8 официальный!

Мы же не улучшаем его игру в матче, а проверяем, его ли ходы
Хотя для меня очевидно, что его
Какой смысл палиться Гуглу, выставляя ослабленную версию, если куча народу будет проверять партии?

Jadn · 11 Dec 2017

Комсюк said: ↑

3. фора в книгу подарила Альфе 160 Эло
Итого:
в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ
Опровергайте!
Click to expand...

Нельзя бездумно переносить преимущество от книги при игре против своих копий на игры против других программ (особенно сильно отличающихся). Так же как и лишнее ядро, книга особенно полезна в первом случае.
Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы). Но вот на сколько - неизвестно. Многое бы прояснили не выложенные партии. Если там, например, из оставшихся 18 побед 15 во французкой с небольшими вариациями, это один разговор, если все партии разные - другой.

Комсюк · 11 Dec 2017

Vladruss said: ↑

"Боксера каждый обидеть может. Но не каждый успеет извиниться" © Костя Дзю.
Click to expand...

а ты трубой этого Костю из-за угла... и фактически ты выиграл
А пока он будет лежать в коме, ты ему анек расскажи

Vladruss said: ↑

Анекдот напомнить про теоретическую вероятность и фактическую реальность?
Click to expand...

crem · 11 Dec 2017

Кстати, вот твит Демиса Хассабиса о том, что скоро опубликуют более подробную статью, после рецензирования:
https://twitter.com/demishassabis/status/939260541591347200

Комсюк · 11 Dec 2017

Jadn said: ↑

Нельзя бездумно переносить преимущество от книги при игре против своих копий на игры против других программ (особенно сильно отличающихся). Так же как и лишнее ядро, книга особенно полезна в первом случае.
Click to expand...

я это знаю..
Это был гротеск
Предложите умный перенос

—- добавлено: 11 Dec 2017 —-

Jadn said: ↑

Многое бы прояснили не выложенные партии. Если там, например, из оставшихся 18 побед 15 во французкой с небольшими вариациями, это один разговор, если все партии разные - другой.
Click to expand...

Если не во французской, то в этом же варианте новоиндийки, в этом уверен на 99%
Рандомность у Стока есть, но она проявится уже тогда, когда поза "готова" и игра идёт на два результата

—- добавлено: 11 Dec 2017 —-

Там много партий-близнецов, поэтому легко объяснить, что выложили только 10

sovaz1997 · 11 Dec 2017

Комсюк said: ↑

sovaz1997, неправильно
Ставь Стокфиш 8 официальный!

Мы же не улучшаем его игру в матче, а проверяем, его ли ходы
Хотя для меня очевидно, что его
Какой смысл палиться Гуглу, выставляя ослабленную версию, если куча народу будет проверять партии?
Click to expand...

Все совпадает. Если несовпадает, я проверяю 8-й версией .

vsvor · 11 Dec 2017

sovaz1997 said: ↑

если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF.
Click to expand...

Не факт. До сих пор классическим движкам уделялось на порядки больше внимания. Как оно будет, когда фокус сместится на нейросети, и когда их заоптимизируют - кто его знает. Так было с го: против Седоля играли на 64 TPU, но новая версия победила всухую предыдущую, обходясь 4 TPU.

Конечно, проблема еще в том, что _для игры_ может быть достаточно видеокарты, но для обучения потребуется как минимум программа распределенных вычислений.

Jadn said: ↑

Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы).
Click to expand...

Есть другая причина. Возможно, создателям хотелось посмотреть на шахматы без какого-либо предварительного знания о дебютах с обеих сторон и проверить, не появится ли что-нибудь вовсе неизвестное. Типа выгодной вариации в дебюте Гроба. И нет бы найти вариант новоиндийской до того, как он стал модным - теперь многие не верят, что это не было подстроено.

sovaz1997 · 11 Dec 2017

Но ход Rf8 был слабый (там, где ферзь загнан в угол). Думаю, это все коллизии хеша.

—- добавлено: 11 Dec 2017 —-

vsvor said: ↑

sovaz1997 said: ↑

если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF.
Click to expand...

Не факт. До сих пор классическим движкам уделялось на порядки больше внимания. Как оно будет, когда фокус сместится на нейросети, и когда их заоптимизируют - кто его знает.

Конечно, проблема еще в том, что _для игры_ может быть достаточно видеокарты, но для обучения потребуется как минимум программа распределенных вычислений.

Jadn said: ↑

Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы).
Click to expand...

Есть другая причина. Возможно, создателям хотелось посмотреть на шахматы без какого-либо предварительного знания о дебютах с обеих сторон и проверить, не появится ли что-нибудь вовсе неизвестное. Типа выгодной вариации в дебюте Гроба. И нет бы найти вариант новоиндийской до того, как он стал модным - теперь многие не верят, что это не было подстроено.
Click to expand...

Уже в SF пытаются это внедрять. Думаю, нас ждут изменения в движках. Надеюсь, что в следующем TCEC будет хоть какой-то движок на основе нейросети. Пусть он будет и не самым сильным, не важно.

Neo94 · 11 Dec 2017

Undying said: ↑

То есть Стокфиш начинает что-то подозревать на глубине порядка 50 полуходов. Ему не то, что взгляда на эту позицию недостаточно, а надо на 25(!) ходов вперед посчитать, чтобы качественно правильную оценку дать. Какие вам еще нужны доказательства, что Стокфиш хреново понимает такого типа позиции?
Click to expand...

Для такого и дают адекватный контроль времени - ну там час на партию, хотя бы.
А не минута на ход...

Комсюк · 11 Dec 2017

sovaz1997 said: ↑

Но ход Rf7 был слабый (там, где ферзь загнан в угол)
Click to expand...

Rf8

Jadn · 11 Dec 2017

Комсюк said: ↑

я это знаю..
Это был гротеск
Предложите умный перенос
Click to expand...

Это только тесты могут показать.
В общем, это не имеет большого значения. Альфа-бета нормально не масштабируется на много потоков. Нейросети - масштабируются очень хорошо. А учитывая, что гигагерцы в ближайшее время расти не будут (в отличие от количества ядер), ясно, какое направление перспективней, и Гугл показал, что успех возможен. Значит через месяц или через год появится версия для обычных видеокарт, которые в магазине можно купить. Может от Гугл, может от кого-нибудь другого.

FIBM · 11 Dec 2017

tiger said: ↑

Статья на arxiv совершенно не соответсвует никаким даже самым низким научным стандартам. Единственное объяснение, что большие компании пытаются сидеть на двух стульях: скрывать детали от конкурентов, и делать вид, что все это серьезная наука. В этом смысле, например, финансовый сектор честнее, хотя бы не публикуют пародии на научные статьи.
Click to expand...

Вы работаете в науке, или так лишь бы с апломбом что-нибудь написать? Эта работа слишком серьезная, чтобы ее публиковать в левом журнале, а в "приличном журнале" должна пройти рецензии специалистов. Так что проблем нет.

—- добавлено: 11 Dec 2017 —-

tiger said: ↑

Challenger Spy said: ↑

Много содержательного от программиста SuperZerror (из обсуждения на канале):
SuperZerror
.... Мой опыт построения таких алгоритмов говорит о том, что сложнее всего сделать сильную программу играя самим с собой. Ты неизбежно попадаешь на локальные минимумы, из которых почти невозможно вытащить самообучалку.
Click to expand...

Все-таки вероятность локального минимума у функции большого числа переменных близка к нулю. Проблема не минимумах, а в том что почти гарантировано попадание на локально почти плоскую часть. Алгоритмы поиска минимума часто не могут уйти вниз с плоских частей, хотя статистически (с очень большой вероятностью) это можно сделать по нескольким направлениям.
Click to expand...

Понял, вы вообще в этом ничего НЕ понимаете.

N1mTzo · 11 Dec 2017

Undying said: ↑

Если бы Альфа Зеро был просто переборным движком, то со своими перебираемыми 80 тысячами позиций в секунду, не имел бы никаких шансов против Стокфиша с его 70 миллионами позиций в секунду.
Click to expand...

Не стал бы в лоб сравнивать перебор разных движков (если A0 можно к ним отнести), использующих разные алгоритмы. Тем более после той истории с Райлихом и его Рыбкой, которая считала одно кол-во позиций, а выводила на экран совсем другое. Да и смысл этих цифр какой? Важна ИМХО эффективность, масштабируемость и , самое главное, сила игры в шахматы У Вяленого большАя часть этих пресловутых "килоноденсов"- это по сути мусор из-за особенностей алгоритма при распараллеливании потоков. А у А0 что "под капотом" мало кто знает, реально не хватает человека, который бы "разложил" по полочкам особенности архитектуры А0 (и всего остального) для простого смертного.

sovaz1997 said: ↑

Надеюсь, что в следующем TCEC будет хоть какой-то движок на основе нейросети. Пусть он будет и не самым сильным, не важно.
Click to expand...

Для этого придется как минимум переписывать регламент (по сути создать новый), т.к. там все правила под обычное железо заточены.

Baron · 11 Dec 2017

Baron, полчаса даётся чтобы компенсировать разницу между моим компом и тем, на котором играл Сток...
Click to expand...

...И он таки проиграл, даже на "том" компе. Стокфишу однозначно надо дать фору по времени, ибо нейросеть за 1 минуту находит исключительно глубокие идеи, недоступные для терминатора Т-100.

в этот раз Сток давал фору отсутствием книги
Click to expand...

Самое забавное, что если поменять соперников местами после дебюта, то Альфазеро, скорее всего, все равно будет уделывать Стокфиша. Грубая аналогия - мастер черными в латышском гамбите обыграет кандидата в мастера. И кстати это идея заставить Альфу играть плохие варианты в дебюте. Посмотрел бы как нового бога опускают на землю обычные железяки. А с лишним конем даже я обыграл бы боженьку (правда не уверен, но с лишним ферзем - это точно).

N1mTzo · 11 Dec 2017

crem said: ↑

Кстати, вот твит Демиса Хассабиса о том, что скоро опубликуют более подробную статью, после рецензирования:
https://twitter.com/demishassabis/status/939260541591347200
Click to expand...

Полистал твиттер Демиса и убедился, что даже победа над Седолем в го такого резонанса (при всем пиаре того матча) не вызвала ( такого количества ретвитов и комментариев) из-за, казалось бы, одной статьи на arxiv.org с десятком шахматных партий.

vsvor · 11 Dec 2017

Baron said: ↑

кстати это идея заставить Альфу играть плохие варианты в дебюте
Click to expand...

Не обязательно плохие. Белыми у SF был приличный счет в сицилианке.

FIBM · 11 Dec 2017

Мобуту said: ↑

Undying said: ↑

И что принципиально изменилось в оценке позиции? По-прежнему в основе лежит простой подсчет материала. Чуть-чуть учитывается пространство, активность фигур, безопасность короля. Учитывать это лучше не получается в силу врожденной примитивности алгоритмического подхода. Более тонкие вещи, вроде плохих фигур и игры по полям, вообще учитывать не получается. А у Альфа Зеро получается. Что наглядно продемонстрировано в выложенных партиях.
Click to expand...

Не вижу, чтобы было так уж продемонстрировано непонимание Стокфиша. Если смотреть на его оценки, то он довольно трезво оценивает происходящее. Нет такого, чтобы он ставил -2 там, где должно быть +2. Проиграл по другой причине. Обычно возникали острые позиции с нарушенным соотношением сил сказалось колоссальное превосходство противника в счётных способностях, в железе. А избежать этих позиций он не мог, так как был лишён вариативности игры, которую ему могла бы дать дебютная книжка, возможность самому определять время на раздумье.
Click to expand...

А зачем нам "оценки железяки"? Мы что сами не видим, что стокфиш проигрывал всегда по одной и той же схеме: не развитость фигур . Если не знать, что играет машина, то любой тренер бы сказал: "Мальчик, фигуры нужно развивать!".

Комсюк · 11 Dec 2017

Baron said: ↑

И кстати это идея заставить Альфу играть плохие варианты в дебюте. Посмотрел бы как нового бога опускают на землю обычные железяки.
Click to expand...

Есть 7 (семь!) проигранных вашим богом партий в одном варианте сицилианки
Но мы их не увидим

sovaz1997 · 11 Dec 2017

Интересно, почему Alpha Zero вообще проигрывал с таким уровнем позиционной игры. Возможно, где-то в тактике проссчитывался? Жалко, не дали нам эти партии.

Комсюк · 11 Dec 2017

vsvor said: ↑

Белыми у SF был приличный счет даже после одного ходя c4.
Click to expand...

Вы неправильно трактуете таблицу... там победа Альфы 8-2
А вот в Паульсене 7-3 в пользу Стока

vsvor · 11 Dec 2017

Комсюк said: ↑

Вы неправильно трактуете таблицу... там победа Альфы 8-2
Click to expand...

Да, я уже вспомнил.

sovaz1997 said: ↑

Интересно, почему Alpha Zero вообще проигрывал с таким уровнем позиционной игры.
Click to expand...

Ну, если посмотреть в статье, при обучении сицилианки было немного. Возможно, не хватало понимания дебюта, даже против SF без книги.

Mellio · 11 Dec 2017

Хотелось бы напомнить уважаемой аудитории, которая тут до хрипоты спорит как дебютная книга даёт +9000 ELO стокфишу, что в препринте приведена статистика по 10 самым популярным человеческим дебютам и в каждом из них A0 сыграла по 100 партий с вяленным (50 белыми и черными, то есть всего 1100 партий включая 100 партий матча со свободным дебютом). И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения. Более интересно, что эти 10 дебютов составляли не более 30 % партий в конце самообучения, то есть еще 70 % игр тренировалось что-то другое.

И ELO рейтинг в шахматах "сжимается" при высоком уровне игры, так как ничейные тенденции все сильнее проявляются (это кстати в препринте отмечено). Такого например нет в Го, так как там нет ничьих в принципе.

Комсюк · 11 Dec 2017

Mellio said: ↑

И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения.
Click to expand...

а Стокфиш не играл вообще
-4 Альфы чёрными это просто уничтожение, да

—- добавлено: 11 Dec 2017 —-

ладно, пустое это... я ушёл

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

Комсюк народный модератор

hornet Учаcтник

Мобуту спаситель нации

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

sovaz1997 Учаcтник

vsvor Новичок

Vladruss НедоКМС, победитель второразрядников.

sovaz1997 Учаcтник

Комсюк народный модератор

sovaz1997 Учаcтник

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

Jadn Заслуженный

Комсюк народный модератор

crem Учаcтник

Комсюк народный модератор

sovaz1997 Учаcтник

vsvor Новичок

sovaz1997 Учаcтник

Neo94 Учаcтник

Комсюк народный модератор

Jadn Заслуженный

FIBM Учаcтник

N1mTzo Учаcтник

Baron Учаcтник

N1mTzo Учаcтник

vsvor Новичок

FIBM Учаcтник

Комсюк народный модератор

sovaz1997 Учаcтник

Комсюк народный модератор

vsvor Новичок

Mellio Новичок

Комсюк народный модератор

Share This Page