AlphaZero. Нейронная сеть играет в шахматы

sovaz1997 · 7 дек 2017

Jadn пишет: ↑

Комсюк пишет: ↑

Jadn пишет: ↑

Если тут такого не было, и играли всегда из начальной позиции
Нажмите, чтобы раскрыть...

так и было
Нажмите, чтобы раскрыть...

Ну, это ерунда. Веса в оценочной функции Стока не подогнаны специально под начальную позицию .Получилось, что над первым ходом Сток думал только 1 минуту, а Азер - минуту+все время предварительного обучения. Мягко говоря неравные условия. К тому же, наверное много похожих партий было.
Нажмите, чтобы раскрыть...

Обучение проводится только 1 раз, поэтому считайте, что это входит в процесс разработки (но на совершенно ином уровне).

crem · 7 дек 2017

Кроме общего зачёта они сыграли по 100 игр на различных популярных дебютах, и stockfish на этих дебютах действительно иногда выигрывал (сицилианку 7 раз белыми, например). Можно считать что это "как бы stockfish сыграл будь у него дебютная таблица", но на самом деле alphazero такие неудобные для себя дебюты просто не играет! (как видно из графика).

Также информация о том, что у stockfish дебютной книги не было — это только догадка Накамуры, а официального подтверждения этому нету, и на самом деле вполне себе дебютная книга и могла бы быть. Например, когда alphaGo выиграл у Ли Седола, народ тоже "подозревал" что запретили в го играть "ко" Седолу под подписку о неразглашении, а на самом деле всё было честно.

Jadn · 7 дек 2017

sovaz1997 пишет: ↑

Jadn пишет: ↑

Комсюк пишет: ↑

Jadn пишет: ↑

Если тут такого не было, и играли всегда из начальной позиции
Нажмите, чтобы раскрыть...

так и было
Нажмите, чтобы раскрыть...

Ну, это ерунда. Веса в оценочной функции Стока не подогнаны специально под начальную позицию .Получилось, что над первым ходом Сток думал только 1 минуту, а Азер - минуту+все время предварительного обучения. Мягко говоря неравные условия. К тому же, наверное много похожих партий было.
Нажмите, чтобы раскрыть...

Обучение проводится только 1 раз, поэтому считайте, что это входит в процесс разработки (но на совершенно ином уровне).
Нажмите, чтобы раскрыть...

И? Это гигабайты информации о начальной позиции, наработанные за много часов или дней. У движков они традиционно хранятся в дебютной книге. И у одного из соперников эту информацию просто отняли.
Как я говорил - корректное тестирование надо устраивать на наборе начальных позиций.

Комсюк · 7 дек 2017

Vladruss пишет: ↑

Комсюк пишет: ↑

Стокфиш не создан считать первые ходы, его и тестируют с набором позиций
Нажмите, чтобы раскрыть...

Это его личные проблемы. Пусть показывает свою истинную силу без костылей подслеповатой бабки-теории. Глядишь, теперь программисты Стокфиша начнут по-серьезке репу чесать, как силу игры Стокфиша увеличить.
Нажмите, чтобы раскрыть...

Сток должен выйти из дебюта (с книгой) и решить всё в миттельшпиле
Не удалось, подхватываются таблицы, и ничья в эндшпиле
Болеем за наших!

—- добавлено: 7 дек 2017 —-

crem пишет: ↑

stockfish на этих дебютах действительно иногда выигрывал (сицилианку 7 раз белыми, например)
Нажмите, чтобы раскрыть...

во-во

crem · 7 дек 2017

sovaz1997 пишет: ↑

Обучение проводится только 1 раз, поэтому считайте, что это входит в процесс разработки (но на совершенно ином уровне).
Нажмите, чтобы раскрыть...

Кстати при разработке stockfish тоже используются большие вычислительные мощности (чтобы проверить на тестовых играх с самим собой, действительно ли изменения усиливают движок). Вот тут любой желающий может подключиться и предоставить свой комп для таких тестов: http://tests.stockfishchess.org/tests

Так что нельзя говорить что у alphazero большие мощности, а у stockfish такого нет. На самом деле мощности сравнимы и в процессе разработки, и в процессе игры.

Camon14 · 7 дек 2017

Это все как с клонированием овечки Долли, уже 20 лет прошло , где атака клонов? Турбозеро млин. Человек не думает нейронами, он думает душой-волей. Дурят нашего брата этими нейронами. Чтоб нейроны обучались они должны быть отдельными личностями.

Комсюк · 7 дек 2017

crem пишет: ↑

Кроме общего зачёта они сыграли по 100 игр на различных популярных дебютах
Нажмите, чтобы раскрыть...

а тесты были до матча?
Тогда это ещё фора для самообучения Альфы

sovaz1997 · 7 дек 2017

Я просто хочу сказать одну мысль: чтобы сравнение было корректным, нужно одинаковое железо. Тогда мы можем сравнивать движки, т. к. условия одинаковые.

Но прорыв заключается в совершенно ином подходе к оценке позиции. Больше нет весов фигур, нет бонусов/штрафов. Есть просто система, в которой есть правила. И все. Даже если бы AlphaZero играла слабее, чем Stockfish, это бы не сильно преуменьшило достижение.

P. S. но я жду более качественного тестирования, большего количества партий для достоверности. Ведь человек+Stockfish против Stockfish тоже может показать красивые партии

Camon14 · 7 дек 2017

Хватит ли у ДупельЗеро памяти хранить все чему он научился? Он же после каждой партии должен кучу инфы сохранять.

Комсюк · 7 дек 2017

crem пишет: ↑

Можно считать что это "как бы stockfish сыграл будь у него дебютная таблица", но на самом деле alphazero такие неудобные для себя дебюты просто не играет!
Нажмите, чтобы раскрыть...

Сток тоже бы не играл неудобные дебюты, если бы на тесте у него была обучаемая книга (не таблица, по которой он всё время шпарит!), пусть и короткая

Vladruss · 7 дек 2017

Комсюк пишет: ↑

Сток должен выйти из дебюта (с книгой) и решить всё в миттельшпиле
Не удалось, подхватываются таблицы, и ничья в эндшпиле
Болеем за наших!
Нажмите, чтобы раскрыть...

Комс, это спортивный подход, а не научный. В данном случае был научный эксперимент.

crem · 7 дек 2017

Комсюк пишет: ↑

crem пишет: ↑

Кроме общего зачёта они сыграли по 100 игр на различных популярных дебютах
Нажмите, чтобы раскрыть...

а тесты были до матча?
Тогда это ещё фора для самообучения Альфы
Нажмите, чтобы раскрыть...

Перед матчем или после — разницы нет, фаза обучения (много игр с самим собой) и игры с противником — это разные фазы. После того, как фаза обучения закончена, модель фиксируется и больше не обновляется. На играх со стокфишем alphazero не учится, он играл первую и последнюю игру с абсолютно одинаковыми знаниями.
(кстати был вопрос такой от журналистов, когда alphaGo играл с Ли Седолом, и до этого с компьютерными программами, и разрабочики подтвердили что между играми модель не меняется, на играх не учится).

Поэтому и требование разрешить stockfish'у править свою дебютную таблицу между играми было бы нечестным, хотя и не помогло б стокфишу.

Ми-Ля-Зола · 7 дек 2017

Можно вопрос, ибо я не шахматный профессионал.
Вот смотрите:
https://lichess.org/zbCOTavB#56

Личессовский стокфиш в этой партии на 28-ом ходу (по идеи позиция должна стоять сразу по ссылке) пишет крепкий НОЛЬ. И если дать ему хоть в сто раз больше мощностей, то не удивлюсь, если он будет считать точно так же. Так вот вопрос: я смотрю на эту позицию своим убогим условным первым разрядом и мне кажется, что позиция черных на шахматном языке называется "ящик". И если показать ее шахматному профи, то он скажет так же, что да все, у черных плохо от слова "совсем": линии e и d намертво захвачены белыми, король черных разбит и гуляет по доске, конь и ладья на a8 и b8 - это венок (а не венец!). Я не прав? А вот если прав, то в этом то и есть разница между AZ и всеми предыдущими движками - она не пересчитала стокфиш, она его ОБЫГРАЛА.

Fruit · 7 дек 2017

Думаю, AlphaZero по силе слабее Стокфиша (хотя все сделано так, чтобы мы пришли к другому выводу), но играет круто и умно.
Странно, что Стокфиша не заставили думать 80тыс. позиций в секунду, чтобы счет в пользу AlphaZero был еще более впечатляющий -100 из 100.

crem · 7 дек 2017

Camon14 пишет: ↑

Хватит ли у ДупельЗеро памяти хранить все чему он научился? Он же после каждой партии должен кучу инфы сохранять.
Нажмите, чтобы раскрыть...

У нейросети размер модели фиксированный, он не растёт от каждой игры. Если этот фиксированный размер слишком маленький, нейросеть грубо говоря "выкидывает" наименее важную информацию чтобы освободить место для более важной. Но даже небольшой модели (1 мегабайт), наверняка достаточно для того чтоб распознавать все "шаблоны" которые знают профессиональные гроссмейстеры, а у alphazero скорее всего модель побольше.

Говоря кратко: такой проблемы, которую вы описали, нету, т.к. количество необходимой памяти с каждой игрой не растёт.

Комсюк · 7 дек 2017

Ми-Ля-Зола пишет: ↑

И если дать ему хоть в сто раз больше мощностей, то не удивлюсь, если он будет считать точно так же.
Нажмите, чтобы раскрыть...

не так

Vladruss · 7 дек 2017

Пока вы тут рассуждаете о проблемах харда, в США программисты уже пишут алгоритм компьютерной стратегии "Как захватить весь мир". После этого они заставят по этим вводным данным играть эту самую Зеру, она и подскажет им все верные решения. Так что, плакать нам скоро придется.

Camon14 · 7 дек 2017

Это лишь вершина айсберга, которую показали американцы, раз они Иерусалим признали столицей Израиля, значит чувствуют в себе силу мощную, что не боятся никого.

—- добавлено: 7 дек 2017, опубликовано: 7 дек 2017 —-

Не зря Бендер говорил " шахматы превратятся в прикладную науку и изобретет способ межгалактического общения" Видимо смысл шахмат это помощь в развитии ИИ.

Ми-Ля-Зола · 7 дек 2017

Vladruss, вряд ли, количество переменных и данных необходимых для ввода бесконечно как жизнь. Объясню проще: во второй мировой войне победил ДУХОВНЫЙ подвиг советского солдата. По всем "мощностям" мы стояли на тот же "ящик", но то, что советские солдаты совершили под Сталинградом никакими мощностями не учесть и не просчитать. Это не лирика уже даже в военной науке. Ресурс "духовная сила нации" давно используется во всех военных стратегиях. Был прекрасный доклад одного полковника "О начале третьей мировой войны и ее возможной периодизации", пока, к сожалению, не могу его найти, чтобы дать ссылку.

Vladruss · 7 дек 2017

Ми-Ля-Зола пишет: ↑

Vladruss, вряд ли, количество переменных и данных необходимых для ввода бесконечно как жизнь. Объясню проще: во второй мировой войне победил ДУХОВНЫЙ подвиг советского солдата. По всем "мощностям" мы стояли на тот же "ящик", но то, что советские солдаты совершили под Сталинградом никакими мощностями не учесть и не просчитать. Это не лирика уже даже в военной науке. Ресурс "духовная сила нации" давно используется во всех военных стратегиях.
Нажмите, чтобы раскрыть...

Ну, дык, и кто мешает ввести в игру эту новую константу "Духовная сила нации"?
Впрочем, зря я этот разговор затеял. Оффтоп это.

Комсюк · 7 дек 2017

Ми-Ля-Зола пишет: ↑

Можно вопрос, ибо я не шахматный профессионал.
Вот смотрите:
https://lichess.org/zbCOTavB#56
Нажмите, чтобы раскрыть...

а как выиграть после 30...Лh8?

—- добавлено: 7 дек 2017 —-

нашёл

Vladruss · 8 дек 2017

Ми-Ля-Зола пишет: ↑

разница между AZ и всеми предыдущими движками - она не пересчитала стокфиш, она его ОБЫГРАЛА.
Нажмите, чтобы раскрыть...

Характерно, что Альфазеро смело идет в дебюте на жертвы ради развития инициативы - и без всяких дебютных справочников. Вот мне партия понравилась: https://lichess.org/D8qrQ6vY#95

Гениальная игра!

sovaz1997 · 8 дек 2017

Vladruss, да, у A0 нет оценки материала, он оценивает позицию в общем (как человек, можно сказать). Но обобщение оценки позиции и счёт намного лучше, чем у человека, хотя насчёт оценки позиции я не уверен, возможно, у человека она ещё лучше, учитывая очень скудные счетные способности.

Gridnev · 8 дек 2017

Vladruss пишет: ↑

Вот мне партия понравилась
Нажмите, чтобы раскрыть...

Уже приводили кусочек этой игры, иллюстрирующий идею запирания ферзя в углу. Очень круто. Есть чему поучиться.

Ми-Ля-Зола · 8 дек 2017

Комсюк пишет: ↑

Ми-Ля-Зола пишет: ↑

И если дать ему хоть в сто раз больше мощностей, то не удивлюсь, если он будет считать точно так же.
Нажмите, чтобы раскрыть...

не так
Нажмите, чтобы раскрыть...

Ну, я вот загрузил позицию в chessbase, поставил на движок. Ну, понятно, мой кряхтит на убогой глубине, но он же с серверами соединяется и дает оценку тех, кто уже считал эту позицию. Stockfish 8 на глубине 48 дает твердые нули. "СОРОК ВОСЕМЬ, КАРЛ!!!" Когда до него дойдет??? Понятно, что, видимо, произошла ошибка в альфабетаотсечении и типа того, и всё... Он тупо не врубается. А человек врубается, что у черных край одним взглядом на позицию.

Vertu · 8 дек 2017

https://twitter.com/bennedik/status/938741157319856128
Statistics about the 1300 games played between AlphaZero and Stockfish. In total, AlphaZero won 318 games, lost 24, with 958 draws. That's 61% and an Elo performance of 3479, assuming 3389 Elo for Stockfish (which I think ran on a faster hardware than the Elo is from).

—- добавлено: 8 дек 2017 —-

Ми-Ля-Зола пишет: ↑

Ну, я вот загрузил позицию в chessbase, поставил на движок. Ну, понятно, мой кряхтит на убогой глубине, но он же с серверами соединяется и дает оценку тех, кто уже считал эту позицию.
Нажмите, чтобы раскрыть...

Чаво?

Комсюк · 8 дек 2017

Ми-Ля-Зола пишет: ↑

Ну, понятно, мой кряхтит на убогой глубине, но он же с серверами соединяется и дает оценку тех, кто уже считал эту позицию.
Нажмите, чтобы раскрыть...

Ваш движок даёт свою оценку
Если смотреть Let's check, то через ход уже есть оценка +1.31 даже на 32-ой глубине,

правда, от Комода

Ми-Ля-Зола · 8 дек 2017

Vertu, ну в смысле? В chessbase включаешь движок, он сверху показывает свой обсчет, ниже в другом окне показывает обсчет с серверов через инет. Если эту позицию уже считали, то ее оценка есть. Ну, как бы мой комп на глубине 48 давно бы дым пускал...

—- добавлено: 8 дек 2017, опубликовано: 8 дек 2017 —-

Комсюк пишет: ↑

Ми-Ля-Зола пишет: ↑

Ну, понятно, мой кряхтит на убогой глубине, но он же с серверами соединяется и дает оценку тех, кто уже считал эту позицию.
Нажмите, чтобы раскрыть...

Ваш движок даёт свою оценку
Если смотреть Let's check, то через ход уже есть оценка +1.31 даже на 32-ой глубине,

правда, от Комода

Нажмите, чтобы раскрыть...

Да?.. Ой... А что это тогда? Я думал это с серваков через инет... Извиняюсь, в нес тогда дезинфу... Но этото что все же

Комсюк · 8 дек 2017

Ми-Ля-Зола пишет: ↑

А что это тогда?
Нажмите, чтобы раскрыть...

это оценка тех, кто считал ранее, но ваш движок с ними не соединяется

vasa · 8 дек 2017

А вот игрулечка кавайная какая

Camon14 · 8 дек 2017

Явление АО это как явление Морфи. Он нас научит Родину любить в шахматы играть.

Challenger Spy · 8 дек 2017

Ми-Ля-Зола пишет: ↑

Можно вопрос, ибо я не шахматный профессионал.
Вот смотрите:
https://lichess.org/zbCOTavB#56

Личессовский стокфиш в этой партии на 28-ом ходу (по идеи позиция должна стоять сразу по ссылке) пишет крепкий НОЛЬ. И если дать ему хоть в сто раз больше мощностей, то не удивлюсь, если он будет считать точно так же. Так вот вопрос: я смотрю на эту позицию своим убогим условным первым разрядом и мне кажется, что позиция черных на шахматном языке называется "ящик". И если показать ее шахматному профи, то он скажет так же, что да все, у черных плохо от слова "совсем": линии e и d намертво захвачены белыми, король черных разбит и гуляет по доске, конь и ладья на a8 и b8 - это венок (а не венец!). Я не прав?
Нажмите, чтобы раскрыть...

Ваша малюсенькая ошибка заключается в том, что вы не замечаете имеющуюся в качестве компенсации у черных лишнюю фигуру

Нестор · 8 дек 2017

Самое смешное, что Гуглу в принципе шахматы малоинтересны, поиграются немного и бросят,
как Го. А в Азии гошники до сих пор в себя прийти не могут. То же самое будет и с шахматами.
Только в себя долго не смогут прийти адвансеры и разработчики топовых движков
А цель Гугла — это по-настоящему сильный алгоритм для ИИ!
Только вот доиграются они с огнём, чует моё сердце ...
Понаделают из нас, человеков, нанороботы канцелярских скрепок ...

Комсюк · 8 дек 2017

Challenger Spy, дай всё-таки экспертную оценку по железу
Во сколько раз у Альфы было сильнее?

Challenger Spy · 8 дек 2017

Комсюк, Я уже писал выше, что примерно в 100 раз. Но это не экспертная оценка, а основанная на обсуждаемых тут и там параметрах соперников грубая прикидка, причем вовсе не от спеца в нейронных сетях

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

sovaz1997 Учаcтник

crem Учаcтник

Jadn Заслуженный

Комсюк народный модератор

crem Учаcтник

Camon14 Хранитель традиций

Комсюк народный модератор

sovaz1997 Учаcтник

Camon14 Хранитель традиций

Комсюк народный модератор

Vladruss НедоКМС, победитель второразрядников.

crem Учаcтник

Ми-Ля-Зола Новичок

Fruit Александр

crem Учаcтник

Комсюк народный модератор

Vladruss НедоКМС, победитель второразрядников.

Camon14 Хранитель традиций

Ми-Ля-Зола Новичок

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

Vladruss НедоКМС, победитель второразрядников.

sovaz1997 Учаcтник

Gridnev Старожил

Ми-Ля-Зола Новичок

Vertu Старожил

Комсюк народный модератор

Ми-Ля-Зола Новичок

Комсюк народный модератор

vasa Опытный перворазрядник

Camon14 Хранитель традиций

Challenger Spy Технический специалист

Нестор консультант_ специалист по черной магии

Комсюк народный модератор

Challenger Spy Технический специалист

Поделиться этой страницей