AlphaZero. Нейронная сеть играет в шахматы

Rom · 7 Dec 2017

Rom said: ↑

Те самые 80 тысяч позиций в секунду, которые упоминали ранее
Click to expand...

Кстати, если Зеро адаптировать для обычного компьютера с хорошей видеокартой, то скорость перебора скорее всего снизится до 2 000 позиций в секунду. А если для компьютера без видеокарты, то до 100 или даже до 10 позиций в секунду. По крайней мере у меня программа для игры го , с нейросеткой, перебирает всего 10 позиций в секунду. При том, что нейросетка небольшая. Тем не менее 4-ядерник загружен под завязку.

—- добавлено: 7 Dec 2017 —-

Challenger Spy said: ↑

Простите, дружище, я далек от темы. Но, как ни крути, выходит, что на равном железе Сток затащил бы без шансов?
Click to expand...

Мне кажется примерно поровну было бы.

—- добавлено: 7 Dec 2017, опубликовано: 7 Dec 2017 —-

Котэ said: ↑

Также ввиду того, что в конце график выравнивается, по всей видимости эта нейросеть не заиграет сильнее если будет "тренироваться" не 9 часов, а месяц.
Click to expand...

Можно сделать нейросеть больше, тогда она скорее всего натренируется быстрее и лучше. Правда станет ещё медленнее. Пробовать нужно. Вот Гуглу и карты в руки. Только у них есть 5000 TPU для тренировки.

Challenger Spy · 7 Dec 2017

Jadn said: ↑

Ага, именно поэтому Альфузеру запускали на 45 Терафлопах
Click to expand...

45x4=180

Challenger Spy · 7 Dec 2017

Задумался насчет этого графика. Почему линия Альфы практически выходит на уровне Стока, лишь незначительно его превосходя? Ведь алгоритмы принципиально разные. Почему не ниже понятно - тогда бы никто эту прогу не явил миру. А почему выше так незначительно? Сток - это ориентир какой-то, веха? Чувство такое, что "алгоритм обучения" проги просто много месяцев обучали именно на стоке, с учетом его слабых мест. Именно поэтому играли со старой версией.

crem · 7 Dec 2017

Crest said: ↑

По виду, это был чисто рекламный матч!
Против АльфаЗеро играл какой-то кастрат на слабом железе, которого назвали громким именем Стокфиш.
Выглядит как явная подстава.
Думаю, обычный Стокфиш на моём домашнем стационаре наберёт против этого нового распиаренного монстра намного больше очков, чем тот самый кастрат.
Click to expand...

"Слабое железо" было 64-ядерным процессором, это точно сильнее, чем ваш "домашний стационар".

У AlphaZero было 4 TPU (специальные процессоры которые умеют быстро перемножать матрицы), такая же производительность может быть получена от ~30 современных GPU (видеокарт). Обычные процессоры (CPU) под перемножение большого количества вещественных чисел не оптимизированы, и без GPU были бы помедленнее.

Конечно, у AlphaZero всё-таки ресурсов было побольше (но не заоблачно больше), но Stockfish тоже работал на очень хорошем железе, гораздо лучшем, чем у вас дома.

—- добавлено: 7 Dec 2017, опубликовано: 7 Dec 2017 —-

Crest said: ↑

Остаётся непонятным, как именно работает эта нейронная сеть? Те объяснения на пальцах, которые я видел, приводят к новым вопросам.
Для того, чтобы АльфаЗеро за ограниченное количество времени сыграл сам с собой огромное количество партий в выбранном направлении и потом на основе статистики выбрал лучшее продолжение, ему необходим суперкомпьютер, гигантские возможности.
Плюс хороший, толковый шахматный движок.
Click to expand...

На этапе тренировки нейронной сети действительно использовались очень большие вычислительные мощности. Действительно чтоб сыграть с собой миллионы партий за 4 часа, нужны тысячи компьютеров.
Но после того, как сеть натренирована, модель можно запускать на куда меньших мощностях, и одного компьютера достаточно.

В процессе тренировки alphazero никакого другого шахматного движка не использовалось. AlphaZero просто играл сам с собой, зная только правила (и делая ходы наугад), а потом постепенно научилось выигрывать.

Как именно работают нейросети вообще и AlphaZero в частности — могу рассказать (точнее, могу рассказать о AlphaGo, потому что её алгоритм опубликован детальнее).

Vertu · 7 Dec 2017

Бедному Стокфишу отрезали дебютные и, что еще важнее, эндшпильные базы, взяли устаревшую версию и железо в сто раз слабее оппонента. Странно, что он не проиграл 0-100.

sovaz1997 · 7 Dec 2017

Vertu said: ↑

Бедному Стокфишу отрезали дебютные и, что еще важнее, эндшпильные базы, взяли устаревшую версию и железо в сто раз слабее оппонента. Странно, что он не проиграл 0-100.
Click to expand...

дебютные/эндшпильные базы - это как раз ладно, сравнивают именно алгоритмы. Но различия архитектуры, я считаю, не должны выявлять победителя. Нужен честный матч на CPU.

Но, по факту, можно признать, что все проблемные позиции для движков (крепости, пешечные цепи, а также изменяемая ценность фигур в зависимости от позиций и т. п.) решены

Комсюк · 7 Dec 2017

crem said: ↑

Stockfish тоже работал на очень хорошем железе, гораздо лучшем, чем у вас дома.
Click to expand...

не гораздо, а всего в два с небольшим раза

Котэ · 7 Dec 2017

Challenger Spy said: ↑

А почему выше так незначительно? Сток - это ориентир какой-то, веха?
Click to expand...

Вероятно потому, что играть значительно сильнее стока в принципе невозможно. +25 =25 белым цветом это очень много.. Сколько набрал бы против Стока комп вооруженный 32-х фигурными базами, т е неотвратимо наказывающий за любую ошибку? Это конечно зона домыслов, но мне кажется, что-то в районе +35 =15. Так как ничейные тенденции в шахматах довольно велики...

Rom · 7 Dec 2017

Трудно сравнивать столь разные архитектуры. Можно сравнивать CPU и GPU по флопсам/мипсам, можно сравнивать их по финансовым затратам на железо, можно как-то иначе. И каждый раз результат будет получаться разный. Как у слона и кита.

Комсюк · 7 Dec 2017

sovaz1997 said: ↑

дебютные/эндшпильные базы - это как раз ладно,
Click to expand...

не ладно
Сток слаб в дебюте по нынешнему нашему пониманию (а по минуте на ход так вообще бестолковый)
И в эндшпиле без таблиц он плавает

crem · 7 Dec 2017

Vertu said: ↑

Бедному Стокфишу отрезали дебютные и, что еще важнее, эндшпильные базы, взяли устаревшую версию и железо в сто раз слабее оппонента. Странно, что он не проиграл 0-100.
Click to expand...

Нигде, кстати, не написано, что дебютных баз не было, только Накамура говорил. Но скорее всего он видел где стокфиш играл не по книге.
А насчёт эндшпильных баз: они гарантируют оптимальную игру в эндшпиле и это не заслуга стокфиша, нельзя сравнивать движок который "думает" (stockfish или alphazero, не важно), с просто подсматриванием правильного ответа в таблице.

Котэ · 7 Dec 2017

Мне кажется любопытным вот что. Когда анализируешь какой-то дебютный вариант со Стокфишем(Гудини/Комодо) выясняешь, что черные везде уверенно держатся. Запас прочности велик. Как результат - даже такие "сомнительные" дебютные построения как "дракон" вернулись в практику топ гроссмейстеров. А когда смотришь процент побед альфы во время тестов(во Французской например белые выиграли 39 раз из 50) начинает закрадываться мысль, что все мы ошибались и права "выступки" может оказаться достаточно для победы. Ладно, для победы конечно не достаточно, продвинутый адвансер со стоком, против альфы сможет отсушить. Но возможно белые по дебюту получают чуть больший перевес, чем нам казалось последние годы.

Alexandr_L · 7 Dec 2017

где скачать этот альфа зеро?

Camon14 · 7 Dec 2017

sovaz1997 · 7 Dec 2017

Комсюк,

Комсюк said: ↑

sovaz1997 said: ↑

дебютные/эндшпильные базы - это как раз ладно,
Click to expand...

не ладно
Сток слаб в дебюте по нынешнему нашему пониманию (а по минуте на ход так вообще бестолковый)
И в эндшпиле без таблиц он плавает
Click to expand...

Им надо было хотя бы сравнивать с последней версией и дать возможность разрешать fail-high оценки с помощью турнирного контроля времени. Ну, и, железо совершенно разное и не вплане производительности, а в плане архитектуры.

Alexandr_L said: ↑

где скачать этот альфа зеро?
Click to expand...

а у вас есть 4 TPU? Системные требования такие . А программки в открытом доступе нет, это машина (железо+софт).

Vladruss · 7 Dec 2017

Вот здесь можно глянуть все результативные партии: https://arxiv.org/pdf/1712.01815.pdf

Комсюк · 7 Dec 2017

точно все?

sovaz1997 · 7 Dec 2017

Вот мне непонятно, почему партий 10. Почему они не выложили все 100 партий? Ведь нет ничего сложного в том, чтобы Stockfish сыграл с AlphaZero 1000 раз со счетом в пользу Stockfish +500 =490 -10 и выложить эту десятку под видом +28 =73 -0

P. S.

Ограничение в 500 секунд после каждого сообщения не очень удобно для обсуждения таких тем

Zayats · 7 Dec 2017

Alexandr_L said: ↑

где скачать этот альфа зеро?
Click to expand...

Вопрос по существу.

Yury_Solomatin said: ↑

Накамура назвал матч "нечестным", указав, что для оптимальной работы Stockfish этот движок должен использовать дебютную книгу. Он не думает, что с дебютной книгой Stockfish выиграл бы матч, но разрыв в счете был бы намного меньше. "Я уверен, что сам Господь бог не набрал бы против Stockfish 75 процентов очков белыми без какой-либо форы"...
Click to expand...

Свешников полагал узаконенным читерством давать движку книгу и таблицы, но настоящий обман - выпустить нашего родного Стока, вот так, без дебюта и семифугурок, на помойном железе. Можно сказать - на убой. Посмотрим, что скажет Накамура, когда Stockfish получит качество или четыре хода вперед и будет в муках делать эпизодические ничьи.

Комсюк · 7 Dec 2017

sovaz1997 said: ↑

Им надо было хотя бы сравнивать с последней версией
Click to expand...

Соваз, ну какая разница? Это же не матч на чемпиона

Jadn · 7 Dec 2017

Vertu said: ↑

Бедному Стокфишу отрезали дебютные и, что еще важнее, эндшпильные базы, взяли устаревшую версию и железо в сто раз слабее оппонента. Странно, что он не проиграл 0-100.
Click to expand...

Эндшпильные базы дают совсем немного. Дебютные? Я не вникал, но обычно тестируют на наборе табий с переменой цвета. Если тут такого не было, и играли всегда из начальной позиции, то это действительно не правильно, и могло повлиять на итог.

Комсюк · 7 Dec 2017

Jadn said: ↑

Если тут такого не было, и играли всегда из начальной позиции
Click to expand...

так и было
Не будем говорить про длинную книгу, против того же движка без книги это сможет дать более ста Эло, но короткую обучаемую ctg. надо было дать!
Хоть бы французскую отсекли, проиграв разок
Дебют этот совсем не для движковых матчей по минуте на ход

Vladruss · 7 Dec 2017

Комсюк said: ↑

точно все?
Click to expand...

Я имел в виду: из того, что нам выложили.

Gottfrid · 7 Dec 2017

Новоявленный гроссмейстер Альф Гуглович Нулёвкин как-то довольно быстро в процессе обучения пристрастился к "испанской партии"... Но в итоге разочаровался в ней. Это не может не радовать.

Vladruss · 7 Dec 2017

Zayats said: ↑

Свешников полагал узаконенным читерством давать движку книгу и таблицы, но настоящий обман - выпустить нашего родного Стока, вот так, без дебюта и семифугурок, на помойном железе. Можно сказать - на убой.
Click to expand...

Не понимаю, что за истерика по поводу дебютной книги и эндшпильных баз? То, что Стока "выпустили на убой", это только по факту выяснилось. До начала игры это был эксперимент с неизвестным результатом, в котором проверялись алгоритмы программ. Понятно, что использовать в таком случае дебютную книгу и эндшпильные базы, это читерство и это сводит на нет смысл всего эксперимента. Опять же: проиграй этот матч Альфазеро, и можно уже кричать, что его отдали на расправу читеру-Стокфишу.
Нет, все по честному: если проверяете качество алгоритма, то никакие тут книги и базы не уместны. Пусть своими электронно-программными мозгами играют.

Комсюк · 7 Dec 2017

Vladruss said: ↑

Нет, все по честному: если проверяете качество алгоритма, то никакие тут книги и базы не уместны. Пусть своими электронно-программными мозгами играют.
Click to expand...

Стокфиш не создан считать первые ходы, его и тестируют с набором позиций
Согласен частично с Ядном, влияние эндшпильных таблиц меньше
Но не минимальное!

Neo94 · 7 Dec 2017

Vladruss said: ↑

Не понимаю, что за истерика по поводу дебютной книги и эндшпильных баз? То, что Стока "выпустили на убой", это только по факту выяснилось. До начала игры это был эксперимент с неизвестным результатом, в котором проверялись алгоритмы программ. Понятно, что использовать в таком случае дебютную книгу и эндшпильные базы, это читерство и это сводит на нет смысл всего эксперимента. Опять же: проиграй этот матч Альфазеро, и можно уже кричать, что его отдали на расправу читеру-Стокфишу.
Нет, все по честному: если проверяете качество алгоритма, то никакие тут книги и базы не уместны. Пусть своими электронно-программными мозгами играют.
Click to expand...

Железо все же несбалансированное было - примерно в 2 раза (напрямую не сравнить, но +- так), что лишние полдесятка побед да принесло. Ну и строго 1 минута на ход (а не там час на партию) - конкретно Стокфишу плохой контроль.

Да, сток проиграл бы и так, но не 28 партий, а примерно 15, ну 20. Альфа крут, но не так уж Стокфиш плох, будем откровенны...

И да, с дебютной книгой Сток ну никак бы не проиграл половину партий черными.

Vladruss · 7 Dec 2017

Комсюк said: ↑

Стокфиш не создан считать первые ходы, его и тестируют с набором позиций
Click to expand...

Это его личные проблемы. Пусть показывает свою истинную силу без костылей подслеповатой бабки-теории. Глядишь, теперь программисты Стокфиша начнут по-серьезке репу чесать, как силу игры Стокфиша увеличить.

Nikobelic · 7 Dec 2017

Это конечно какой то рекламный трюк то что фиш играл без книги и таблиц чтобы все балбесы об этом говрили создавая белый шум. Чего они только хотят не понятно.
С левым контролем. Это все ради того чтобы показать победу

Vladruss · 7 Dec 2017

Neo94 said: ↑

Железо все же несбалансированное было - примерно в 2 раза (напрямую не сравнить, но +- так), что лишние полдесятка побед да принесло. Ну и строго 1 минута на ход (а не там час на партию) - конкретно Стокфишу плохой контроль.
Click to expand...

Про железо и контроль я ничего не говорил.

Gottfrid · 7 Dec 2017

Vladruss said: ↑

Пусть своими электронно-программными мозгами играют.
Click to expand...

Другими словами: "Процессор, конечно, лопух, но аппаратура при нём. При-нём!" ©

Neo94 · 7 Dec 2017

Vladruss said: ↑

Это его личные проблемы. Пусть показывает свою истинную силу без костылей подслеповатой бабки-теории. Глядишь, теперь программисты Стокфиша начнут по-серьезке репу чесать, как силу игры Стокфиша увеличить.
Click to expand...

Сток - это почти вершина умного брутфорса, мне кажется, что даже теоретически программы с таким алгоритмом (на аналогичном железе с аналогичными условиями) могут играть ну на 3550, даже 3600 не возьмут.

Вот нейронки поднимут планку почти до 4000, до уровня б-га.

—- добавлено: 7 Dec 2017 —-

Nikobelic said: ↑

Это конечно какой то рекламный трюк то что фиш играл без книги и таблиц чтобы все балбесы об этом говрили создавая белый шум. Чего они только хотят не понятно.
С левым контролем. Это все ради того чтобы показать победу
Click to expand...

Сток проиграет и с книгой, и с хорошим для него контролем, и с базами Налимова.
Но отсушит не 72 партии из 100, а около 90.

Комсюк · 7 Dec 2017

Neo94 said: ↑

Железо все же несбалансированное было - примерно в 2 раза (напрямую не сравнить, но +- так),
Click to expand...

вы уж договоритесь между собой
Спай утверждает о тысячекратном стократном перевесе

Jadn · 7 Dec 2017

Комсюк said: ↑

Jadn said: ↑

Если тут такого не было, и играли всегда из начальной позиции
Click to expand...

так и было
Click to expand...

Ну, это ерунда. Веса в оценочной функции Стока не подогнаны специально под начальную позицию .Получилось, что над первым ходом Сток думал только 1 минуту, а Азер - минуту+все время предварительного обучения. Мягко говоря неравные условия. К тому же, наверное много похожих партий было.

Комсюк · 7 Dec 2017

в 128 раз это 7 удвоений, то есть 280-350 Эло

—- добавлено: 7 Dec 2017 —-

Jadn said: ↑

К тому же, наверное много похожих партий было.
Click to expand...

Сток тяготеет к французской на таком контроле, а Вы сами знаете, что это не фонтан (для движка без оператора)

—- добавлено: 7 Dec 2017 —-

Jadn said: ↑

Азер
Click to expand...

бакинцы решили приватизировать?

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

Rom Старожил

Challenger Spy Технический специалист

Challenger Spy Технический специалист

crem Учаcтник

Vertu Старожил

sovaz1997 Учаcтник

Комсюк народный модератор

Котэ Восьмикратный чемпион подъезда

Rom Старожил

Комсюк народный модератор

crem Учаcтник

Котэ Восьмикратный чемпион подъезда

Alexandr_L куркуль

Camon14 Хранитель традиций

sovaz1997 Учаcтник

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

sovaz1997 Учаcтник

Zayats Без определенного статуса

Комсюк народный модератор

Jadn Заслуженный

Комсюк народный модератор

Vladruss НедоКМС, победитель второразрядников.

Gottfrid Учаcтник

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

Neo94 Учаcтник

Vladruss НедоКМС, победитель второразрядников.

Nikobelic Зарегистрирован

Vladruss НедоКМС, победитель второразрядников.

Gottfrid Учаcтник

Neo94 Учаcтник

Комсюк народный модератор

Jadn Заслуженный

Комсюк народный модератор

Share This Page