AlphaZero. Нейронная сеть играет в шахматы

Michael-13 · 28 дек 2017

Помимо АльфаЗеро, существуют и другие нейронные сети.
Например Tacotron 2 от Google, который говорит почти по человечески.
https://geektimes.ru/post/296691/
https://research.googleblog.com/2017/12/tacotron-2-generating-human-like-speech.html
https://arxiv.org/abs/1712.05884
https://google.github.io/tacotron/publications/tacotron2/index.html

Limavr · 29 дек 2017

Скажите, почему всюду пишут, что АЗ не проиграл ни одной партии за белых?
267W 378D 5L (это результаты АЗ за белых) и 51W 580D 19L (это результаты СФ за белых).

Harutyun · 30 дек 2017

Crest пишет: ↑

Harutyun пишет: ↑

Вопрос Шипову. Может гроссмейстер победить стокфишу на телефоне с слабым процессором?
Нажмите, чтобы раскрыть...

Может.
Если гроссмейстер очень сильный, а процессор весьма слабый.
Нажмите, чтобы раскрыть...

Получается вполне реально турнир между телефонами и людей. При этом создатели телефонов будут заинтересованы финансированием таких турниров.

—- добавлено: 30 дек 2017, опубликовано: 30 дек 2017 —-

Получилась создать сайт по адресу alphazero.ru. Посоветуйте какие разделы там открыть.

WinPooh · 3 янв 2018

Тем временем несколько версий Leela Zero в компьютерном рейтинге вышли на уровень дана (2100 и больше):
http://www.yss-aya.com/cgos/19x19/cross/LZ-58da61-t1-p1600.html

просроченый_кмс · 3 янв 2018

Хрен с этой го, когда шахматы нам опять покажут.
Интересно допилят они прогу или совсем завершили, может хоть в качестве анализа дадут тпу дистанционно что бы можно было ходы вводить и получать анализ как на комп сайтах.

Комсюк · 3 янв 2018

просроченый_кмс пишет: ↑

Интересно допилят они прогу или совсем завершили
Нажмите, чтобы раскрыть...

Так Винни писал, что они свернулись

Mustitz · 3 янв 2018

просроченый_кмс пишет: ↑

Интересно допилят они прогу или совсем завершили, может хоть в качестве анализа дадут тпу дистанционно что бы можно было ходы вводить и получать анализ как на комп сайтах.
Нажмите, чтобы раскрыть...

Тут хотя-бы показали все сыгранные партии...

просроченый_кмс · 4 янв 2018

жалко, шахматы более популярная игра, да и заработать они могли делая эти тпу и продавая прогу
но думаю появятся продолжатели с умными мозгами)

Mustitz · 4 янв 2018

Заработать? Стоимость TPU сейчас в районе $100k, таких штук надо четыре. Думаю, если кто захочет приобрести такую штуку, и у него есть миллион долларов, и он не из РФ, то, я думаю, он может напрямую обращаться в Deep Mind.

NS · 5 янв 2018

просроченый_кмс пишет: ↑

жалко, шахматы более популярная игра, да и заработать они могли делая эти тпу и продавая прогу
но думаю появятся продолжатели с умными мозгами)
Нажмите, чтобы раскрыть...

Mustitz пишет: ↑

Заработать? Стоимость TPU сейчас в районе $100k, таких штук надо четыре. Думаю, если кто захочет приобрести такую штуку, и у него есть миллион долларов, и он не из РФ, то, я думаю, он может напрямую обращаться в Deep Mind.
Нажмите, чтобы раскрыть...

AlphaZero обучался исключительно посредством «самостоятельной игры» с использованием 5000 TPU первого поколения для создания игр и 64 ТПУ второго поколения для обучения нейронных сетей, все параллельно
© Wiki

Mustitz · 5 янв 2018

NS пишет: ↑

AlphaZero обучался исключительно посредством «самостоятельной игры» с использованием 5000 TPU первого поколения для создания игр и 64 ТПУ второго поколения для обучения нейронных сетей, все параллельно
© Wiki
Нажмите, чтобы раскрыть...

Ну... для игры его обучать уже не надо. Надо просто загрузить уже обученную сеть. Вроде как играет она на четырёх TPU.

NS · 6 янв 2018

А где взять эту обученную сеть? И даже если её отдадут, вряд ли она на 4 TPU в нормальных условиях будет сильнее сильнейших движков.

Нестор · 6 янв 2018

Сильнее сильнейших движков, которые сильнее сильнейших людей ...

roman57 · 6 янв 2018

Нестор пишет: ↑

Сильнее сильнейших движков, которые сильнее сильнейших людей ...
Нажмите, чтобы раскрыть...

А0 обыграл чемпиона 2016 , а чемпиона 2017 ещё нужно обыграть

Нестор · 6 янв 2018

roman57 пишет: ↑

Нестор пишет: ↑

Сильнее сильнейших движков, которые сильнее сильнейших людей ...
Нажмите, чтобы раскрыть...

А0 обыграл чемпиона 2016 , а чемпиона 2017 ещё нужно обыграть
Нажмите, чтобы раскрыть...

Так о том и речь, что Дип Майнд это ненужно! Свернули они это направление.
Неинтересны им дальнейшие спортивные шахматные достижения. А жаль ...

Комсюк · 6 янв 2018

Нестор пишет: ↑

А жаль ...
Нажмите, чтобы раскрыть...

Нисколько не жаль!
Адванс хоть немного поживёт... если Нефёдов не прикупит себе такую "дуру"

svoitsl · 7 янв 2018

Что то мне кажется, что заняться движком на новом алгоритме вполне мог бы Васик Райлих.
Свою Рыбку он забросил, к Фрицу наверное душа не лежит, а вот новое направление довольно перспективное для него.
Как и для его конторы, где он сейчас творит.
К тому же в деньгах она особо не стеснена....
Судя по краткому описанию А0- с точки зрения програмиста не очень уж и сложная штука, наработанные (при обучении) данные вполне можно прикупить у гугла.... Ну а дальше - дело техники и бизнеса

nn · 7 янв 2018

А где он работает? И чем занимается?

Нестор · 7 янв 2018

Кстати, да! Где Васик в это тяжелое время?

N1mTzo · 7 янв 2018

nn пишет: ↑

А где он работает? И чем занимается?
Нажмите, чтобы раскрыть...

Работает на ChessBase, создает новые версии Fritz'а (движка).

roman57 · 7 янв 2018

N1mTzo пишет: ↑

nn пишет: ↑

А где он работает? И чем занимается?
Нажмите, чтобы раскрыть...

Работает на ChessBase, создает новые версии Fritz'а (движка).
Нажмите, чтобы раскрыть...

Не люблю Фриц , доступная версия только 14 , но она мне завешивает машину при поражении , забавно что когда он ведёт игру , то всё в порядке - шутка программистов наверно ^_^

N1mTzo · 7 янв 2018

roman57 пишет: ↑

Не люблю Фриц , доступная версия только 14 , но она мне завешивает машину при поражении , забавно что когда он ведёт игру , то всё в порядке - шутка программистов наверно ^_^
Нажмите, чтобы раскрыть...

К 14-му Фрицу Васик не имеет отношение.

zeroalphazero · 9 янв 2018

Дебютная теория не стоит на месте!
Определенное влияние матча заметно и по обновленным книгам движков — см., например, новогоднюю Hiarcs14yBook.
Продолжают толкать, корректируя, теорию вперед и люди:
[Event "Sitges Sunway op"]
[Site "Sitges"]
[Date "2017.12.19"]
[Round "5"]
[White "Gascon del Nogal, Jose Rafael"]
[Black "Kucuksari, Kaan"]
[Result "1/2-1/2"]
[ECO "E17"]
[WhiteElo "2479"]
[BlackElo "2290"]
[PlyCount "81"]
[EventDate "2017.12.15"]
[EventType "swiss"]
[EventRounds "9"]
[EventCountry "ESP"]
[SourceTitle "Mega2018 Update 10"]
[Source "Chessbase"]
[SourceDate "2017.12.28"]
[SourceVersion "1"]
[SourceVersionDate "2017.12.28"]
[SourceQuality "1"]

1. Nf3 Nf6 2. c4 b6 3. g3 e6 4. Bg2 Bb7 5. d4 Be7 6. O-O O-O 7. d5 exd5 8. Nh4
c6 9. cxd5 Nxd5 10. Nf5 Nc7 11. e4 d5 12. exd5 Nxd5 13. Nc3 Nxc3 14. Qg4 Bf6
15. bxc3 Bc8 16. Ba3 Bxf5 17. Qxf5 Qc8 18. Qf3 Rd8 19. Rad1 a5 20. Rd6 h6 21.
Rxf6 gxf6 22. Qxf6 Re8 23. Qxh6 Qe6 24. Qh4 Ra7 25. c4 f6 26. Bb2 Rh7 27. Qxf6
Qxf6 28. Bxf6 Re2 29. a4 Rc2 30. Be4 Rxc4 31. Bxh7+ Kxh7 32. Bd8 Rb4 33. Rd1
Kg6 34. Rd6+ Kf5 35. h4 Ke5 36. Rg6 Rxa4 37. h5 Nd7 38. h6 Nf8 39. Rf6 Nh7 40.
Rf7 Rd4 41. Bc7+ 1/2-1/2

zeroalphazero · 9 янв 2018

KEV81 пишет: ↑

Не понимаю, зачем...
Нажмите, чтобы раскрыть...

Ага, и малювальникам дать приказ: зимой и летом — одним цветом!
Осталось @z выбрать правильный для этой темы ответ:

елка;

заяц;

доллар/деньги;

негр;

крокодил;

небо;

солнце;

машина.

zeroalphazero · 9 янв 2018

Надо ли добавлять?
Подошли, допустим, к "краю" трех-четырех(?)-мерной Вселенной. Увидели (якобы) тень Бога.
Иди знай — то ли это действительно Его тень, то ли это всего лишь какая-то голографическая проекция пяти-шести(?!)-мерной?
P.S. Мехмат'овцы вряд ли ответят...

Jadn · 9 янв 2018

zeroalphazero пишет: ↑

Надо ли добавлять?
Подошли, допустим, к "краю" трех-четырех(?)-мерной Вселенной. Увидели (якобы) тень Бога.
Иди знай — то ли это действительно Его тень, то ли это всего лишь какая-то голографическая проекция пяти-шести(?!)-мерной?
P.S. Мехмат'овцы вряд ли ответят...
Нажмите, чтобы раскрыть...

У меня ощущение, что эта нейросеть пытается нам что-то сказать, но пока получается не очень.

Camon14 · 9 янв 2018

Обучите ее грамоте.

Алексанлр · 9 янв 2018

ШахматыЭтоДиагноз · 10 янв 2018

Jadn пишет: ↑

zeroalphazero пишет: ↑

Надо ли добавлять?
Подошли, допустим, к "краю" трех-четырех(?)-мерной Вселенной. Увидели (якобы) тень Бога.
Иди знай — то ли это действительно Его тень, то ли это всего лишь какая-то голографическая проекция пяти-шести(?!)-мерной?
P.S. Мехмат'овцы вряд ли ответят...
Нажмите, чтобы раскрыть...

У меня ощущение, что эта нейросеть пытается нам что-то сказать, но пока получается не очень.
Нажмите, чтобы раскрыть...

Она пытается сказать: "Или вы меня считаете за миробля, или вы сами миробли".

zeroalphazero · 10 янв 2018

ШахматыЭтоДиагноз пишет: ↑

"Или вы меня считаете за миробля, или вы сами миробли"
Нажмите, чтобы раскрыть...

... если самокритика — наше оружие, то пусть не скажут потомки, что мы не умели им пользоваться...
Нажмите, чтобы раскрыть...

Все очень просто? Сказки — обман?

Галактически стыдно!
Нажмите, чтобы раскрыть...

Rom · 10 янв 2018

Вести с полей:

glinscott commented 5 hours ago

Have made quite a bit more progress on this, I've got it to the stage I was able to generate good self-play games, and then run the training script to generate a new network. The new network was then 100 ELO stronger than the random mover (after only 160 games!). So, hopefully not too many bugs introduced in the port over .

Great work on the OpenCL validation @gcp, I ported that over, and it saved me big-time when I had made a mistake in the OpenCL batch-norm implementation.

Also, interestingly the CPU implementation with a 5x64 network for chess is competitive with GPUs, except for very beefy new GPUs. That's great for generating training data though! No GPU required .

I have noticed that the scaling isn't quite linear per core like I would expect, but haven't dug too deeply into it yet.

https://github.com/gcp/leela-zero/issues/369
https://github.com/glinscott/leela-chess

nn · 10 янв 2018

Добавлю ссылку

—- добавлено: 10 янв 2018 —-

В го учится с нуля чрезвычайно медленно. Leela-Zero еще наверно месяца полтора-два нужно чтобы дойти до уровня полученного от supervised learning
Наверно, для шахмат тоже не скоро на нормальной уровень выйдет.

Rom · 10 янв 2018

nn пишет: ↑

В го учится с нуля чрезвычайно медленно. Leela-Zero еще наверно месяца полтора-два нужно чтобы дойти до уровня полученного от supervised learning
Нажмите, чтобы раскрыть...

Сетка supervised learning примерно в 5 раз больше чем текущая (6х128 против 5х64). А текущая нейросеть потому и стала обучаться медленнее, что подходит к пределу для своей размерности. Так что текущая сеть может быть никогда и не обгонит сеть supervised learning. Она предназначена только для отработки методов тренировки. Сейчас ещё разок понизят learning rate, доведут текущую сеть до предела и перейдут к тренировке сети нормальной размерности.

Сейчас главный вопрос - можно ли качественно натренировать новую нейросеть на партиях сыгранных предыдущей нейросетью. Поскольку наигрывание партий как раз наиболее ресурсоёмкий процесс, то прояснение этого вопроса может многое решить. Если получится, то можно будет не начинать тренировку новой нейросети с нуля, а постепенно увеличивать её размерность.

zeroalphazero · 10 янв 2018

...а постепенно увеличивать её размерность.
Нажмите, чтобы раскрыть...

"Спокойствие, только спокойствие!"
Вы уж там не переусердствуйте, please, со всякого рода ЕЁ размерностями, ok?

N1mTzo · 11 янв 2018

Кстати, вот тут Интел представила (для широкой публики, так-то анонс был в прошлом году) на CES штуковину под названием Intel Loihi. По виду как обычный проц в исполнении LGA115x (140Вт tdp), то есть это уже гораздо ближе к простому человеку, чем колоссальные нейросети за млн. долларов, доступные только компаниям уровня Гугл.

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

Michael-13 Господин

Limavr Зарегистрирован

Harutyun Начинающий

WinPooh В.М.

просроченый_кмс Старожил

Комсюк народный модератор

Mustitz Заслуженный

просроченый_кмс Старожил

Mustitz Заслуженный

NS Нефёдов Сергей

Mustitz Заслуженный

NS Нефёдов Сергей

Нестор консультант_ специалист по черной магии

roman57 Учаcтник

Нестор консультант_ специалист по черной магии

Комсюк народный модератор

svoitsl Учаcтник

nn Старожил

Нестор консультант_ специалист по черной магии

N1mTzo Учаcтник

roman57 Учаcтник

N1mTzo Учаcтник

zeroalphazero Учаcтник

zeroalphazero Учаcтник

zeroalphazero Учаcтник

Jadn Заслуженный

Camon14 Хранитель традиций

Алексанлр Учаcтник

ШахматыЭтоДиагноз Учаcтник

zeroalphazero Учаcтник

Rom Старожил

nn Старожил

Rom Старожил

zeroalphazero Учаcтник

N1mTzo Учаcтник

Поделиться этой страницей