AlphaZero. Нейронная сеть играет в шахматы

Mustitz · 27 авг 2018

Jadn пишет: ↑

Интересно, я не знал, что AB научились нормально масштабировать. Тогда вопрос, почему авторы Лилы решили спаривать нейросети с MCTS? Потому, что в Го хорошо получилось?
Нажмите, чтобы раскрыть...

Скорее повторение результата от Deep Mind и Alpha Zero. В целом есть метод, которые хорошо решает многие игры. Почему бы не попробовать?

Я сильно не вникал, но у меня такое ощущение, что поначалу цель состояла не просто в написании сильного шахматного двиджка, но и в попытке универсального подхода, чтобы можно было утверждать, что человек дал только структуру нейросети, остальному программа научилась сама. В пользу этого (1) отказ от использования таблиц Налимова (2) на вход нейросети не заводятся специфические шахматные параметры, которые могли бы ей помочь (особенности структуры, такие как сдвоенные пешки, проходная, наличие двух слонов, ...). Всё это нейросеть должна определить сама.

Rom · 27 авг 2018

Mustitz пишет: ↑

AlphaGo прекрасно работал на гигантском кластере: для работы AlphaGo использовались 1920 процессоров и 280 графических процессоров, работающих в распределённой сети. Вообще, распараллелить MCTS вообще не проблема (ИМХО). Неужели тяжело выбрать вместой одной позиции сразу 1000 кандидатов для симуляции? Преимущество MCTS перед Alpha-Beta как раз в том, что позволяет эффективно строить такие кластеры. Один сервер раздаёт позиции для симуляций, получает тексты партий и аккумулирует статистику. Остальные заняты независимыми симуляциями. Нам не надо иметь общий многогигабайтный хеш позиций и работать с ним.
Нажмите, чтобы раскрыть...

Так ведь нынешняя реализация MCTS не использует симуляции до конца партии. Она использует только оценки нейросети. Возможно именно поэтому АльфаГо Зеро и играла только на 4 TPU.

Вот, кстати и crem не уверен, что можно набрать нужное количество позиций для параллельной оценки:
http://forchess.ru/showpost.php?p=74722&postcount=274

Mustitz · 27 авг 2018

Rom пишет: ↑

Так ведь нынешняя реализация MCTS не использует симуляции до конца партии.
Нажмите, чтобы раскрыть...

Я не вижу, что это меняет принципиальным образом. Да, у нас две нейросети, одна ответственна за выбор ходов, другая за оценку позиции. Да, возможно их синхронизация — узкое место: вроде как надо считать оценку, а данных недостаточно для полной загрузки. Но всё равно нам ничто не мешает запустить ещё одну симуляцию/оценку при наличии дополнительного железа/компа. Как раз будут набираться быстрее батчи для оценок

Опять же, когда я писал драйвера для красненьких, было 64 АЛУ на один вычислительный блок, каждый из которых вполне мог работать независимо. Но основная проблема производительности всегда упиралась в память.

Скорее всего проблема в том, что более 4 TPU не подключить к одной машине. Или ещё где всплыл боттленек. Но и так хватило победить Stockfish, написать статью, поэтому их никто не решал

Да и в целом большинству куда более интересно заниматься дизайном, а не решать технических нюансы оптимизации.

Rom · 27 авг 2018

Mustitz пишет: ↑

Я не вижу, что это меняет принципиальным образом. Да, у нас две нейросети, одна ответственна за выбор ходов, другая за оценку позиции. Да, возможно их синхронизация — узкое место: вроде как надо считать оценку, а данных недостаточно для полной загрузки. Но всё равно нам ничто не мешает запустить ещё одну симуляцию/оценку при наличии дополнительного железа/компа. Как раз будут набираться быстрее батчи для оценок
Нажмите, чтобы раскрыть...

Чтобы расширить дерево перебора вы должны сначала пройтись по существующему дереву, отобрать пакет перспективных позиций основываясь на статистике предыдущих оценок, оценить позиции на видеокарте, исправить статистику по узлам на основании этих оценок и только тогда повторить процедуру.

Таким образом весь процесс получается последовательным. Единственное, что мы можем делать параллельно это расширить пакет позиций, добавляя туда всё более бестолковые варианты.

Neo94 · 29 авг 2018

Ну что, послезавтра начинается CCCC от chess.com
http://blog.lczero.org/2018/08/cccc.html

Лейла должна рвать на таком железе

WinPooh · 29 авг 2018

Путём хитрых пересчётов и масштабирований фанаты Лилы уже насчитали ей 3600 и больше. Всем прочим программам следует просто сдаться без игры. А то ещё обыграют случайно, получится неловко.

Neo94 · 29 авг 2018

В 13-ом сезоне TCEC вышла с 4-го дивизиона с 1-го места.
В 3-ем сезоне и в дополнительных играх она играла полностью на уровне Этериала, топового движка 1-го дивизиона. Когда криворукие одмены TCEC наконец-то смогли нормализовать работу железа.

На тестах CCCC полноценная версия не играла, там CPU было, набрало что-то совсем мало (ну это примерно 2600 движок).

WinPooh пишет: ↑

Путём хитрых пересчётов и масштабирований фанаты Лилы уже насчитали ей 3600 и больше. Всем прочим программам следует просто сдаться без игры. А то ещё обыграют случайно, получится неловко.
Нажмите, чтобы раскрыть...

Думаю, на 4-ех V100 GPU рейтинг нынешних нейросетей Лейлы будет в районе 3375-3425. Ниже стока, примерно наравне Комодо и Гудини, чуть лучше Этериала и других движков.

svoitsl · 29 авг 2018

мошенница_сара пишет: ↑

tcec13 - лиловная должна рвать всех. не вышла из 4 дивизиона...
Нажмите, чтобы раскрыть...

Где это Вы такое прочитали...? Я что то нигде не видел, что б кто так говорил
На сссс все таки есть надежда, что выйдет в 8 -ку для второго этапа
Лила пока еще весьма экспериментальная, основное обучение ещё даже не запущено, разве что к концу сентября запустят и тогда может нормальная Лила к концу этого года будет
(если не найдут новых ошибок и текущее оборудование останется)

Neo94 · 29 авг 2018

Энивей CCCC - это идеальный вариант для Лейлы показать свое лицо, вряд ли до конца года будет еще какое-то значимое соревнование движков.

svoitsl · 29 авг 2018

Neo94 пишет: ↑

вряд ли до конца года будет
Нажмите, чтобы раскрыть...

А разве TCEC 14 не планируется?

мошенница_сара пишет: ↑

но ведь опытные глаза шахматистов видят
Нажмите, чтобы раскрыть...

Лила вполне может ещё немного прибавить после нормального обучения (и когда научат с TB играть), но все равно выбиваться в лидеры она будет только соревнования типа TCEC, а на оборудовании большинства шахматистов вряд ли превысит Fire.

WinPooh · 29 авг 2018

Prediction: In one week, leela will become #3 in the world, in two weeks, #2, in three, #1.
This is for leela ratio 1. For ratio 0.5, she will reach 3500 very soon as well.
Maybe for ratio higher than 2, leela might win already against sf9...
Нажмите, чтобы раскрыть...

https://groups.google.com/forum/m/#!topic/lczero/kEZrOemKZ9U

Neo94 · 29 авг 2018

svoitsl пишет: ↑

А разве TCEC 14 не планируется?
Нажмите, чтобы раскрыть...

Премьер-дивизион 13-го сезона начинается, судя по расписанию, аж 23 ноября. Суперфинал - 3 декабря
http://tcec.chessdom.com/archive.php

TCEC 14 будет ну явно после Нового года.

—- добавлено: 29 авг 2018 —-

мошенница_сара пишет: ↑

но ведь опытные глаза шахматистов видят, что лиловная - уже достигла своего потолка. ее уровень - арасан. не более.
Нажмите, чтобы раскрыть...

Хз, я вижу, что нынешний уровень Лейлы - это Этериал, с которым она свела на обычном железе все партии вничью. Кстати, были в TCEC и 2 бонусные игры Лейлы со стоком, и ничего, пару ничьих сделала.

Вы пытаетесь зачем-то принижать реально мощный уровень развития Лейлы. Непонятно зачем...

—- добавлено: 29 авг 2018, опубликовано: 29 авг 2018 —-

Мой предикт: к концу года Лейла обгонит Стокфиш. Может и раньше на месяц-полтора.

P.S беру рейтинги движков и регламент у TCEC. По мне так они +- оптимальные

svoitsl · 29 авг 2018

Neo94 пишет: ↑

Премьер-дивизион 13-го сезона начинается, судя по расписанию
Нажмите, чтобы раскрыть...

а при чем тут расписание?
уже половина 1-го дивизиона прошло, а по расписанию до него больше месяца

Neo94 пишет: ↑

Мой предикт: к концу года Лейла обгонит Стокфиш. Может и раньше на месяц-полтора.
Нажмите, чтобы раскрыть...

Не понятно только с чего бы это случилось, уже сейчас не видно что Lc0 существенно быстрее A0, скорее наоборот
Возможно на хорошем железе (4xV100) и выйдет уровень 9-го Стока (на 43 потоках,что наверное хуже ,чем у Гугла играл 8-й Сток (64 потока)) к концу года, нов целом сеть 20х256 больших перспектив скорее всего не имеет.
Выигрывать у актуального Стока LC0 сможет только на сильно перекошенном оборудовании.
(например GTX 1080Ti vs C2D 3Ггц ) и уж ни как не в блице

Neo94 · 30 авг 2018

Ну, с составом премьер-дивизиона уже все ясно.

Undying · 30 авг 2018

мошенница_сара пишет: ↑

поменяли регламент времени и уже этериалка опережает чесбрейн на 4 очка, хотя сыграно чуть больше половины.
Нажмите, чтобы раскрыть...

Дело не столько в регламенте сколько в соперниках. Против движков послабее Чесбрайн хорош. А против превосходящих его в классе Эзериаля и Чирона ничего сделать не может. Во втором дивизионе в первой половине турнира Эзериалю еще и удивительно не перло (всего 2 партии из 14 выиграл), но в третьем круге он набрал 6.5 из 7 и все встало на свои места.

sovaz1997 · 31 авг 2018

Бонусные игры параллельно с основным турниром!
LCZero 11250 на V100 против Stockfish Dev на 52 ядрах: http://173.248.224.124/bonusbeta/live.html

Undying · 31 авг 2018

В V100 5120 CUDA ядер, заявленная производительность 120 ТФлопс для тензорных вычислений. Я правильно понимаю, что чтобы получить полную производительность нужно параллелить вычисления на 5120 потоков? А с этим есть сложности, поэтому Лила на GTX 950 с 768 ядрами и производительностью 1.6 ТФлопс считает 1.5 кнод/с, а на номинально в 75 раз более производительной V100 только в 20 раз больше (порядка 30 кнод/с).

А в чем тогда смысл использования 4xV100? Если Лила не может полностью загрузить 5000 ядер, то 20000 ядер не сможет тем более.

Undying · 31 авг 2018

А вот гугловский 4xTPU выдает 180 ТФлопс всего лишь на 8 ядрах. Насколько понял у TPU процессоры работают не с числами, а сразу с матрицами 256x256. Судя по Альфа Зеро отношение ноды/тфлопс у TPU равно 445 (80000/180). Что почти в два раза лучше, чем у V100, для которой это отношение равно 250. Но в два раза хуже чем у GTX 950, для которой отношение равно 940 (1500/1.6).

—- добавлено: 31 авг 2018, опубликовано: 31 авг 2018 —-

Вообще возникает вопрос. Почему Лила производительность V100 использует настолько не эффективно? Для сравнения с GTX 1080 Ti, имеющей 3584 CUDA-ядра и номинальную производительность 11 ТФлопс, Лила считает 9 кнод/c. То есть 800 нод на ТФлопс. А для V100 получается 250 нод на ТФлопс. Из-за чего такая разница?

ps
По идее неправильно понимал. Основную производительность у V100 дают не CUDA-ядра, а 640 тензорных ядер. А походу с их эффективным использованием у Лилы пока проблемы. Возможно просто из-за того, что этим еще толком не занимались.

pavelgttfj8 · 31 авг 2018

У лилы в текущей партии была возможность перейти вот в такой эндшпиль. Отдать слона за 3 пешки. Это было бы эпично. Выигрывается ли это за белых?

8/8/1bp3k1/p3R3/8/4P1P1/P4PKP/3r4 b - - 0 33

sovaz1997 · 31 авг 2018

Ничья, похоже. Но движки не идеальны и, возможно, 12-фигурных эндшпильных таблицах будет выигрыш белых))

Polarity · 31 авг 2018

Не надо путать потоки CPU и GPU. Они совершенно по-разному устроены и служат разным целям.
Я полный деталей, как работает TPU, не знаю. Но известно, что он работает с числами 8-битной точности. К сравнению, 1080Ti использует 32-битную точность для представляения вещественных чисел. Повышенная точность требует больше ресурсов. Судя по-всему, для нейронных сетей высокая точность не так уж и нужна. Поэтому, только за счёт этого, TPU получает очень много преимущества.
В следующих поколениях карт от NVIDIA это учли, и V100 уже умеет работать с числами 16-битной точности, и при этом имеет так называемые Tensor Cores. Tensor Cores - это всего лишь название для операций быстрого умножения и сложения матриц размера 4x4. Дело в том, что в нейронных сетях практически все операции сводятся к умножению матриц, которые в свою очередь сводятся к умножению и сложению небольших блоков, например, размера 4x4. Соответсвенно, если научиться умножать быстро эти небольшие блоки, можно получить существенный прирост в операциях связанных с нейронными сетями.
Тут надо сказать, что 1080ti тоже формально умеет работать с 16-битными числами, но на практике это не даёт прирост. Возможно, в NVIDIA специально ограничили производительность, чтобы люди покупали на тот момент более дорогие видеокарты для нейронных сетей.
Подводя итог, у V100 имеется как минимум сразу 2 преимущества, по сравнению с 1080ti (не считая числа ядер и общей мощности): это пониженная точность и Tensor Cores. Но при этом, TPU вообще работает с 8-битными числами, и возможно имеет какие-то ещё оптимизации, о которых мне неизвестно.

Undying · 31 авг 2018

Софт безобразный у TCEC. В таблице стоит один результат, кликаешь на партию результат другой. Чему верить не понятно.

Undying · 31 авг 2018

Polarity пишет: ↑

Не надо путать потоки CPU и GPU. Они совершенно по-разному устроены и служат разным целям.
Нажмите, чтобы раскрыть...

Насколько понял на вход видеокарты подается матрица и указывается в сколько потоков ее обрабатывать. Поэтому особых проблем с полной загрузкой тысяч CUDA-ядер быть не должно

Polarity пишет: ↑

Тут надо сказать, что 1080ti тоже формально умеет работать с 16-битными числами, но на практике это не даёт прирост. Возможно, в NVIDIA специально ограничили производительность, чтобы люди покупали на тот момент более дорогие видеокарты для нейронных сетей.
Нажмите, чтобы раскрыть...

Пониженная точность достаточная для нейронных сетей позволяет использовать более простые процессоры, которые при том же энергопотреблении и числе транзисторов имеют более высокую производительность. Такие процессоры и называются тензорными. На видеокарте тензорных процессоров нет, поэтому снижение точности не дает прироста производительности. 32 битному процессору видеокарты без разницы считать 32 битные числа, 16 битные или 8 битные.

Polarity пишет: ↑

В следующих поколениях карт от NVIDIA это учли, и V100 уже умеет работать с числами 16-битной точности, и при этом имеет так называемые Tensor Cores. Tensor Cores - это всего лишь название для операций быстрого умножения и сложения матриц размера 4x4.
Нажмите, чтобы раскрыть...

V100 дает двухкратный прирост производительности для чисел однократной точности. По видимому используемые в V100 CUDA ядра умеют обрабатывать за раз два float вместо одного double. Но это все равно скромные 15 ТФлопс производительности. А сумасшедшая (120 ТФлопс) там производительность у тензорных ядер. Но похоже Лила использует их крайне неэффективно. Или даже вообще не использует. Возможно CUDA ядра V100 оптимизированы и под под работу с 8 битными числами, что дает 30 ТФлопс производительности. Поэтому мы и видим скорость в 25-30 кнод/с. А тензорные процессоры вообще Лилой не задействуются.

Polarity пишет: ↑

Подводя итог, у V100 имеется как минимум сразу 2 преимущества, по сравнению с 1080ti (не считая числа ядер и общей мощности): это пониженная точность и Tensor Cores. Но при этом, TPU вообще работает с 8-битными числами, и возможно имеет какие-то ещё оптимизации, о которых мне неизвестно.
Нажмите, чтобы раскрыть...

Отличие TPU что в нем ядер мало, но работают процессоры с матрицами 256 на 256. Возможно это преимущество, под 256 на 256 проще оптимизировать код, чем под 4 на 4.

Undying · 31 авг 2018

мошенница_сара пишет: ↑

лиловная ели-ели набирает 5,5 из 7 против слабачков.
Нажмите, чтобы раскрыть...

Нормальный результат. Против слабачков 4.5 из 5. Это перфоманс 3400+. А Ксифос явно не на свой рейтинг играет. В дивизионе 2 TCEC предыдущая версия Ксифоса подняла рейтинг до 2277 и это возможно не предел. Движок очень быстрый, даже быстрее Эзереаля ноды перебирает.

WinPooh · 31 авг 2018

sovaz1997 пишет: ↑

Бонусные игры параллельно с основным турниром!
LCZero 11250 на V100 против Stockfish Dev на 52 ядрах: http://173.248.224.124/bonusbeta/live.html
Нажмите, чтобы раскрыть...

Минус два из десятка с чем-то игр, без единой победы (вроде, один дисконнект у Стокфиша в самой последней партии на первых же ходах). Ждём объяснений, что это на самом деле блестящий результат

WinPooh · 31 авг 2018

Undying пишет: ↑

мошенница_сара пишет: ↑

лиловная ели-ели набирает 5,5 из 7 против слабачков.
Нажмите, чтобы раскрыть...

Нормальный результат. Против слабачков 4.5 из 5. Это перфоманс 3400+. А Ксифос явно не на свой рейтинг играет. В дивизионе 2 TCEC предыдущая версия Ксифоса подняла рейтинг до 2277 и это возможно не предел. Движок очень быстрый, даже быстрее Эзереаля ноды перебирает.
Нажмите, чтобы раскрыть...

"Здесь играем, здесь не играем, здесь рыбу заворачивали..."

Undying · 31 авг 2018

WinPooh пишет: ↑

Минус два из десятка с чем-то игр, без единой победы (вроде, один дисконнект у Стокфиша в самой последней партии на первых же ходах). Ждём объяснений, что это на самом деле блестящий результат
Нажмите, чтобы раскрыть...

Там непонятно, что вообще в сводной таблице показывается. Например, ткните в 4 партию. По тексту партии победа Лилы в 26 ходов. А по таблице ничья в 51 ход. В TCEC программистами походу эпические криворуки работают.

Neo94 · 31 авг 2018

Undying пишет: ↑

Там непонятно, что вообще в сводной таблице показывается. Например, ткните в 4 партию. По тексту партии победа Лилы в 26 ходов. А по таблице ничья в 51 ход. В TCEC программистами походу эпические криворуки работают.
Нажмите, чтобы раскрыть...

Наверное, всем этим занимаются студенты на коленке, и может даже не за еду.

Undying · 31 авг 2018

WinPooh пишет: ↑

"Здесь играем, здесь не играем, здесь рыбу заворачивали..."
Нажмите, чтобы раскрыть...

А вы чего от Лилы ждали? В дивизионе 4 TCEC Лила играла на 3200. У новой версии разработчики заявляли прирост силы +150 пунктов. Плюс в CCCC Лила играет на двухкратно более производительном железе, что еще +50 пунктов должно дать. Т.е. где-то сила 3400 должна быть. Примерно столько и показывает по результатам.

Undying · 31 авг 2018

KEV81 пишет: ↑

Прямо секта свидетелей Лилы, какая-то ))
Нажмите, чтобы раскрыть...

Если вам принципиально новые вещи не интересны, то это ваши личные проблемы. А мне получить представление о возможностях нейронных сетей интересно. Все-таки новая технология, заметно расширяющая возможности человечества в сравнении с классическим алгоритмически переборным подходом.

Neo94 · 31 авг 2018

Двачую, нейросети - это совершенно шикарная вещь, которая сейчас работает не теоретически, а во всю мощь, и показывает реальные, хорошие результаты.

И хоть я с нейросетями разминулся по работе (бэкенд веб), но просто интересно за этим даже наблюдать.

Undying · 31 авг 2018

KEV81 пишет: ↑

Прямо секта свидетелей Лилы, какая-то ))
Нажмите, чтобы раскрыть...

А разработчики Лилы просто вызывают уважение. Одно дело Альфа Зеро сделанная Гуглом с его безграничными денежными и техническими возможностями. И другое дело энтузиасты, которые на коленке за считанные месяцы сделали конкурентоспособный продукт. Это очень круто.

Undying · 31 авг 2018

KEV81 пишет: ↑

Ну вообще-то перебор никто не отменял, просто изменились правила перебора.
Нажмите, чтобы раскрыть...

Да, кроме классического алгоритмически переборного подхода теперь появился еще и новый нейронно переборный.

KEV81 пишет: ↑

А комментарий про то, как некоторые фанатично возвеличивают Лилу, несмотря на реальность.
Нажмите, чтобы раскрыть...

Такого особо нет. Больше хейтеры Лилы сначала приписывают ей какую-то мифическую силу, а когда она ее не показывает, то начинают глумится.

—- добавлено: 31 авг 2018 —-

KEV81 пишет: ↑

Undying пишет: ↑

И другое дело энтузиасты, которые на коленке за считанные месяцы сделали конкурентоспособный продукт. Это очень круто.
Нажмите, чтобы раскрыть...

Энтузиасты Стокфиша как бы тут мимо?
Нажмите, чтобы раскрыть...

Году в 2008 может и энтузиасты Стокфиша были круты. Но в алгоритмическо переборных движках давно уж никаких революций нет.

Neo94 · 31 авг 2018

KEV81 пишет: ↑

Может?

Ну пожалуйста, скажите что может....
Нажмите, чтобы раскрыть...

Такие древние времена уже и не помнють)

Undying · 31 авг 2018

WinPooh пишет: ↑

Минус два из десятка с чем-то игр, без единой победы (вроде, один дисконнект у Стокфиша в самой последней партии на первых же ходах). Ждём объяснений, что это на самом деле блестящий результат
Нажмите, чтобы раскрыть...

Если смотреть по партиям, а не по таблице, то у Лилы +1 против Стокфиша в 14 партиях. В 4 туре победа, остальные ничьи. А что показывается в таблице непонятно, то ли они еще какие-то партии играли, то ли вообще не то показывается.

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

Mustitz Заслуженный

Rom Старожил

Mustitz Заслуженный

Rom Старожил

Neo94 Учаcтник

WinPooh В.М.

Neo94 Учаcтник

svoitsl Учаcтник

Neo94 Учаcтник

svoitsl Учаcтник

WinPooh В.М.

Neo94 Учаcтник

svoitsl Учаcтник

Neo94 Учаcтник

Undying Учаcтник

sovaz1997 Учаcтник

Undying Учаcтник

Undying Учаcтник

pavelgttfj8 Учаcтник

sovaz1997 Учаcтник

Polarity Новичок

Undying Учаcтник

Undying Учаcтник

Undying Учаcтник

WinPooh В.М.

WinPooh В.М.

Undying Учаcтник

Neo94 Учаcтник

Undying Учаcтник

Undying Учаcтник

Neo94 Учаcтник

Undying Учаcтник

Undying Учаcтник

Neo94 Учаcтник

Undying Учаcтник

Поделиться этой страницей