AlphaZero. Нейронная сеть играет в шахматы

FlashNeo · 7 дек 2018

WinPooh пишет: ↑

Да неважно, какие там цифры. Ценность работы ДипМайнд не в этом, они не в написании движков для TCEC соревнуются.
Если бы не прошлогодний "пшик", например - где была бы нынешняя хайповая Лила, содравшая алгоритмы AZ чуть менее, чем полностью? Да не было бы её, от слова вообще.
Нажмите, чтобы раскрыть...

Как заметили на параллельном форуме, в Дип Майнд работают очень умные люди. Как технические специалисты, так и люди, отвечающие за подачу информации.
И я тоже считаю, что если каких-то данных НЕТ, то их там нет по вполне конкретным причинам. Чтобы люди масштабировали "crushing" результаты против старой версии на противостояние с новой.
На 100% уверен, что они тестили против нового стока, и там была совсем не благостная для них картина.

Что Дип Майнд делают хорошее дело - безусловно. Они просто на словах заявляют про самый сильный движок, на деле же противник максимально ограничен, и находится в заведомо неравном положении. И то при этом иногда кусается.

sovaz1997 · 7 дек 2018

Я считаю, что необходимо разделить писрщиков и разработчиков. Каждый из них выполняет свою работу хорошо. Но пиарщики по тем или иным причинам нам могут не нравится.

Я вот до сих пор не понял, против какой версии играл AZ в каждом матче. Если статья научная, то это очень важно конкретно указывать.

WinPooh · 7 дек 2018

FlashNeo пишет: ↑

Что Дип Майнд делают хорошее дело - безусловно. Они просто на словах заявляют про самый сильный движок, на деле же противник максимально ограничен, и находится в заведомо неравном положении. И то при этом иногда кусается.
Нажмите, чтобы раскрыть...

Они этого не заявляют. Как верно замечено, подачей информации в ДипМайнд занимаются профессионально подготовленные люди, и таких ляпов они не допускают. То, что в опубликованные результаты вчитывают фанаты и/или хейтеры - это "их ожидания, их проблемы", как говорил один футболист.

Rom · 7 дек 2018

sovaz1997 пишет: ↑

Я вот до сих пор не понял, против какой версии играл AZ в каждом матче. Если статья научная, то это очень важно конкретно указывать.
Нажмите, чтобы раскрыть...

Если я правильно понял (см. таблицы в самом конце полной статьи и примечания), матч с дебютной книгой играл Сток 8, а Сток Dev от 13 января играл без книги . В остальных случаях всегда играл Сток 8.

sovaz1997 · 7 дек 2018

Нашел конкретное описание матчей: https://deepmind.com/documents/260/alphazero_preprint.pdf

Только один матч был против SF Dev.

Также, похоже, что все выложенное - это против Stockfish 8. Ну вряд ли они будут специально менать имя движка с Stockfish 130118 на Stockfish 8))

—- добавлено: 7 дек 2018 —-

Main, как я понимаю, основной матч из 1000 игр был против SF 8.
Соответственно, матч с усеченным контролем - тоже (что видно).
Матч в TCEC Openings, где не было показано выдающегося результата, был также против SF 8.
110 выложенных здесь игр из начальной позиции, скорее всего, против SF 8, как мне кажется.

By_Chess · 7 дек 2018

Результат +155 -6 =839.
Я бы не назвал это разгромом. Скорее небольшое преимущество АльфаЗеро.
Особенно учитывая то, что Стокфиш не обучаящаяся программа и ее можно 155 раз обыграть одним способом.

Yury_Solomatin · 7 дек 2018

Все подробности только на Chess.com:

Новая версия AlphaZero разгромила Stockfish в матче из 1,000 партий

svoitsl · 7 дек 2018

Yury_Solomatin пишет: ↑

Все подробности только на Chess.com:
Нажмите, чтобы раскрыть...

Есть ещё журнальчик

sovaz1997 · 7 дек 2018

Вот ещё 32 страницы: https://deepmind.com/documents/260/alphazero_preprint.pdf

Undying · 7 дек 2018

sovaz1997 пишет: ↑

В Январе уже были явные намеки на скорый выход SF 9 и я не знаю, почему они не хотели использовать Dev-версию. Скорее всего, результат бы просто не вышел за пределы погрешности за разумное время))
Нажмите, чтобы раскрыть...

Игрался матч из 1000 партий с контролем по 3 часа + 15 секунд добавления каждому. Этот матч длился почти год. Взяли при этом последнюю версию Стокфиша на начало матча. Какие претензии к разработчикам Альфа Зеро?

Стокфиш 10 Альфа Зеро также обыграет. С чуть меньшим преимуществом. Да Стокфиш 10 сильнее Стокфиш 8 чуть ли не на 100 пунктов. Но опыт Лилы наглядно показывает, что пункты рейтинга набранные в играх с алгоритмическими движками против нейронного движка стоят недорого. Например, в последнем финале сссс Стокфиш против Лилы набрал 55% очков (40 пунктов разницы), против Комодо 58.5% (+60 пунктов ), против Гудини 64% (+100 пунктов). А Лила в свою очередь уступила и Комодо (47% и -20 пунктов) и Гудини (48% и -15 пунктов). И при этом Лила имеет лишь минимальное преимущество в очных встречах над Этзереалем и Файром. Хотя они на 200 пунктов слабее Стокфиша.

Это подтверждают матчи со Стокфишем 8, в которых Альфа Зеро давала фору по времени. Имея в 10 раз меньше времени Альфа Зеро выиграла матч с меньшим преимуществом. И только когда имела в 30 раз меньше времени матч проиграла. Как известно для алгоритмических движков двухкратное увеличение производительности дает почти 50 пунктов рейтинга. То есть увеличение производительности в 10 раз должно давать до 150 пунктов разницы. А в реальности без форы Альфа Зеро набрала 57% очков (+50 пунктов разницы), а давая десятикратную фору по времени 53% очков (+20 пунктов).

WinPooh · 7 дек 2018

Undying пишет: ↑

Игрался матч из 1000 партий с контролем по 3 часа + 15 секунд добавления каждому. Этот матч длился почти год.
Нажмите, чтобы раскрыть...

Ну, или он длился несколько часов на кластере из 1000 машин, что более вероятно.

svoitsl · 7 дек 2018

WinPooh пишет: ↑

на кластере из 1000 машин, что более вероятно.
Нажмите, чтобы раскрыть...

К тому же, если судить по картинке выше, не все игры были с контролем 3h+15"

sovaz1997 · 7 дек 2018

Undying, преемущество перед SF 8 с дебютнами книгами TCEC было, тем не менее, минимальным. В общем, Leela уже сейчас может быть не хуже, чем AZ.

Undying · 7 дек 2018

WinPooh пишет: ↑

Ну, или он длился несколько часов на кластере из 1000 машин, что более вероятно.
Нажмите, чтобы раскрыть...

Согласен, что игралось не на одной машине. Но вряд ли на кластере. Тогда бы не было возможности указать точные характеристики железа. А учитывая, что было сыграно порядка 10 тысяч партий с 3 часовым контролем, длилось все это явно долго. Судя по тому, что опубликовали результаты сейчас, почти год это всё заняло.

—- добавлено: 7 дек 2018 —-

sovaz1997 пишет: ↑

Undying, преемущество перед SF 8 с дебютнами книгами TCEC было, тем не менее, минимальным. В общем, Leela уже сейчас может быть не хуже, чем AZ.
Нажмите, чтобы раскрыть...

В статье на chess.com, которую выложили выше, речь не о жеребьевке дебютов TCEC, а о сильной дебютной книге, которой пользовался Стокфиш.

Мобуту · 7 дек 2018

WinPooh пишет: ↑

Они этого не заявляют. Как верно замечено, подачей информации в ДипМайнд занимаются профессионально подготовленные люди, и таких ляпов они не допускают. То, что в опубликованные результаты вчитывают фанаты и/или хейтеры - это "их ожидания, их проблемы", как говорил один футболист.
Нажмите, чтобы раскрыть...

Ага, так и представляю себе схожую ситуацию. Какой-нибудь наш местный Остап Бендер заявляет, что выиграл у себя дома матч у Стокфиша. И даже пару партий приведёт. А когда его призовут к ответу, "повтори это на публике!" или "что же ты застрял на ФИДЕшной отметке 2000?", то ответ будет "хейтеры, добейтесь чего-нибудь сами", "ваши ожидания - ваши проблемы". И ещё парочка "побед" над вяленым, снова в домашних условиях.

WinPooh · 8 дек 2018

Тут есть принципиальная разница, и вот какая. В данном случае Остап Бендер говорит - вот, я тут на десяток страничек набросал свой план тренировок и методику занятий, пользуйтесь. Добейтесь, именно что, сами. И произвольный Вася Пупкин, начав по этой методике заниматься, в течение года с нуля поднимается до топ-3 в мире. Что как бы подтверждает, что Остап в этом деле свою собаку таки съел. Но самому турецкоподданому сеансы давать некогда, его новые стулья ждут...

FlashNeo · 8 дек 2018

ИМХО лучшая партия матча
22 хода, из них 8 табличных

FlashNeo · 8 дек 2018

KEV81 пишет: ↑

Ну это не считается, у АЗ просто болела голова))
Нажмите, чтобы раскрыть...

Нейроны простудились

Launder · 8 дек 2018

Undying пишет: ↑

Как известно для алгоритмических движков двухкратное увеличение производительности дает почти 50 пунктов рейтинга.
Нажмите, чтобы раскрыть...

думаю, что это-таки - сферический конь в вакууме думаю, что для алгоритмических движков, как Вы их называете, "глубина проникновения в позицию" очень не линейная функция, и в какой-то момент увеличение времени, почти ничего не даёт... Полагаю, что у нейронки подобное насыщение происходит заметно позже и график может иметь несколько иную форму...

Комсюк · 8 дек 2018

Отомстил за те французские, которые смухлевали в прошлом матче

З.Ы. кстати, Стокфиш 10 на том шулерском контроле 9/10 идёт в сицилианку

Комсюк · 8 дек 2018

Launder пишет: ↑

Undying пишет: ↑

Как известно для алгоритмических движков двухкратное увеличение производительности дает почти 50 пунктов рейтинга.
Нажмите, чтобы раскрыть...

думаю, что для алгоритмических движков, как Вы их называете, "глубина проникновения в позицию" очень не линейная функция, и в какой-то момент увеличение времени, почти ничего не даёт... Полагаю, что у нейронки подобное насыщение происходит заметно позже и график может иметь несколько иную форму...
Нажмите, чтобы раскрыть...

Ничего не надо думать и полагать, партий таких тестов уже миллионы за эти годы

FlashNeo · 8 дек 2018

На реддите публика в едином порыве восторгается "великой победе" бога шахмат.
На чесскоме народ продвинутей, и минимум на 3/4 скептично настроена к результату А0
На толкчессе вообще мягко намекнули, что это такой себе прорыв.

Ну а в целом без нейтрального наблюдателя (CCCC, TCEC etc) все эти результаты А0 против непонятных стокфишей с непонятными конфигурациями ничего не стоят.

Undying · 8 дек 2018

FlashNeo пишет: ↑

На реддите публика в едином порыве восторгается "великой победе" бога шахмат.
На чесскоме народ продвинутей, и минимум на 3/4 скептично настроена к результату А0
На толкчессе вообще мягко намекнули, что это такой себе прорыв.
Нажмите, чтобы раскрыть...

Для тех кому кажется, что 57% очков Альфа Зеро против Стокфиша 8 это немного. Для сравнения Лила примерно также играет против Эзереаля и Файра. В последнем полуфинале сссс против них было +9-2=31 (59%).

FlashNeo · 8 дек 2018

Undying пишет: ↑

Для тех кому кажется, что 57% очков Альфа Зеро против Стокфиша 8 это немного. Для сравнения Лила примерно также играет против Эзереаля и Файра. В последнем полуфинале сссс против них было +9-2=31
Нажмите, чтобы раскрыть...

Помнится, в матчах навылет в одном из последних кубков (TCEC Cup вроде) Лейла доигралась до 3,5-3,5 против Файра (и при этом одну партию выиграла за счет краша противника). Да и против Этериала у нее были проблемы, хотя в целом Файр она обыгрывает уверенней.
А вообще Этериал по виду последних турниров - почти злой гений Лейлы, де-факто и слабее Файра, а обыгрывает Лейлу регулярно и по делу.

sovaz1997 · 8 дек 2018

Undying, с дебютной книгой или без? С дебютной книгой TCEC лишь 54% против SF 8 получилось

Undying · 8 дек 2018

FlashNeo пишет: ↑

ИМХО лучшая партия матча
22 хода, из них 8 табличных
Нажмите, чтобы раскрыть...

Из опыта Лилы известно, что в плохих позициях без контригры нейронка защищается хуже, чем алгоритмические движки. Сама Лила в такие позиции не идет, но если ее туда загнать дебютной книгой, то обычно она загибается очень быстро. Естественно и у Альфа Зеро все тоже самое. Показателен в этом плане турнир, в котором движки играли позицию из последней партии матча Карлсен - Каруана. В нем Лила проиграла практически все партии белыми.

Преимущество нейронки проявляется в сложных стратегических позициях. А проблема, что сейчас нейронка этого не понимает и такие позиции получаются случайно. Надо дообучить нейронку на играх с алгоритмическими движками и тогда нейронный движок начнет выигрывать матчи с куда более впечатляющим преимуществом.

wentille · 8 дек 2018

Альфа-Зеро и Стокфиш сыграли матч из 1000 партий
https://deepmind.com/research/alphago/alphazero-resources/

Комсюк · 8 дек 2018

вот это новость!

wentille · 8 дек 2018

Вот статья на ческоме:
https://www.chess.com/news/view/updated-alphazero-crushes-stockfish-in-new-1-000-game-match

Комсюк · 8 дек 2018

wentille, четверг http://kasparovchess.crestbook.com/threads/7644/page-75#post-846930

wentille · 8 дек 2018

Комсюк пишет: ↑

wentille, четверг http://kasparovchess.crestbook.com/threads/7644/page-75#post-846930
Нажмите, чтобы раскрыть...

Ага

Crest · 8 дек 2018

FlashNeo пишет: ↑

ИМХО лучшая партия матча

Нажмите, чтобы раскрыть...

Да, впечатляющий разгром.
Альфазеро был разгромлен в стиле Альфазеро.

Launder · 8 дек 2018

FlashNeo пишет: ↑

На чесскоме народ продвинутей, и минимум на 3/4 скептично настроена к результату А0
Нажмите, чтобы раскрыть...

Скептицизм неуместен. Что Вы ожидали, реально Бога шахмат? Нейросети реально огромный скачок вперёд, прежде всего, с точки зрения, понимания машиной нюансов позиции. С такими помощниками, возможно шахматы станут более интересным, вновь станут популярен "человеческий стиль" со сложными задумками и длительной реализацией...

FlashNeo · 8 дек 2018

Launder пишет: ↑

Скептицизм неуместен. Что Вы ожидали, реально Бога шахмат? Нейросети реально огромный скачок вперёд, прежде всего, с точки зрения, понимания машиной нюансов позиции. С такими помощниками, возможно шахматы станут более интересным, вновь станут популярен "человеческий стиль" со сложными задумками и длительной реализацией...
Нажмите, чтобы раскрыть...

Нейросети - это круто, но применительно к шахматам у них есть ощутимый минус: в позициях, где важен именно конкретный счет, где все решает буквально полтемпа, они ощутимо хуже переборных движков.
Пока таких закономерностей выявлено две:
1) в худших, острых позициях - как этот жуткий разгром А0 в 22 хода в атаке Алехина-Шатара. Нейросеть банально перебирает меньше вариантов, и лучшее понимание ей не может помочь. Там, где стокфиш найдет единственные ходы, нейросеть допустит микронеточность там, тут и еще тут - ну и это выльется в поражение.
2) эндшпили, близкие к переборным. Это очень хорошо видно по играм Лейлы - она банально не успевает адекватно использовать таблицы Syzygy, потому что перебирает всего лишь десятки тысяч позиций. Классические движки перебирают миллионы, и часто обращаются к таблицам. И получается так, что позиция может быть математически выиграна, но нейросеть банально не успевает просчитать варианты с переходом в младшие выигранные эндшпили. Это стоило Лейле уже многих и многих половинок, счет таких в турнирах (а их уже немало наиграно) идет на десятки.

sovaz1997 · 8 дек 2018

Последний Stockfish против последних сетей Lc0 (сеть не самая лучшая): https://tcecbonus.club/

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

FlashNeo Учаcтник

sovaz1997 Учаcтник

WinPooh В.М. Команда форума

Rom Старожил

sovaz1997 Учаcтник

By_Chess Учаcтник

Yury_Solomatin Учаcтник

svoitsl Учаcтник

sovaz1997 Учаcтник

Undying Учаcтник

WinPooh В.М. Команда форума

svoitsl Учаcтник

sovaz1997 Учаcтник

Undying Учаcтник

Мобуту спаситель нации баннер

WinPooh В.М. Команда форума

FlashNeo Учаcтник

FlashNeo Учаcтник

Launder Новичок

Комсюк народный модератор баннер

Комсюк народный модератор баннер

FlashNeo Учаcтник

Undying Учаcтник

FlashNeo Учаcтник

sovaz1997 Учаcтник

Undying Учаcтник

wentille Заблокирован

Комсюк народный модератор баннер

wentille Заблокирован

Комсюк народный модератор баннер

wentille Заблокирован

Crest Админ, МГ Команда форума Команда форума

Launder Новичок

FlashNeo Учаcтник

sovaz1997 Учаcтник