AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    127
    Симпатии:
    108
    Репутация:
    1
    Оффлайн
    Как заметили на параллельном форуме, в Дип Майнд работают очень умные люди. Как технические специалисты, так и люди, отвечающие за подачу информации.
    И я тоже считаю, что если каких-то данных НЕТ, то их там нет по вполне конкретным причинам. Чтобы люди масштабировали "crushing" результаты против старой версии на противостояние с новой.
    На 100% уверен, что они тестили против нового стока, и там была совсем не благостная для них картина.

    Что Дип Майнд делают хорошее дело - безусловно. Они просто на словах заявляют про самый сильный движок, на деле же противник максимально ограничен, и находится в заведомо неравном положении. И то при этом иногда кусается.
  2. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    601
    Симпатии:
    98
    Репутация:
    1
    Оффлайн
    Я считаю, что необходимо разделить писрщиков и разработчиков. Каждый из них выполняет свою работу хорошо. Но пиарщики по тем или иным причинам нам могут не нравится.

    Я вот до сих пор не понял, против какой версии играл AZ в каждом матче. Если статья научная, то это очень важно конкретно указывать.
  3. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.944
    Симпатии:
    2.120
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    Они этого не заявляют. Как верно замечено, подачей информации в ДипМайнд занимаются профессионально подготовленные люди, и таких ляпов они не допускают. То, что в опубликованные результаты вчитывают фанаты и/или хейтеры - это "их ожидания, их проблемы", как говорил один футболист.
  4. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    549
    Симпатии:
    202
    Репутация:
    21
    Оффлайн
    Если я правильно понял (см. таблицы в самом конце полной статьи и примечания), матч с дебютной книгой играл Сток 8, а Сток Dev от 13 января играл без книги . В остальных случаях всегда играл Сток 8.
  5. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    601
    Симпатии:
    98
    Репутация:
    1
    Оффлайн
    Нашел конкретное описание матчей: https://deepmind.com/documents/260/alphazero_preprint.pdf

    [​IMG]

    Только один матч был против SF Dev.

    Также, похоже, что все выложенное - это против Stockfish 8. Ну вряд ли они будут специально менать имя движка с Stockfish 130118 на Stockfish 8))
    —- добавлено: 7 дек 2018 —-
    Main, как я понимаю, основной матч из 1000 игр был против SF 8.
    Соответственно, матч с усеченным контролем - тоже (что видно).
    Матч в TCEC Openings, где не было показано выдающегося результата, был также против SF 8.
    110 выложенных здесь игр из начальной позиции, скорее всего, против SF 8, как мне кажется.
  6. By_Chess Учаcтник

    • Участник
    Рег.:
    05.09.2017
    Сообщения:
    158
    Симпатии:
    78
    Репутация:
    3
    Оффлайн
    Результат +155 -6 =839.
    Я бы не назвал это разгромом. Скорее небольшое преимущество АльфаЗеро.
    Особенно учитывая то, что Стокфиш не обучаящаяся программа и ее можно 155 раз обыграть одним способом. :)
  7. Yury_Solomatin Учаcтник

    • Участник
    Рег.:
    25.01.2017
    Сообщения:
    637
    Симпатии:
    374
    Репутация:
    20
    Оффлайн
    Последние данные очков репутации:
    Michael-13: 1 7 дек 2018
    Rom, Launder, Undying и 2 другим нравится это.
  8. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    157
    Симпатии:
    28
    Репутация:
    1
    Оффлайн
    Есть ещё журнальчик
    Последние данные очков репутации:
    Yury_Solomatin: 1 (Имелось в виду, подробности по-русски.) 8 дек 2018
    FlashNeo и Michael-13 нравится это.
  9. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    601
    Симпатии:
    98
    Репутация:
    1
    Оффлайн
    Michael-13 нравится это.
  10. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    889
    Симпатии:
    396
    Репутация:
    10
    Оффлайн
    Игрался матч из 1000 партий с контролем по 3 часа + 15 секунд добавления каждому. Этот матч длился почти год. Взяли при этом последнюю версию Стокфиша на начало матча. Какие претензии к разработчикам Альфа Зеро?

    Стокфиш 10 Альфа Зеро также обыграет. С чуть меньшим преимуществом. Да Стокфиш 10 сильнее Стокфиш 8 чуть ли не на 100 пунктов. Но опыт Лилы наглядно показывает, что пункты рейтинга набранные в играх с алгоритмическими движками против нейронного движка стоят недорого. Например, в последнем финале сссс Стокфиш против Лилы набрал 55% очков (40 пунктов разницы), против Комодо 58.5% (+60 пунктов ), против Гудини 64% (+100 пунктов). А Лила в свою очередь уступила и Комодо (47% и -20 пунктов) и Гудини (48% и -15 пунктов). И при этом Лила имеет лишь минимальное преимущество в очных встречах над Этзереалем и Файром. Хотя они на 200 пунктов слабее Стокфиша.

    Это подтверждают матчи со Стокфишем 8, в которых Альфа Зеро давала фору по времени. Имея в 10 раз меньше времени Альфа Зеро выиграла матч с меньшим преимуществом. И только когда имела в 30 раз меньше времени матч проиграла. Как известно для алгоритмических движков двухкратное увеличение производительности дает почти 50 пунктов рейтинга. То есть увеличение производительности в 10 раз должно давать до 150 пунктов разницы. А в реальности без форы Альфа Зеро набрала 57% очков (+50 пунктов разницы), а давая десятикратную фору по времени 53% очков (+20 пунктов).
  11. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.944
    Симпатии:
    2.120
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    Ну, или он длился несколько часов на кластере из 1000 машин, что более вероятно.
  12. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    157
    Симпатии:
    28
    Репутация:
    1
    Оффлайн
    К тому же, если судить по картинке выше, не все игры были с контролем 3h+15"
  13. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    601
    Симпатии:
    98
    Репутация:
    1
    Оффлайн
    Undying, преемущество перед SF 8 с дебютнами книгами TCEC было, тем не менее, минимальным. В общем, Leela уже сейчас может быть не хуже, чем AZ.
  14. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    889
    Симпатии:
    396
    Репутация:
    10
    Оффлайн
    Согласен, что игралось не на одной машине. Но вряд ли на кластере. Тогда бы не было возможности указать точные характеристики железа. А учитывая, что было сыграно порядка 10 тысяч партий с 3 часовым контролем, длилось все это явно долго. Судя по тому, что опубликовали результаты сейчас, почти год это всё заняло.
    —- добавлено: 7 дек 2018 —-
    В статье на chess.com, которую выложили выше, речь не о жеребьевке дебютов TCEC, а о сильной дебютной книге, которой пользовался Стокфиш.
  15. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.155
    Симпатии:
    1.580
    Репутация:
    90
    Адрес:
    Заир
    Оффлайн
    Ага, так и представляю себе схожую ситуацию. Какой-нибудь наш местный Остап Бендер заявляет, что выиграл у себя дома матч у Стокфиша. И даже пару партий приведёт. А когда его призовут к ответу, "повтори это на публике!" или "что же ты застрял на ФИДЕшной отметке 2000?", то ответ будет "хейтеры, добейтесь чего-нибудь сами", "ваши ожидания - ваши проблемы". И ещё парочка "побед" над вяленым, снова в домашних условиях.
  16. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.944
    Симпатии:
    2.120
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    Тут есть принципиальная разница, и вот какая. В данном случае Остап Бендер говорит - вот, я тут на десяток страничек набросал свой план тренировок и методику занятий, пользуйтесь. Добейтесь, именно что, сами. И произвольный Вася Пупкин, начав по этой методике заниматься, в течение года с нуля поднимается до топ-3 в мире. Что как бы подтверждает, что Остап в этом деле свою собаку таки съел. Но самому турецкоподданому сеансы давать некогда, его новые стулья ждут...
    Launder, sovaz1997, svoitsl и ещё 1-му нравится это.
  17. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    127
    Симпатии:
    108
    Репутация:
    1
    Оффлайн
    ИМХО лучшая партия матча
    22 хода, из них 8 табличных

    sovaz1997 нравится это.
  18. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    127
    Симпатии:
    108
    Репутация:
    1
    Оффлайн
    Нейроны простудились
  19. Launder Новичок

    • Новичок
    Рег.:
    25.11.2016
    Сообщения:
    87
    Симпатии:
    22
    Репутация:
    1
    Оффлайн
    думаю, что это-таки - сферический конь в вакууме :) думаю, что для алгоритмических движков, как Вы их называете, "глубина проникновения в позицию" очень не линейная функция, и в какой-то момент увеличение времени, почти ничего не даёт... Полагаю, что у нейронки подобное насыщение происходит заметно позже и график может иметь несколько иную форму...
  20. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    12.822
    Симпатии:
    13.476
    Репутация:
    902
    Нарушения:
    22
    Оффлайн
    Отомстил за те французские, которые смухлевали в прошлом матче

    З.Ы. кстати, Стокфиш 10 на том шулерском контроле 9/10 идёт в сицилианку
  21. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    12.822
    Симпатии:
    13.476
    Репутация:
    902
    Нарушения:
    22
    Оффлайн
    Ничего не надо думать и полагать, партий таких тестов уже миллионы за эти годы
  22. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    127
    Симпатии:
    108
    Репутация:
    1
    Оффлайн
    На реддите публика в едином порыве восторгается "великой победе" бога шахмат.
    На чесскоме народ продвинутей, и минимум на 3/4 скептично настроена к результату А0
    На толкчессе вообще мягко намекнули, что это такой себе прорыв.

    Ну а в целом без нейтрального наблюдателя (CCCC, TCEC etc) все эти результаты А0 против непонятных стокфишей с непонятными конфигурациями ничего не стоят.
  23. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    889
    Симпатии:
    396
    Репутация:
    10
    Оффлайн
    Для тех кому кажется, что 57% очков Альфа Зеро против Стокфиша 8 это немного. Для сравнения Лила примерно также играет против Эзереаля и Файра. В последнем полуфинале сссс против них было +9-2=31 (59%).
  24. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    127
    Симпатии:
    108
    Репутация:
    1
    Оффлайн
    Помнится, в матчах навылет в одном из последних кубков (TCEC Cup вроде) Лейла доигралась до 3,5-3,5 против Файра (и при этом одну партию выиграла за счет краша противника). Да и против Этериала у нее были проблемы, хотя в целом Файр она обыгрывает уверенней.
    А вообще Этериал по виду последних турниров - почти злой гений Лейлы, де-факто и слабее Файра, а обыгрывает Лейлу регулярно и по делу.
  25. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    601
    Симпатии:
    98
    Репутация:
    1
    Оффлайн
    Undying, с дебютной книгой или без? С дебютной книгой TCEC лишь 54% против SF 8 получилось
  26. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    889
    Симпатии:
    396
    Репутация:
    10
    Оффлайн
    Из опыта Лилы известно, что в плохих позициях без контригры нейронка защищается хуже, чем алгоритмические движки. Сама Лила в такие позиции не идет, но если ее туда загнать дебютной книгой, то обычно она загибается очень быстро. Естественно и у Альфа Зеро все тоже самое. Показателен в этом плане турнир, в котором движки играли позицию из последней партии матча Карлсен - Каруана. В нем Лила проиграла практически все партии белыми.

    Преимущество нейронки проявляется в сложных стратегических позициях. А проблема, что сейчас нейронка этого не понимает и такие позиции получаются случайно. Надо дообучить нейронку на играх с алгоритмическими движками и тогда нейронный движок начнет выигрывать матчи с куда более впечатляющим преимуществом.
    Launder нравится это.
  27. wentille Учаcтник

    • Участник
    Рег.:
    31.08.2017
    Сообщения:
    556
    Симпатии:
    1.018
    Репутация:
    43
    Оффлайн
  28. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    12.822
    Симпатии:
    13.476
    Репутация:
    902
    Нарушения:
    22
    Оффлайн
    вот это новость!
    pavelgttfj8 нравится это.
  29. wentille Учаcтник

    • Участник
    Рег.:
    31.08.2017
    Сообщения:
    556
    Симпатии:
    1.018
    Репутация:
    43
    Оффлайн
  30. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    12.822
    Симпатии:
    13.476
    Репутация:
    902
    Нарушения:
    22
    Оффлайн
  31. wentille Учаcтник

    • Участник
    Рег.:
    31.08.2017
    Сообщения:
    556
    Симпатии:
    1.018
    Репутация:
    43
    Оффлайн
  32. Crest Админ, МГ

    • Команда форума
    Рег.:
    04.02.2006
    Сообщения:
    50.124
    Симпатии:
    10.732
    Репутация:
    449
    Адрес:
    Москва, Россия
    Оффлайн
    Да, впечатляющий разгром.
    Альфазеро был разгромлен в стиле Альфазеро.
    sovaz1997 нравится это.
  33. Launder Новичок

    • Новичок
    Рег.:
    25.11.2016
    Сообщения:
    87
    Симпатии:
    22
    Репутация:
    1
    Оффлайн
    Скептицизм неуместен. Что Вы ожидали, реально Бога шахмат? :) Нейросети реально огромный скачок вперёд, прежде всего, с точки зрения, понимания машиной нюансов позиции. С такими помощниками, возможно шахматы станут более интересным, вновь станут популярен "человеческий стиль" со сложными задумками и длительной реализацией...
    wentille и svoitsl нравится это.
  34. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    127
    Симпатии:
    108
    Репутация:
    1
    Оффлайн
    Нейросети - это круто, но применительно к шахматам у них есть ощутимый минус: в позициях, где важен именно конкретный счет, где все решает буквально полтемпа, они ощутимо хуже переборных движков.
    Пока таких закономерностей выявлено две:
    1) в худших, острых позициях - как этот жуткий разгром А0 в 22 хода в атаке Алехина-Шатара. Нейросеть банально перебирает меньше вариантов, и лучшее понимание ей не может помочь. Там, где стокфиш найдет единственные ходы, нейросеть допустит микронеточность там, тут и еще тут - ну и это выльется в поражение.
    2) эндшпили, близкие к переборным. Это очень хорошо видно по играм Лейлы - она банально не успевает адекватно использовать таблицы Syzygy, потому что перебирает всего лишь десятки тысяч позиций. Классические движки перебирают миллионы, и часто обращаются к таблицам. И получается так, что позиция может быть математически выиграна, но нейросеть банально не успевает просчитать варианты с переходом в младшие выигранные эндшпили. Это стоило Лейле уже многих и многих половинок, счет таких в турнирах (а их уже немало наиграно) идет на десятки.
    Alhimik88 и Launder нравится это.
  35. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    601
    Симпатии:
    98
    Репутация:
    1
    Оффлайн
    Последний Stockfish против последних сетей Lc0 (сеть не самая лучшая): https://tcecbonus.club/

Поделиться этой страницей