AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    Как заметили на параллельном форуме, в Дип Майнд работают очень умные люди. Как технические специалисты, так и люди, отвечающие за подачу информации.
    И я тоже считаю, что если каких-то данных НЕТ, то их там нет по вполне конкретным причинам. Чтобы люди масштабировали "crushing" результаты против старой версии на противостояние с новой.
    На 100% уверен, что они тестили против нового стока, и там была совсем не благостная для них картина.

    Что Дип Майнд делают хорошее дело - безусловно. Они просто на словах заявляют про самый сильный движок, на деле же противник максимально ограничен, и находится в заведомо неравном положении. И то при этом иногда кусается.
     
  2. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Я считаю, что необходимо разделить писрщиков и разработчиков. Каждый из них выполняет свою работу хорошо. Но пиарщики по тем или иным причинам нам могут не нравится.

    Я вот до сих пор не понял, против какой версии играл AZ в каждом матче. Если статья научная, то это очень важно конкретно указывать.
     
  3. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Они этого не заявляют. Как верно замечено, подачей информации в ДипМайнд занимаются профессионально подготовленные люди, и таких ляпов они не допускают. То, что в опубликованные результаты вчитывают фанаты и/или хейтеры - это "их ожидания, их проблемы", как говорил один футболист.
     
  4. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Если я правильно понял (см. таблицы в самом конце полной статьи и примечания), матч с дебютной книгой играл Сток 8, а Сток Dev от 13 января играл без книги . В остальных случаях всегда играл Сток 8.
     
  5. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Нашел конкретное описание матчей: https://deepmind.com/documents/260/alphazero_preprint.pdf

    [​IMG]

    Только один матч был против SF Dev.

    Также, похоже, что все выложенное - это против Stockfish 8. Ну вряд ли они будут специально менать имя движка с Stockfish 130118 на Stockfish 8))
    —- добавлено: 7 дек 2018 —-
    Main, как я понимаю, основной матч из 1000 игр был против SF 8.
    Соответственно, матч с усеченным контролем - тоже (что видно).
    Матч в TCEC Openings, где не было показано выдающегося результата, был также против SF 8.
    110 выложенных здесь игр из начальной позиции, скорее всего, против SF 8, как мне кажется.
     
    Последнее редактирование: 7 дек 2018
  6. By_Chess
    Оффлайн

    By_Chess Учаcтник

    Репутация:
    26
    Результат +155 -6 =839.
    Я бы не назвал это разгромом. Скорее небольшое преимущество АльфаЗеро.
    Особенно учитывая то, что Стокфиш не обучаящаяся программа и ее можно 155 раз обыграть одним способом. :)
     
  7. Yury_Solomatin
    Оффлайн

    Yury_Solomatin Учаcтник

    Репутация:
    24
  8. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    Есть ещё журнальчик
     
    FlashNeo и Michael-13 нравится это.
  9. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Michael-13 нравится это.
  10. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Игрался матч из 1000 партий с контролем по 3 часа + 15 секунд добавления каждому. Этот матч длился почти год. Взяли при этом последнюю версию Стокфиша на начало матча. Какие претензии к разработчикам Альфа Зеро?

    Стокфиш 10 Альфа Зеро также обыграет. С чуть меньшим преимуществом. Да Стокфиш 10 сильнее Стокфиш 8 чуть ли не на 100 пунктов. Но опыт Лилы наглядно показывает, что пункты рейтинга набранные в играх с алгоритмическими движками против нейронного движка стоят недорого. Например, в последнем финале сссс Стокфиш против Лилы набрал 55% очков (40 пунктов разницы), против Комодо 58.5% (+60 пунктов ), против Гудини 64% (+100 пунктов). А Лила в свою очередь уступила и Комодо (47% и -20 пунктов) и Гудини (48% и -15 пунктов). И при этом Лила имеет лишь минимальное преимущество в очных встречах над Этзереалем и Файром. Хотя они на 200 пунктов слабее Стокфиша.

    Это подтверждают матчи со Стокфишем 8, в которых Альфа Зеро давала фору по времени. Имея в 10 раз меньше времени Альфа Зеро выиграла матч с меньшим преимуществом. И только когда имела в 30 раз меньше времени матч проиграла. Как известно для алгоритмических движков двухкратное увеличение производительности дает почти 50 пунктов рейтинга. То есть увеличение производительности в 10 раз должно давать до 150 пунктов разницы. А в реальности без форы Альфа Зеро набрала 57% очков (+50 пунктов разницы), а давая десятикратную фору по времени 53% очков (+20 пунктов).
     
  11. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Ну, или он длился несколько часов на кластере из 1000 машин, что более вероятно.
     
  12. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    К тому же, если судить по картинке выше, не все игры были с контролем 3h+15"
     
  13. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Undying, преемущество перед SF 8 с дебютнами книгами TCEC было, тем не менее, минимальным. В общем, Leela уже сейчас может быть не хуже, чем AZ.
     
  14. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Согласен, что игралось не на одной машине. Но вряд ли на кластере. Тогда бы не было возможности указать точные характеристики железа. А учитывая, что было сыграно порядка 10 тысяч партий с 3 часовым контролем, длилось все это явно долго. Судя по тому, что опубликовали результаты сейчас, почти год это всё заняло.
    —- добавлено: 7 дек 2018 —-
    В статье на chess.com, которую выложили выше, речь не о жеребьевке дебютов TCEC, а о сильной дебютной книге, которой пользовался Стокфиш.
     
    Последнее редактирование: 7 дек 2018
  15. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    142
    Ага, так и представляю себе схожую ситуацию. Какой-нибудь наш местный Остап Бендер заявляет, что выиграл у себя дома матч у Стокфиша. И даже пару партий приведёт. А когда его призовут к ответу, "повтори это на публике!" или "что же ты застрял на ФИДЕшной отметке 2000?", то ответ будет "хейтеры, добейтесь чего-нибудь сами", "ваши ожидания - ваши проблемы". И ещё парочка "побед" над вяленым, снова в домашних условиях.
     
  16. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Тут есть принципиальная разница, и вот какая. В данном случае Остап Бендер говорит - вот, я тут на десяток страничек набросал свой план тренировок и методику занятий, пользуйтесь. Добейтесь, именно что, сами. И произвольный Вася Пупкин, начав по этой методике заниматься, в течение года с нуля поднимается до топ-3 в мире. Что как бы подтверждает, что Остап в этом деле свою собаку таки съел. Но самому турецкоподданому сеансы давать некогда, его новые стулья ждут...
     
    Последнее редактирование: 8 дек 2018
    Launder, sovaz1997, svoitsl и ещё 1-му нравится это.
  17. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    ИМХО лучшая партия матча
    22 хода, из них 8 табличных

     
    sovaz1997 нравится это.
  18. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    Нейроны простудились
     
  19. Launder
    Оффлайн

    Launder Новичок

    Репутация:
    1
    думаю, что это-таки - сферический конь в вакууме :) думаю, что для алгоритмических движков, как Вы их называете, "глубина проникновения в позицию" очень не линейная функция, и в какой-то момент увеличение времени, почти ничего не даёт... Полагаю, что у нейронки подобное насыщение происходит заметно позже и график может иметь несколько иную форму...
     
  20. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.265
    Отомстил за те французские, которые смухлевали в прошлом матче

    З.Ы. кстати, Стокфиш 10 на том шулерском контроле 9/10 идёт в сицилианку
     
    Последнее редактирование: 8 дек 2018
  21. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.265
    Ничего не надо думать и полагать, партий таких тестов уже миллионы за эти годы
     
  22. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    На реддите публика в едином порыве восторгается "великой победе" бога шахмат.
    На чесскоме народ продвинутей, и минимум на 3/4 скептично настроена к результату А0
    На толкчессе вообще мягко намекнули, что это такой себе прорыв.

    Ну а в целом без нейтрального наблюдателя (CCCC, TCEC etc) все эти результаты А0 против непонятных стокфишей с непонятными конфигурациями ничего не стоят.
     
  23. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Для тех кому кажется, что 57% очков Альфа Зеро против Стокфиша 8 это немного. Для сравнения Лила примерно также играет против Эзереаля и Файра. В последнем полуфинале сссс против них было +9-2=31 (59%).
     
  24. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    Помнится, в матчах навылет в одном из последних кубков (TCEC Cup вроде) Лейла доигралась до 3,5-3,5 против Файра (и при этом одну партию выиграла за счет краша противника). Да и против Этериала у нее были проблемы, хотя в целом Файр она обыгрывает уверенней.
    А вообще Этериал по виду последних турниров - почти злой гений Лейлы, де-факто и слабее Файра, а обыгрывает Лейлу регулярно и по делу.
     
  25. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Undying, с дебютной книгой или без? С дебютной книгой TCEC лишь 54% против SF 8 получилось
     
  26. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Из опыта Лилы известно, что в плохих позициях без контригры нейронка защищается хуже, чем алгоритмические движки. Сама Лила в такие позиции не идет, но если ее туда загнать дебютной книгой, то обычно она загибается очень быстро. Естественно и у Альфа Зеро все тоже самое. Показателен в этом плане турнир, в котором движки играли позицию из последней партии матча Карлсен - Каруана. В нем Лила проиграла практически все партии белыми.

    Преимущество нейронки проявляется в сложных стратегических позициях. А проблема, что сейчас нейронка этого не понимает и такие позиции получаются случайно. Надо дообучить нейронку на играх с алгоритмическими движками и тогда нейронный движок начнет выигрывать матчи с куда более впечатляющим преимуществом.
     
    Launder нравится это.
  27. wentille
    Оффлайн

    wentille Ветеран

    Репутация:
    125
  28. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.265
    вот это новость!
     
    pavelgttfj8 нравится это.
  29. wentille
    Оффлайн

    wentille Ветеран

    Репутация:
    125
  30. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.265
  31. wentille
    Оффлайн

    wentille Ветеран

    Репутация:
    125
  32. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    629
    Да, впечатляющий разгром.
    Альфазеро был разгромлен в стиле Альфазеро.
     
    sovaz1997 нравится это.
  33. Launder
    Оффлайн

    Launder Новичок

    Репутация:
    1
    Скептицизм неуместен. Что Вы ожидали, реально Бога шахмат? :) Нейросети реально огромный скачок вперёд, прежде всего, с точки зрения, понимания машиной нюансов позиции. С такими помощниками, возможно шахматы станут более интересным, вновь станут популярен "человеческий стиль" со сложными задумками и длительной реализацией...
     
    wentille и svoitsl нравится это.
  34. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    Нейросети - это круто, но применительно к шахматам у них есть ощутимый минус: в позициях, где важен именно конкретный счет, где все решает буквально полтемпа, они ощутимо хуже переборных движков.
    Пока таких закономерностей выявлено две:
    1) в худших, острых позициях - как этот жуткий разгром А0 в 22 хода в атаке Алехина-Шатара. Нейросеть банально перебирает меньше вариантов, и лучшее понимание ей не может помочь. Там, где стокфиш найдет единственные ходы, нейросеть допустит микронеточность там, тут и еще тут - ну и это выльется в поражение.
    2) эндшпили, близкие к переборным. Это очень хорошо видно по играм Лейлы - она банально не успевает адекватно использовать таблицы Syzygy, потому что перебирает всего лишь десятки тысяч позиций. Классические движки перебирают миллионы, и часто обращаются к таблицам. И получается так, что позиция может быть математически выиграна, но нейросеть банально не успевает просчитать варианты с переходом в младшие выигранные эндшпили. Это стоило Лейле уже многих и многих половинок, счет таких в турнирах (а их уже немало наиграно) идет на десятки.
     
    Alhimik88 и Launder нравится это.
  35. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Последний Stockfish против последних сетей Lc0 (сеть не самая лучшая): https://tcecbonus.club/