AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    411
    Симпатии:
    54
    Репутация:
    3
    Оффлайн
    В Январе уже были явные намеки на скорый выход SF 9 и я не знаю, почему они не хотели использовать Dev-версию. Скорее всего, результат бы просто не вышел за пределы погрешности за разумное время))
  2. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    95
    Симпатии:
    107
    Репутация:
    11
    Онлайн
    Они использовали dev версию по состоянию на 13 января.
    Вдобавок к stockfish 8. Там отдельная (очень похожая на sf8) статистика упоминается.
  3. FlashNeo В предбаннике

    • Новичок
    Рег.:
    23.11.2018
    Сообщения:
    65
    Симпатии:
    34
    Репутация:
    0
    Нарушения:
    10
    Оффлайн
    Статистика очень похожая, "уверенно выиграл" но мы ее вам не покажем!
    Какой результат?
    Сколько партий?
    Какие цифры?
    Какие еще матчи сыграны?
    Неужели сложно написать 3 цифры?

    Может там что-то вроде +13 -12 = 175, это технически тоже победа!

    Цифр нет, зато красивые столбики. А на деле - пшик, который схавали на реддите, но крайне скептично восприняли на чесскоме.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.694
    Симпатии:
    1.942
    Репутация:
    82
    Адрес:
    Москва
    Онлайн
    Да неважно, какие там цифры. Ценность работы ДипМайнд не в этом, они не в написании движков для TCEC соревнуются.
    Если бы не прошлогодний "пшик", например - где была бы нынешняя хайповая Лила, содравшая алгоритмы AZ чуть менее, чем полностью? Да не было бы её, от слова вообще.
    Undying, FlashNeo и sovaz1997 нравится это.
  5. FlashNeo В предбаннике

    • Новичок
    Рег.:
    23.11.2018
    Сообщения:
    65
    Симпатии:
    34
    Репутация:
    0
    Нарушения:
    10
    Оффлайн
    Как заметили на параллельном форуме, в Дип Майнд работают очень умные люди. Как технические специалисты, так и люди, отвечающие за подачу информации.
    И я тоже считаю, что если каких-то данных НЕТ, то их там нет по вполне конкретным причинам. Чтобы люди масштабировали "crushing" результаты против старой версии на противостояние с новой.
    На 100% уверен, что они тестили против нового стока, и там была совсем не благостная для них картина.

    Что Дип Майнд делают хорошее дело - безусловно. Они просто на словах заявляют про самый сильный движок, на деле же противник максимально ограничен, и находится в заведомо неравном положении. И то при этом иногда кусается.
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    411
    Симпатии:
    54
    Репутация:
    3
    Оффлайн
    Я считаю, что необходимо разделить писрщиков и разработчиков. Каждый из них выполняет свою работу хорошо. Но пиарщики по тем или иным причинам нам могут не нравится.

    Я вот до сих пор не понял, против какой версии играл AZ в каждом матче. Если статья научная, то это очень важно конкретно указывать.
  7. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.694
    Симпатии:
    1.942
    Репутация:
    82
    Адрес:
    Москва
    Онлайн
    Они этого не заявляют. Как верно замечено, подачей информации в ДипМайнд занимаются профессионально подготовленные люди, и таких ляпов они не допускают. То, что в опубликованные результаты вчитывают фанаты и/или хейтеры - это "их ожидания, их проблемы", как говорил один футболист.
  8. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    499
    Симпатии:
    181
    Репутация:
    21
    Онлайн
    Если я правильно понял (см. таблицы в самом конце полной статьи и примечания), матч с дебютной книгой играл Сток 8, а Сток Dev от 13 января играл без книги . В остальных случаях всегда играл Сток 8.
  9. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    411
    Симпатии:
    54
    Репутация:
    3
    Оффлайн
    Нашел конкретное описание матчей: https://deepmind.com/documents/260/alphazero_preprint.pdf

    [​IMG]

    Только один матч был против SF Dev.

    Также, похоже, что все выложенное - это против Stockfish 8. Ну вряд ли они будут специально менать имя движка с Stockfish 130118 на Stockfish 8))
    --- добавлено: 7 дек 2018 в 12:12 ---
    Main, как я понимаю, основной матч из 1000 игр был против SF 8.
    Соответственно, матч с усеченным контролем - тоже (что видно).
    Матч в TCEC Openings, где не было показано выдающегося результата, был также против SF 8.
    110 выложенных здесь игр из начальной позиции, скорее всего, против SF 8, как мне кажется.
  10. By_Chess Новичок

    • Новичок
    Рег.:
    05.09.2017
    Сообщения:
    98
    Симпатии:
    5
    Репутация:
    0
    Оффлайн
    Результат +155 -6 =839.
    Я бы не назвал это разгромом. Скорее небольшое преимущество АльфаЗеро.
    Особенно учитывая то, что Стокфиш не обучаящаяся программа и ее можно 155 раз обыграть одним способом. :)
  11. Yury_Solomatin Учаcтник

    • Участник
    Рег.:
    25.01.2017
    Сообщения:
    540
    Симпатии:
    316
    Репутация:
    13
    Оффлайн
    Последние данные очков репутации:
    Michael-13: 1 7 дек 2018 в 17:11
    Rom, Launder, Undying и 2 другим нравится это.
  12. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    124
    Симпатии:
    18
    Репутация:
    1
    Оффлайн
    Есть ещё журнальчик
    Последние данные очков репутации:
    Yury_Solomatin: 1 (Имелось в виду, подробности по-русски.) 8 дек 2018 в 00:31
    FlashNeo и Michael-13 нравится это.
  13. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    411
    Симпатии:
    54
    Репутация:
    3
    Оффлайн
  14. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    706
    Симпатии:
    311
    Репутация:
    8
    Онлайн
    Игрался матч из 1000 партий с контролем по 3 часа + 15 секунд добавления каждому. Этот матч длился почти год. Взяли при этом последнюю версию Стокфиша на начало матча. Какие претензии к разработчикам Альфа Зеро?

    Стокфиш 10 Альфа Зеро также обыграет. С чуть меньшим преимуществом. Да Стокфиш 10 сильнее Стокфиш 8 чуть ли не на 100 пунктов. Но опыт Лилы наглядно показывает, что пункты рейтинга набранные в играх с алгоритмическими движками против нейронного движка стоят недорого. Например, в последнем финале сссс Стокфиш против Лилы набрал 55% очков (40 пунктов разницы), против Комодо 58.5% (+60 пунктов ), против Гудини 64% (+100 пунктов). А Лила в свою очередь уступила и Комодо (47% и -20 пунктов) и Гудини (48% и -15 пунктов). И при этом Лила имеет лишь минимальное преимущество в очных встречах над Этзереалем и Файром. Хотя они на 200 пунктов слабее Стокфиша.

    Это подтверждают матчи со Стокфишем 8, в которых Альфа Зеро давала фору по времени. Имея в 10 раз меньше времени Альфа Зеро выиграла матч с меньшим преимуществом. И только когда имела в 30 раз меньше времени матч проиграла. Как известно для алгоритмических движков двухкратное увеличение производительности дает почти 50 пунктов рейтинга. То есть увеличение производительности в 10 раз должно давать до 150 пунктов разницы. А в реальности без форы Альфа Зеро набрала 57% очков (+50 пунктов разницы), а давая десятикратную фору по времени 53% очков (+20 пунктов).
  15. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.694
    Симпатии:
    1.942
    Репутация:
    82
    Адрес:
    Москва
    Онлайн
    Ну, или он длился несколько часов на кластере из 1000 машин, что более вероятно.
  16. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    124
    Симпатии:
    18
    Репутация:
    1
    Оффлайн
    К тому же, если судить по картинке выше, не все игры были с контролем 3h+15"
  17. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    411
    Симпатии:
    54
    Репутация:
    3
    Оффлайн
    Undying, преемущество перед SF 8 с дебютнами книгами TCEC было, тем не менее, минимальным. В общем, Leela уже сейчас может быть не хуже, чем AZ.
  18. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    706
    Симпатии:
    311
    Репутация:
    8
    Онлайн
    Согласен, что игралось не на одной машине. Но вряд ли на кластере. Тогда бы не было возможности указать точные характеристики железа. А учитывая, что было сыграно порядка 10 тысяч партий с 3 часовым контролем, длилось все это явно долго. Судя по тому, что опубликовали результаты сейчас, почти год это всё заняло.
    --- добавлено: 7 дек 2018 в 19:08 ---
    В статье на chess.com, которую выложили выше, речь не о жеребьевке дебютов TCEC, а о сильной дебютной книге, которой пользовался Стокфиш.
  19. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.085
    Симпатии:
    1.425
    Репутация:
    86
    Адрес:
    Заир
    Онлайн
    Ага, так и представляю себе схожую ситуацию. Какой-нибудь наш местный Остап Бендер заявляет, что выиграл у себя дома матч у Стокфиша. И даже пару партий приведёт. А когда его призовут к ответу, "повтори это на публике!" или "что же ты застрял на ФИДЕшной отметке 2000?", то ответ будет "хейтеры, добейтесь чего-нибудь сами", "ваши ожидания - ваши проблемы". И ещё парочка "побед" над вяленым, снова в домашних условиях.
  20. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.694
    Симпатии:
    1.942
    Репутация:
    82
    Адрес:
    Москва
    Онлайн
    Тут есть принципиальная разница, и вот какая. В данном случае Остап Бендер говорит - вот, я тут на десяток страничек набросал свой план тренировок и методику занятий, пользуйтесь. Добейтесь, именно что, сами. И произвольный Вася Пупкин, начав по этой методике заниматься, в течение года с нуля поднимается до топ-3 в мире. Что как бы подтверждает, что Остап в этом деле свою собаку таки съел. Но самому турецкоподданому сеансы давать некогда, его новые стулья ждут...
    Launder, sovaz1997, svoitsl и ещё 1-му нравится это.
  21. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    610
    Симпатии:
    172
    Репутация:
    3
    Оффлайн
    А чего тут представлять? На этом форуме такие товарищи имеются.
  22. FlashNeo В предбаннике

    • Новичок
    Рег.:
    23.11.2018
    Сообщения:
    65
    Симпатии:
    34
    Репутация:
    0
    Нарушения:
    10
    Оффлайн
    ИМХО лучшая партия матча
    22 хода, из них 8 табличных

    sovaz1997 нравится это.
  23. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    610
    Симпатии:
    172
    Репутация:
    3
    Оффлайн
    Ну это не считается, у АЗ просто болела голова))
  24. FlashNeo В предбаннике

    • Новичок
    Рег.:
    23.11.2018
    Сообщения:
    65
    Симпатии:
    34
    Репутация:
    0
    Нарушения:
    10
    Оффлайн
    Нейроны простудились
  25. Launder Новичок

    • Новичок
    Рег.:
    25.11.2016
    Сообщения:
    83
    Симпатии:
    21
    Репутация:
    1
    Оффлайн
    думаю, что это-таки - сферический конь в вакууме :) думаю, что для алгоритмических движков, как Вы их называете, "глубина проникновения в позицию" очень не линейная функция, и в какой-то момент увеличение времени, почти ничего не даёт... Полагаю, что у нейронки подобное насыщение происходит заметно позже и график может иметь несколько иную форму...
  26. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    12.101
    Симпатии:
    11.967
    Репутация:
    773
    Нарушения:
    15
    Оффлайн
    Отомстил за те французские, которые смухлевали в прошлом матче

    З.Ы. кстати, Стокфиш 10 на том шулерском контроле 9/10 идёт в сицилианку
  27. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    12.101
    Симпатии:
    11.967
    Репутация:
    773
    Нарушения:
    15
    Оффлайн
    Ничего не надо думать и полагать, партий таких тестов уже миллионы за эти годы
  28. FlashNeo В предбаннике

    • Новичок
    Рег.:
    23.11.2018
    Сообщения:
    65
    Симпатии:
    34
    Репутация:
    0
    Нарушения:
    10
    Оффлайн
    На реддите публика в едином порыве восторгается "великой победе" бога шахмат.
    На чесскоме народ продвинутей, и минимум на 3/4 скептично настроена к результату А0
    На толкчессе вообще мягко намекнули, что это такой себе прорыв.

    Ну а в целом без нейтрального наблюдателя (CCCC, TCEC etc) все эти результаты А0 против непонятных стокфишей с непонятными конфигурациями ничего не стоят.
  29. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    610
    Симпатии:
    172
    Репутация:
    3
    Оффлайн
    Забыл ещё непонятное железо.
    Лично для меня лучший движок это тот, который лучший у меня на домашнем компьютере. И это Стокфиш.
    svoitsl нравится это.
  30. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    706
    Симпатии:
    311
    Репутация:
    8
    Онлайн
    Для тех кому кажется, что 57% очков Альфа Зеро против Стокфиша 8 это немного. Для сравнения Лила примерно также играет против Эзереаля и Файра. В последнем полуфинале сссс против них было +9-2=31 (59%).
  31. FlashNeo В предбаннике

    • Новичок
    Рег.:
    23.11.2018
    Сообщения:
    65
    Симпатии:
    34
    Репутация:
    0
    Нарушения:
    10
    Оффлайн
    Помнится, в матчах навылет в одном из последних кубков (TCEC Cup вроде) Лейла доигралась до 3,5-3,5 против Файра (и при этом одну партию выиграла за счет краша противника). Да и против Этериала у нее были проблемы, хотя в целом Файр она обыгрывает уверенней.
    А вообще Этериал по виду последних турниров - почти злой гений Лейлы, де-факто и слабее Файра, а обыгрывает Лейлу регулярно и по делу.
  32. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    411
    Симпатии:
    54
    Репутация:
    3
    Оффлайн
    Undying, с дебютной книгой или без? С дебютной книгой TCEC лишь 54% против SF 8 получилось
  33. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    610
    Симпатии:
    172
    Репутация:
    3
    Оффлайн
    Не думаю, что дебютная книга как-то участвует в этих гонках.
  34. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    706
    Симпатии:
    311
    Репутация:
    8
    Онлайн
    Из опыта Лилы известно, что в плохих позициях без контригры нейронка защищается хуже, чем алгоритмические движки. Сама Лила в такие позиции не идет, но если ее туда загнать дебютной книгой, то обычно она загибается очень быстро. Естественно и у Альфа Зеро все тоже самое. Показателен в этом плане турнир, в котором движки играли позицию из последней партии матча Карлсен - Каруана. В нем Лила проиграла практически все партии белыми.

    Преимущество нейронки проявляется в сложных стратегических позициях. А проблема, что сейчас нейронка этого не понимает и такие позиции получаются случайно. Надо дообучить нейронку на играх с алгоритмическими движками и тогда нейронный движок начнет выигрывать матчи с куда более впечатляющим преимуществом.
    Launder нравится это.
  35. wentille Учаcтник

    • Участник
    Рег.:
    31.08.2017
    Сообщения:
    274
    Симпатии:
    360
    Репутация:
    28
    Оффлайн

Поделиться этой страницей